Svět AI se mění každým dnem, ale jednou za čas přijde něco, o čem skutečně ví každý. Řeč je o Gemini 2.5, kterou tým GoogleDeepMind představil v březnu letošního roku a vy si ji nově můžete vyzkoušet v naší aplikaci OCTODEEP. V čem je lepší oproti předchozím generacím a proč ho musíte vyzkoušet, pokud se občas v práci cítíte trochu jako chobotnice, to si můžete přečíst v tomto článku.

Gemini 2.5 Pro
- Nejvýkonnější „thinking“ model – je určen pro nejnáročnější úkoly, kde je potřeba hluboké logické uvažování, analýza a porozumění komplexním datům.
- Multimodalita – což znamená, že si s přehledem poradí s textem, obrázky, audiem i kódem. Je to takový digitální švýcarský nůž.
- Dlouhý kontext – dokáže pracovat s extrémně dlouhými vstupy (až 1 milion tokenů), což znamená, že zvládne analyzovat například celé knihy, rozsáhlé databáze, nebo dlouhé konverzace. Zvládá i jemné nuance (chápe, že „být v balíku“ nemusí znamenat problém s poštou).
- Pokročilé kódování – exceluje v generování, úpravách a analýze kódu, včetně agentních scénářů a komplexních workflow.
- Vysoká přesnost a spolehlivost – výsledky benchmarků ukazují špičkový výkon v matematice, programování, vědě i vizuálním porozumění.
- Podpora funkčních volání a strukturovaných výstupů – vhodný pro vývoj AI agentů, kteří potřebují volat externí funkce nebo pracovat s přesně strukturovanými daty.
- Přizpůsobitelné „adaptive thinking“ – můžete si nastavit, kolik „myšlení“ má model na úkol vynaložit (vyšší přesnost vs. rychlost/výkon). Můžete tak vybalancovat výkon/cenu, podobně jako když autu řeknete, ať jede na úsporný režim.
Ideální použití:
Komplexní výzkum, programování, analýza velkých dokumentů, práce s multimodálními daty a tvorba AI agentů, která byla signifikantní už pro předchozí řady Gemini.
Gemini 2.5 Flash
- Optimální poměr cena/výkon – je navržen pro běžné úlohy s vysokým objemem dat, kde je potřeba rychlost a stále solidní úroveň „myšlení“.
- Multimodalita – podporuje text, obrázky, video a audio.
- Dlouhý kontext – zvládá až 1 milion tokenů.
- Nízká latence – odpovídá rychle, je vhodný pro aplikace v reálném čase nebo tam, kde je důležitá svižná odezva.
- Adaptivní „thinking“ režim – model si sám určuje, kolik výpočetního rozpočtu na úkol použije, případně lze rozpočet nastavit ručně.
- Podpora funkčních volání a strukturovaných výstupů – lze využít pro agentní úlohy, sumarizace, chatboty apod.
- Vysoký průchod dat – ideální pro zpracování velkého množství požadavků najednou.
Ideální použití:
Chatboti, sumarizace textů, překlady, zákaznická podpora, rychlé prototypování, automatizace, aplikace s vysokým objemem dotazů a potřebou rychlé odezvy.
Gemini 2.5 Flash-Lite
- Maximální úspora nákladů a extrémně nízká latence – je optimalizován pro případy, kdy potřebujete rychlé odpovědi a velký objem zpracovaných požadavků za co nejnižší cenu.
- Multimodalita – podporuje text, obrázky, video a audio (ve vstupu).
- Dlouhý kontext – zvládá až 1 milion tokenů.
- Nejrychlejší odpovědi v rámci rodiny Gemini 2.5 – ideální pro situace, kdy je rychlost důležitější než nejvyšší přesnost nebo složitost výpočtu.
- Podpora funkčních volání a strukturovaných výstupů – vhodné pro lehké agentní úlohy, monitoring, notifikace apod.
- Vysoký průchod a škálovatelnost – zvládá tisíce požadavků paralelně.
Ideální použití:
Monitoring, real-time aplikace, jednoduché chatboty, masivní automatizace, sumarizace v reálném čase, rychlé testování a prototypování, služby s omezeným rozpočtem.
Srovnání s jinými současnými modely
Gemini je prostě na špici: jak ukazuje i tento diagram “chytrosti” podle sedmi benchmarků:
MMLU-Pro: Testuje široké znalosti a porozumění napříč 57 obory na úrovni vysokoškolského studia (vylepšená verze známého MMLU).
GPQA Diamond: Sada extrémně těžkých vědeckých otázek, na které ani experti nedokážou odpovědět pouhým vyhledáváním.
Humanity’s Last Exam: Simuluje „poslední zkoušku lidstva“ – extrémně náročné otázky napříč obory, které mají prověřit skutečné porozumění a logiku.
LiveCodeBench: Ověřuje, jak dobře model dokáže generovat, opravovat a spouštět skutečný programovací kód v reálných podmínkách.
SciCode: Testuje schopnost řešit vědecké programovací úlohy, zejména z matematiky, fyziky a biologie.
AIME: Zkouší matematické schopnosti na úrovni prestižní americké středoškolské olympiády (American Invitational Mathematics Examination).
MATH-500: Prověřuje řešení 500 obtížných matematických úloh z různých oblastí vyšší matematiky.

Vidíte, že Gemini 2.5 Pro je nejlepší, nedávno vydaný o3-pro od Open AI zatím nemá oficiální statistiky. Gemini 2.5 Flash je o něco horší, ale pořád si vede dobře. Důležitá je také schopnost uvažování, což znamená, že modely nejen, že odpoví, ale dokážou i zdůvodnit, proč se tak rozhodly. Další srovnání a měřítka si můžete najít na oficiálních stránkách Gemini 2.5.
Ideální use cases – Jak paní Jarmila díky Gemini konečně stíhá kafe
Příběh paní Jarmily: Paní Jarmila je grafička, která si občas připadá, že je v práci jako chobotnice – má dělat vizitky, plakáty, vyřizovat e-maily, a ještě pomáhat kolegovi s webem. Naštěstí má nového parťáka, chobotnici OCTODEEP, která obsahuje multifunkční chapadlo Gemini 2.5 Pro!
- Grafika: Jarmila zadá: „Navrhni mi moderní plakát na farmářský trh.“ Gemini během chvilky připraví návrh, doporučí barevnou paletu a ještě přihodí slogan.
- Texty: Potřebuje rychle napsat pozvánku na akci? Gemini vymyslí tři varianty, včetně jedné ve verších – pro případ, že by chtěla být extra kreativní.
- Analýza dat: Klient poslal 150stránkový PDF report o trhu a chce z něj do zítra vytáhnout 5 klíčových příležitostí pro novou kampaň. Díky obřímu kontextovému oknu (1 milion tokenů) Jarmila nahraje celé PDF do chatu a zadá: „Analyzuj tento report. Najdi 5 největších tržních příležitostí pro produkt X a shrň je do odrážek s krátkým vysvětlením, proč jsou důležité.“
- Programování: Klient chce na webu malou interaktivní kalkulačku. Jarmila umí ve Photoshopu, ale JavaScript je pro ni sprosté slovo. Tak tedy napíše: „Vytvoř mi prosím funkční kód v JavaScriptu pro jednoduchou kalkulačku sčítání a odečítání a vysvětli mi jako pětiletému dítěti, jak ho vložit do HTML.“ Gemini vygeneruje čistý kód, přidá komentáře a napíše srozumitelný návod. Jarmila to zvládne za 10 minut místo pěti hodin googlení a pláče nad Stack Overflow.
- Překlady: Klient píše anglicky? Gemini přeloží e-mail, navrhne odpověď a ještě poradí, jak být zdvořilá, ale ne servilní.
Slovy Jarmily:
„Dřív jsem měla v hlavě chaos a na stole tři kafe. Teď mám Gemini a stíhám i oběd!“
Nebojte se i složitých a komplexních promptů – Gemini 2.5 je zvládne
Máte obsáhlé soubory nebo učebnice, které žádný jiný veřejně přístupný model nezvládne? Dejte je přežvýkat Gemini 2.5. Dřívejší modely jako GPT-4 nebo Claude 3 by potřebovaly soubory dostávat na části, jinak by hrozilo, že některé části úplně vypustí, což by vám při prezentaci mohlo udělat pěknou paseku.
Vzhledem k tomu, že Gemini rozumí i nativně audiu i videu, tak nemusí audio nejprve přepisovat na text, ale pracuje přímo se zdrojem. Představte si, že se musíte extrémně rychle připravit na zkoušku a máte k dispozici několik nahraných dvouhodinových přednášek. Nebo potřebujete v práci udělat zápis z nahrané schůze. Starší modely nejen, že by měly problém s extrémně dlouhým videem, ale přepisem na text by mohly ztratit informace o emocích a tónu hlasu. Gemini 2.5 vám šikovně vypíše všechno důležité, co potřebujete vědět. Díky extrémně dlouhému kontextovému oknu můžete modelu klidně povědět, že potřebujete z přednášky vědět jen to, co nemáte ve skriptech od spolužáka (ty můžete taky vložit).
Stejně tak se nemusíte bát modelu svěřit svá data ze studie, dokáže vám zkontrolovat vaši hypotézu a případně navrhnout alternativní vysvětlení vašich výsledků. To je kvůli jeho schopnosti myslet a kriticky uvažovat.
Díky kombinaci multimodality, bezprecedentně dlouhého kontextu a schopnosti hlubokého uvažování se Gemini nestává jen nástrojem pro zodpovídání dotazů, ale skutečným partnerem pro kreativní, analytickou i technickou práci. Pro běžné smrtelníky si Gemini 2.5 můžete vyzkoušet v naší aplikaci OCTODEEP v tarifu Starter již od 97 Kč měsíčně. Pro vývojáře a profíky je dostupný přes Google AI Studio a pro předplatitele Gemini Advanced. Brzy se objeví i na platformě Vertex AI.
Aktualizováno dne: 8. 7. 2025
Zdroje:
- Comparison of AI Models across Intelligence, Performance, Price | Artificial Analysis [online]. [cit. 08. 07. 2025]. Dostupné z: https://artificialanalysis.ai/models
- Gemini Pro – Google DeepMind [online]. [cit. 08. 07. 2025]. Dostupné z: https://deepmind.google/models/gemini/pro/
- Gemini – Google DeepMind [online]. [cit. 08. 07. 2025]. Dostupné z: https://deepmind.google/models/gemini/