Gemini 2.0: Co přináší nová generace AI od Googlu?

Gemini 2.0 ai model

Nová generace modelů Gemini 2.0 byla uvedena na trh v prosinci 2024. Prvním modelem, který se objevil, byl Gemini 2.0 Flash v experimentální verzi. Tento model navazuje na úspěch Gemini 1.5 Flash, který je zatím nejoblíbenějším modelem Google pro vývojáře, a nabízí zvýšený výkon při podobně rychlé době odezvy. Pozoruhodné je, že 2.0 Flash dokonce překonává 1.5 Pro dvojnásobnou rychlostí.

Gemini 2.0 Flash přináší také nové funkce. Kromě podpory multimodálních vstupů, jako jsou obrázky, video a zvuk, nyní podporuje i multimodální výstupy. Mezi tyto výstupy patří nativně generované obrázky smíchané s textem a vícejazyčný zvuk s řiditelným převodem textu na řeč. Model také umí nativně volat nástroje jako Google Search, spouštět kód a využívat uživatelsky definované funkce třetích stran.

Gemini 2.0 Flash a Gemini 2.0 Flash-Lite si můžete vyzkoušet v naší aplikaci OCTODEEP. Pokud si chcete vyzkoušet multimodální výstup, nabízíme vám Gemini 2.0 Flash Experimental.

Klíčové schopnosti Gemini 2.0

  • Multimodální uvažování
  • Porozumění dlouhým souvislostem
  • Použití nativních nástrojů a snížená latence
  • Nové modality: 2.0 Flash zavádí generování obrázků, převod textu na řeč, tvorbu lokalizovaných uměleckých děl a expresivní vyprávění příběhů.
  • Prompt optimalizátory
  • Řízené generování
  • Funkce calling (volání): umožňuje modelu nativně volat funkce jako Google Search a usnadňovat automatizaci úkolů jako jsou Generování kódu nebo interakce s externími službami, a to přímo z prostředí Gemini.

Nová funkce Deep Research

Deep Research je funkce Gemini Advanced, která za vás dokáže během pár minut automaticky projít až stovky webů a vytvořit podrobné několikastránkové přehledy na jakékoli téma. Zrychlí vám to práci a výsledky si můžete nechat sdělit v podobě poutavé, podcastové konverzace. Poskytuje také přehledy průzkumu plné podrobností a statistik, které vygeneruje během pár minut a nabízí je jako zvukový přehled, čímž vám ušetří hodiny.

Rozšířené možnosti využití AI agentů

Praktické využití agentů AI je výzkumná oblast plná vzrušujících možností. Agenti za vás mohou vykonávat jakoukoliv práci, kterou jim zadáte (třídění pošty, vypisování informací ze zadaných textů) a to úplně sami, automaticky., Google zkoumá tuto novou dimenzi pomocí řady prototypů, které mohou lidem pomoci plnit úkoly a dotahovat věci do konce. Patří mezi ně aktualizace projektu Astra, výzkumného prototypu zkoumajícího budoucí možnosti univerzálního asistenta AI; nový Project Mariner, který zkoumá budoucnost interakce mezi člověkem a agentem, počínaje vaším prohlížečem; a Jules, kódový agent s umělou inteligencí, který může pomoci vývojářům.

Multimodální Live API

Vývojáři nyní mohou vytvářet multimodální aplikace v reálném čase, které zpracovávají streamovaný zvuk a video z kamer nebo obrazovek. Podpořeny jsou přirozené konverzační vzorce, jako jsou přerušení a detekce hlasové aktivity. Rozhraní API umožňuje integrovat více nástrojů dohromady pro řešení složitých případů použití pomocí jediného volání API. Integrace s partnery WebRTC SDK umožňuje vývojářům stavět aplikace napříč platformami ve velkém měřítku. 

Příklady použití Gemini 2.0

ModelVstupyVýstupyPřípad použití
Gemini 2.0 FlashText, kód, obrázky, zvuk, video, video se zvukem, PDFText, zvuk (soukromý náhled), obrázky (soukromý náhled)Pro všechny každodenní úkoly. Silný celkový výkon a podpora živého rozhraní API pro streamování v reálném čase. Ideální pro scénáře s nízkou latencí nebo automatizaci úloh.
Gemini 2.5 Pro ExperimentalText, obrázky, video, zvuk, PDFTextNejpokročilejší model uvažování Gemini, zejména pro multimodální porozumění, kódování a znalost světa.
Gemini 2.0 Flash-LiteText, obrázky, video, zvuk, PDFTextVhodné pro nízkonákladové pracovní postupy.
Gemini 2.0 Flash ThinkingText, obrázkyTextZahrnuje proces uvažování v odpovědích. Vhodné pro komplexní úlohy bez potřeby nízké latence.

Srovnání s jinými modely

Zde si můžete prohlédnout Index umělé inteligence a prozkoumat modely z řady Gemini 2.0 v porovnání s jejich konkurencí. Je to jedna z nejjednodušších metrik, jak porovnat chytrost modelů. 

Index umělé inteligence slouží ke srovnání inteligence modelů Gemini 2.0 s ostatními modely.
Zdroj: artificialanalysis.ai

Porovnání Gemini 2.0 s Gemini 1.5

FunkceGemini 1.5 ProGemini 2.0 Flash Experimental
Kontextové okno1 milion tokenů (asi 750 000 slov nebo 1 500 stran textu)1 milion tokenů (asi 750 000 slov nebo 1 500 stran textu)
RychlostOdezvy během několika sekundAsi 2x rychlejší
Spotřeba energieVyššíNižší
Uvažování/logikaSilné uvažování a spolupráceNárokuje vylepšené uvažování a přidává agentní schopnosti
MultimodálníObraz a zvuk převedené na text pro zpracování.Nativní zpracování obrazu a zvuku. Nyní můžete „mluvit“ pomocí hlasů AI.
Tvorba obrazuByla pozastavenaPodporována
KódováníMůže generovat kódDokáže generovat a spouštět kód, analyzovat odpovědi API a integrovat data do externích aplikací

To nejzajímavější z řady Gemini 2.0

Gemini 2.0 přináší revoluci v oblasti AI, ať už jste vývojář nebo běžný uživatel. S novými schopnostmi, jako je multimodální výstup, nativně generované obrázky, Deep Research a možnost volání (funkce calling) externích nástrojů, se otevírají netušené možnosti pro automatizaci úkolů, analýzu dat a generování obsahu. Gemini 2.0 také přináší multimodální Live API pro vývoj aplikací zpracovávajících streamovaný zvuk a video v reálném čase. Připravte se na budoucnost, kde je AI vaším nepostradatelným partnerem.

Aktualizováno dne: 3. 4. 2025

Zdroje:

  1. Google introduces Gemini 2.0: A new AI model for the agentic era [online]. [cit. 03. 04. 2025]. Dostupné z: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash
  2. Gemini 2.0: The good, the bad and the meh [online]. [cit. 03. 04. 2025]. Dostupné z: https://www.androidpolice.com/gemini-2-new-good-and-bad/
  3. Gemini Advanced – získejte s Gemini 2.0 přístup k nejvýkonnějším modelům umělé inteligence od Googlu [online]. [cit. 03. 04. 2025]. Dostupné z: https://gemini.google/advanced/?hl=cs
  4. Google models; Generative AI; Google Cloud [online]. [cit. 03. 04. 2025]. Dostupné z: https://cloud.google.com/vertex-ai/generative-ai/docs/learn/models#gemini-2.5-pro-exp-03-25