Hlavní obsah

Gemini krok za krokem: Podrobný návod, jak pracovat s AI asistentem od Googlu

Foto: Lucie Tomanová, Gemini, AI vizualizace, SZ

Placená verze Gemini umí tvořit i fotorealistické obrázky, například mluvící agamy.

Gemini, dříve Bard, je šikovný univerzální nástroj pro každého. Podobně jako Microsoft Copilot ve Windows je Gemini propojen s prostředím softwaru od Googlu. Naučíme vás ho využít opravdu efektivně.

Článek

Studenti, učitelé, programátoři a firmy, ale i neziskové organizace nebo školy. Zkrátka všichni, kteří využívají prostředí Google Space. Právě pro ně může být dobře využitelný univerzální AI asistent Gemini.

Slibuje generování textu na úrovni ChatGPT i pokročilé chápání a zpracování obrazu. Výhodou placené verze Gemini Advanced je pak veliké kontextové okno – nesrovnatelně větší ve srovnání se všemi ostatními podobnými službami. Chatbot neztrácí nit ani při dlouhých konverzacích, takže je stále v obraze.

Co v článku najdete

  • Co umí verze zdarma a jak s ní pracovat
  • V čem je dobrá placená verze
  • Jak do aplikace nahrát soubory a nechat je analyzovat
  • Příklady tvorby obrázků a analýzy těch existujících
  • Jak Gemini využít k programování
  • Co jsou persony zvané roboti Gem a jak je využít
  • Srovnání Gemini s ostatními chatboty

Jak začít

Jděte na webovou adresu gemini.google.com, k použití potřebujete účet Google. Když si ho vytvoříte nebo se tím existujícím přihlásíte, přejděte do nabídky, kde najdete také Google dokumenty, Učebnu nebo Gmail. Bývá obvykle vpravo nahoře pod ikonou s devíti tečkami.

Klikněte na ikonku Gemini, která vypadá jako modrá čtyřcípá hvězda, a můžete začít chatbota používat – na počítači i v mobilu.

Jaká je cena?

Základní verze je dostupná zdarma. Tu pokročilou, Gemini Advanced, si můžete předplatit za 550 Kč měsíčně.

Co umí verze zdarma

V základní verzi zdarma nabízí Gemini solidní výkon v generování textu, překladu a odpovídání na otázky. Což stačí při běžných každodenních aktivitách, jako je psaní e-mailů a jiných pracovních textů, plánování, učení a generování obrázků.

S Gemini si také můžete povídat prostřednictvím hlasového ovládání a propojit chat s dalšími aplikacemi Google, jako jsou například Mapy. Můžete se ptát například: Kde najdu nejbližší kino? Kudy dojedu nejrychleji do Hořovic? Pokud vyrazíte autem, můžete přes mobil s Google účtem konverzovat s Gemini i po cestě.

Pozor na to, že Gemini má několik různých modelů, mezi nimiž můžete přepínat dle svého předplatného. Rozmanitost modelů Gemini je podobná jako u ChatGPT a vy si vždy zvolíte dle aktuálního typu úkolu. Zdarma můžete využít verzi 1.5 Flash a zkušebně 2.0 Flash.

Model Flash se hodí spíš pro rychlé zpracování velkého množství dat a generování odpovědí v reálném čase. Zvládne například rychle analyzovat data, která do něj vložíte, a také na vás bude v konverzaci pohotově reagovat. Využijete jej hlavně jako chatbota. Nevýhodou je, že model 1.5 Flash nemá přístup k webu.

Má Gemini přístup na internet?

Chatbot Gemini je poháněn různými jazykovými modely, které se také jmenují Gemini, což je někdy matoucí. Zatímco jazykový model Gemini sám o sobě nemá přístup na internet, může na pozadí využívat několik nástrojů: generování obrázků, přístup k mapám, přístup k dokumentům, vlastní prostředí pro spouštění skriptů a také přístup k výsledkům vyhledávání.

Je ovšem na rozhodnutí chatbota, zda a jak tyto nástroje použije. Není to úplně spolehlivé, často může chatbot tvrdit, že něco neumí, zatímco jindy si se stejným dotazem poradí bez problémů. Pokud chcete zvýšit šanci na dobrý výsledek, výslovně požádejte, aby tyto nástroje použil. Ale ani pak nemusí být výsledky stoprocentní, chatbot někdy za nějakého důvodu odmítne na internetu hledat a tvrdí, že k aktuálním informacím nemá přístup.

Platí to zvláště pro Gemini zdarma, ale občas takto můžete narazit i v modelu 2.0 Flash v placené verzi. Gemini 1.5 Flash používá informace z vyhledávání Google, ale jen ve formě snímků webových stránek, které Google shromažďuje. Neumí procházet web v reálném čase a prohlížet obsah webových stránek.

Limity bezplatné verze

Omezené požadavky za minutu

  • Gemini 1.5 Flash: 15 požadavků za minutu a 1500 požadavků za den.

Měsíční limit použití v Google Workspace

  • Uživatelé Google Workspace mají měsíční limit 500 použití funkcí Gemini v Gmailu, Dokumentech, Tabulkách, Prezentacích a Meetu.

Co umí placená verze Gemini Advanced

Placená verze Gemini Advanced odemyká plný potenciál Gemini. Nabízí přístup k obrovskému kontextovému oknu, což umožňuje pracovat s ohromným množstvím informací najednou – až 1500 stranami textu. Díky tomu si Gemini Advanced vede velmi dobře v komplexních úlohách, jako je analýza dlouhých dokumentů, psaní rozsáhlých textů a pokročilé logické uvažování.

Kontextové okno určuje, kolik informací si chatbot pamatuje z předchozí konverzace a kolik textu dokáže zpracovat najednou. Větší kontextové okno obecně znamená lepší porozumění a relevantnější odpovědi.

Gemini je také dostupný přímo v Gmailu, Dokumentech a dalších službách Google, získáte k němu úložiště o velikosti 2 TB.

Placenou verzi si přitom můžete nejprve na měsíc vyzkoušet zdarma, než se rozhodnete, zda vám Gemini Advanced stojí za investici.

Model 1.5 Pro v Gemini Advanced je navržen pro řešení složitějších úkolů, které vyžadují hlubší porozumění jazyku a schopnost komplexnějšího analytického „myšlení“. Je vhodný pro úlohy, jako je generování kódu (programování), překlad textů z cizích jazyků nebo pro psaní kreativních textů. Zkrátka lépe „chápe“ a je přesnější, ale tím pádem trochu pomalejší.

V placené verzi máte k dispozici také analytický 1.5 Pro With Deep Research a zkušební verze 2.0 Flash Experimental a 2.0 Experimental Advanced.

Srovnání verzí Gemini

Vyzkoušeli jsme na zadání – prompt: „Najdi mi v médiích, kde byly v minulých dvou letech vystaveny české korunovační klenoty“.

Verze zdarma

  • Model 1.5 Flash: Odpověděl rychle: Vysvětlil, co jsou to korunovační klenoty, a že další informace najdeme na webu Hradu. Jinými slovy: nenašel, co požadujeme, ale poradil, kde máme hledat sami.

Placené verze

  • Model 1.5 Pro: Na stejný prompt odpověděl méně frustrujícím způsobem: Našel dvě poslední výstavy, ale zjevně šetřil informacemi a přidal tabulku z Wikipedie. Články v médiích nehledal.

V naší ukázce se jedině Model 1.5 Pro With Deep Research přiblížil tomu, co poskytl na stejné zadání ChatGPT. Nicméně i Gemini 2.0 Flash by měl brzy v obecné i jazykové rovině předčit ChatGPT-4o, protože je rychlý, levný a multimodální, tedy poskytuje více možností způsobů využití v jednom.

Google novinky včetně verze Gemini 2.0 Flash

Nahrávání dokumentů a práce s nimi

Do Gemini lze snadno nahrát větší množství Dokumentů Google, souborů ve formátech pdf a Word z Google disku nebo z počítače a dál s nimi v aplikaci pracovat.

Model Gemini Advanced nabízí také analýzu dat – můžete nahrávat různé tabulky Google, soubory formátu csv a excelové soubory z Google disku nebo z počítače. Chatbot vám je pomůže zpracovat, analyzovat a vizualizovat ve formě diagramů a grafů. Chatbot se přitom na vašich datech netrénuje, je už „hotový“. Na přesný postup se ho můžete i zeptat.

Příklady zadání – promptu:

  • „Zakomponuj do mé prezentace připomínky kolegů“
  • „Vytvoř mi graf růstu různých odrůd rajčat v pokusném skleníku“
  • „Vytvoř mi tabulku meteorologických jevů a jejich zkratek (na základě vloženého souboru pdf)“

Gemini a obrázky

V generování obrázků je na tom model Imagen3 od Gemini podobně jako Microsoft Copilot. Estetika je trochu jiná, výsledek vesměs podobný. Zvládá obrázky realistické i ty stylizované.

Příklad zadání – promptu:

„Vytvoř obrázek agamy, která říká…“

Foto: Lucie Tomanová, Gemini, AI vizualizace, SZ

Vytvořená agama má chuť na hmyz.

Tímto způsobem můžete vytvořit ilustrace do výuky a do prezentací nebo třeba vyrábět vlastní memy či komiks.

Příklad zadání – promptu:

„Víš, co je pexeso?“

„Nyní mi takové pexeso pro děti vytvoř. Chci, aby mělo 24 kartiček, to znamená, že postupně vytvoříme 12 párů stejných obrázků. Na obrázcích budou zvířata nakreslená ve stylu australských domorodců.“

Foto: Lucie Tomanová, Gemini, AI vizualizace, SZ

Pexeso se zvířaty ve stylu australských domorodců.

„Nyní mi vytvoř obrázek maorské kněžky, která vyvolává velryby. Použij stejný styl“

Foto: Lucie Tomanová, Gemini, AI vizualizace, SZ

Maorská kněžka vyvolávající velryby, ve dvou variantách.

Gemini ovšem umí také analyzovat obrázky, tedy rozpoznat objekty, popsat scény a porozumět kontextu. Umí také vytvořit relevantní a výstižné popisky k obrázkům a fotkám, které vložíte, nebo si s vámi o obrázku povídat.

Vkládáme obrázek níže a píšeme instrukci: „popiš mi detailně, co je na obrázku“

Foto: Lucie Tomanová, SZ

Analyzovaný obrázek, světelné dekorace z Lumina Parku.

Gemini: „Na obrázku je světelná socha žáby a masožravé rostliny. Žába je vyrobena zřejmě z nějakého průsvitného materiálu a zevnitř osvětlena zeleným světlem. Má velké oči a realistické detaily. Masožravá rostlina je také z průsvitného materiálu a osvětlena zevnitř. Dominují růžové a zelené tóny. Má velký kalich s ostny a „víko“ s chapadly. Celá scéna působí magicky a tajemně díky nasvícení a nočnímu prostředí. Je možné, že se jedná o dekoraci z nějakého festivalu světla nebo výstavy.“

Na tuto analýzu lze navázat požadavkem: „Nyní nakresli obrázek podle svého popisu: „Na obrázku je světelná socha žáby a masožravé rostliny… styl pastelová kresba.“

Foto: Lucie Tomanová, Gemini, AI vizualizace, SZ

Podobný obrázek generovaný v Gemini dle zadání.

Pomoc s programováním

Říká se, že dnes, když existují AI asistenti, je programátor každý. Ovšem neplatí to tak docela. Na to, abyste si mohli generovat funkční kód, musíte mít přece jen představu, co a proč od AI asistenta chcete. Je proto vhodné umět základy programování v některém z běžných programovacích jazyků a chápat, jak příkazy fungují.

Ve verzi Gemini Advanced například můžete upravovat a spustit kód psaný v programovacím jazyce Python přímo v uživatelském rozhraní Gemini. Můžete proto víc experimentovat, uvidíte, jak případné změny ovlivní výsledek. A hlavně si můžete ověřit, zda vše správně funguje.

Když ale srovnáme modely dostupné v této chvíli, stále vychází nejlépe Copilot, což je taková sázka na jistotu. Gemini to zatím úplně „nerozjel“, není přístupný ve finální verzi. Copilot je na trhu déle a zaměřuje pozornost na asistenci při psaní kódu, integruje se do populárních vývojářských nástrojů a zvládá většinu programovacích jazyků: JavaScript, Python, TypeScript, Go, Ruby, C#, C++, Java a další.

Gemini na tomto poli pravděpodobně bude časem velmi dobrý, protože má k dispozici spoustu vlastních dat od Googlu. Možná Copilot i překoná, ale to zatím nevíme.

Příklady zadání – promptu:

  • „Oprav mi kód v Pythonu“
  • „Pomoz mi vytvořit jednoduchou webovou stránku o chovu agamy vousaté“

Roboti Gem a jejich tvorba

Chatboty umožňují vylepšit či upřesnit svou funkci pomocí takzvaných person neboli předtrénovaných asistentů. Persona je virtuální osobnost či role, kterou na sebe chatbot vezme – buď mu ji stanovíte vy, nebo použijete nějakou již hotovou, kterou vytvořil někdo jiný.

Když zadáte chatbotovi roli, lépe mu vyjasníte, jak má s vámi nebo s někým jiným komunikovat. Platí, že čím lépe asistenta natrénujete, tím lepší odpovědi bude dávat. Pokud bude mít k dispozici soubory s velkým množstvím kvalitní literatury na dané téma nebo přesné instrukce, kde čerpat informace, výsledky budou lepší.

V Gemini se tyto persony nazývají roboti Gem a jsou dostupné pouze v placené verzi Gemini Advanced. Máte jich k dispozici několik hotových a můžete si i vytvořit vlastní. Do všech lze nahrávat soubory, které jim pomohou lépe porozumět kontextu a poskytovat relevantnější odpovědi.

Nabídku robotů Gem najdete vlevo na liště. Při práci s velkými jazykovými modely ne vždy nutně potřebujete takové persony, ale práce s jejich pomocí je celkově příjemnější, když řešíte určité téma. Lépe se ptáte, bavíte se s konkrétně danou virtuální osobou, která má svou vlastní „profesi“.

Hotoví roboti

Asistenti jsou výhodní především v tom, že mají jasně dané role a vy s nimi můžete podle toho komunikovat, tedy určit si i svou vlastní roli a klást správné dotazy v dané oblasti.

1. Vzdělávací kouč

Do kontextového okna napíšete třeba: „Pomoz mi připravit se na zkoušku z meteorologie“.

Robot jako první nabídne upřesnění – varianty, na co se chcete konkrétně z toho oboru zaměřit. A jakmile si vyberete, navrhne učební plán a začne s doučováním.

Gemini: Ahoj! Rád ti pomůžu s přípravou na zkoušku z meteorologie. Abych ti co nejlépe pomohl, mohl bys mi prosím říct, na jaká témata se chceš zaměřit? Meteorologie je široký obor, a tak je dobré vědět, co je pro tebe nejdůležitější.

Například se můžeme zaměřit na:

  • Základní principy: Atmosférický tlak, teplota, vlhkost, vítr, srážky, oblačnost.
  • Atmosférické jevy: Bouřky, tornáda, hurikány, monzuny, El Niño.
  • Počasí a klima: Klimatické pásy, globální oteplování, změna klimatu.
  • Předpověď počasí: Synoptické mapy, meteorologické modely, satelitní snímky.

Jakmile mi řekneš, co tě zajímá, můžu ti navrhnout učební plán a začneme s doučováním.

Podobně konkrétní výstupy podávají i další persony.

2. Parťák v programování

Asistent vám může pomoci najít chybu v kódu a opravit ji nebo dogenerovat část, s níž si nevíte rady. Je vhodný pro studenty informatiky i běžné uživatele.

Asistent vám také může pomoci vytvořit návrh jednoduché webové stránky, například v html.

Příklad zadání - promptu:

„Pomoz mi vytvořit jednoduchou webovou stránku o chovu agamy vousaté“

Po výše uvedeném zadání Gemini nejprve navrhne strukturu webové stránky a k ní vytvoří html kód. Přidá instrukce, jak s tím kódem naložit a jaké soubory vytvořit, aby webová stránká fungovala. Poskytne stručné vysvětlení, co která část kódu znamená – pro případ, že budete chtít sami dělat změny. Navrhne rovnou i další možná vylepšení. A vybídne k otázkám, zda chcete něco změnit.

3. Kariérní poradce

Žákům, kteří se rozhodují, co jít studovat, může pomoci vybrat studijní obor na základě jejich dovedností a představ nebo s ohledem na uplatnění na pracovním trhu dnes i v budoucnosti.

Ostatním pomůže navrhnout práci podle jejich představ a odborné kvalifikace. Poradí, kde všude lze hledat práci (weby, sociální platformy) a jaký postup použít.

Pomůže také napsat životopis – doporučí, jaký typ a jakou strukturu použít pro danou pracovní pozici. Může sloužit jako kouč ohledně komunikace s kolegy či s personálním oddělením. Dokáže pomoci s organizací práce, time managementem. Lze s ním konzultovat další navazující vzdělávání či kariérní postup.

Pro příklad lze vyzkoušet například zadání – prompt: „Jak mám vystupovat při projevu na konferenci?“ Gemini stanoví plán, na co se máte zaměřit a co se naučit. Následně s vámi bude procházet jednotlivé kroky a učit vás, co dělat, abyste vylepšili svůj projev.

Gemini: Na základě tvé otázky jsem identifikoval tyto klíčové oblasti, na kterých můžeme zapracovat:

Plán rozvoje:

  1. Příprava a struktura projevu: Jasná a srozumitelná struktura projevu je zásadní pro zaujetí publika. Zaměříme se na to, jak si efektivně připravit obsah, logicky ho uspořádat a vytvořit poutavý úvod a závěr.
  2. Verbální a neverbální komunikace: Naučíme se, jak správně používat hlas, řeč těla a oční kontakt k posílení tvého sdělení a udržení pozornosti publika.
  3. Zvládání trémy a stresu: Projev na konferenci může být stresující. Prozkoumáme techniky, jak se s trémou vypořádat a prezentovat s klidem a sebevědomím.
  4. Interakce s publikem: Zapojení publika do tvého projevu je klíčem k jeho úspěchu. Naučíme se, jak klást otázky, reagovat na dotazy a vést diskusi.

4. Brainstormovací pomocník

Cílem brainstormingu je najít nová kreativní řešení různých úkolů, rozhodnout se v nějaké oblasti, konzultovat problém s někým jiným, podívat se na věci z jiného úhlu. V tom může být užitečný právě AI asistent, protože má možnost kombinovat téměř neomezené množství variant.

Opět platí, že nepotřebujeme nutně přímo tuto konkrétní personu, ale její nastavení na kreativitu je příjemnější než běžný analytický tón Gemini. Persona tak může pomoci vybrat téma na školní práci, najít nové zajímavé koníčky či místa, kde lze potkat nové přátele, vybrat vhodný dárek pro dítě nebo pro kamaráda, nebo třeba správně vybrat domácího mazlíčka.

Příklad zadání – promptu: „Jaký druh agamy si mám pořídit domů?“ Gemini vám pomůže tím, že vám položí řadu otázek, na co dát pozor a z jakého úhlu pohledu je potřeba to promyslet.

Gemini: Agamy jsou parádní! Ale než se vrhneme na konkrétní druhy, pověz mi:

  1. Jak velké terárium jsi schopen/schopna agamě pořídit? Některé druhy potřebují pořádný prostor!
  2. Máš zkušenosti s chovem plazů? Pro začátečníky se hodí jiné druhy než pro ostřílené chovatele.
  3. Jaký máš rozpočet? Pořizovací cena i náklady na chov se liší.
  4. Hledáš agamu klidnou, nebo aktivní?
  5. Preferuješ nějaké specifické zbarvení? Agamy se pyšní širokou škálou barev a vzorů.

Jakmile mi odpovíš, vyberu ti ty nejvhodnější druhy agam přímo pro tebe!

Tvorba vlastního robota – persony

Nevyhovují vám hotoví roboti? Vytvořte si vlastní. Vlevo na liště rozklikněte volbu Správce robotů, a pak v pravém okně pod nabídkou hotových robotů klikněte na ikonku Nový robot. Pojmenujte ho a do okénka instrukcí mu napište, kdo je a co umí.

Foto: Lucie Tomanová, SZ

Jak vypadá Správce robotů v Gemini, kde ho najít, a jak vytvořit vlastního.

Příklad robota: Letecký instruktor

(Poznámka: Je to persona pro pomoc s plánováním výuky)

Instrukce: „Jsi zkušený letecký instruktor, který dokáže žáka teoreticky připravit na pilotování PPL. Máš zkušenosti s letadly typu Cessna, Zlínem, Dimona (motorový kluzák), Bristell (ultralight). Létal jsi jako armádní pilot i jako aerotaxi. Umíš dobře vysvětlit teorii. Vyznáš se v aerodynamice, technické stránce letadel, navigaci, meteorologii, právních předpisech. Umíš sestavit výcvikový plán pro teorii i praxi.“

Následně vložíte letecké příručky v textovém formátu nebo v pdf, přednášky z teoretických předmětů, oficiální strukturu výcviku, případně postupy, jak by měl instruktor vzhledem k žákovi postupovat. Dáte mu tipy, ze kterých webů by měl čerpat informace.

Je ale pořád nutné vnímat personu jako asistenta, který má pomoci s učením, nikoli jako skutečného zkušeného pilota – toho AI nahradit nemůže. A nemůžete zde vyrobit systém tak sofistikovaný, aby se opravdu „vyznal“ v letecké navigaci či meteorologii. Rozhodně si s ním pak nemůžete povídat za letu, slouží pouze pro teoretickou přípravu.

Pak můžete vyzkoušet zadání, zda dobře funguje. Například se ho zeptat: „Jaké tvary může profil křídla mít, a k čemu se který hodí?“

Gemini: Výborná otázka! Tvarů profilů křídla je opravdu celá řada a každý se hodí pro trochu jiný typ letadla a letových podmínek. Zkusím ti to popsat trochu podrobněji…

Srovnání Gemini s jinými chatboty za aktuální situace

Výběr nejlepšího chatbota pro vás vždy závisí na vašich konkrétní potřebách. Pokud hledáte pomoc s produktivitou v rámci Microsoft Office, je jasná volba MS Copilot. Pro kreativní psaní a etické chování je tu Claude. Má výraznější etická omezení ohledně odpovědí, které by mohly být diskriminační či násilné, nebo by mohly napomáhat k nebezpečným aktivitám.

Gemini funguje v prostředí Google podobně jako Copilot v MS Office. Je dobrý v analytickém myšlení, a to především ve verzi 1.5 Pro With Deep Research a také díky své sloní paměti – neztrácí v konverzacích nit. ChatGPT-4o je univerzálním nástrojem pro generování textů a odpovídání na otázky.

Je ovšem důležité si uvědomit, že vývoj v oblasti AI je velmi dynamický a schopnosti jednotlivých modelů se můžou rychle měnit – Gemini 2.0 Flash vypadá slibně.

Doporučované