Článek
Umí psát vysokoškolské práce důkladněji než většina studentů. Zvládne analyzovat rentgenové snímky lépe než průměrný radiolog. Jeho odpovědi jsou hodnoceny jako přesnější a empatičtější než ty od skutečných lékařů. Dokáže číst škrabopis, psát, programovat aplikace, analyzovat různorodá data, kreslit komiksy, navrhovat obchodní strategie a tvořit realistické malby v libovolném stylu. A ještě si o tom s vámi ochotně popovídá ve více než stovce různých jazyků.
Nikoho samozřejmě nepřekvapí, že řeč není o živém člověku. Žádný člověk by nemohl obsáhnout tak různorodé spektrum schopností. A to je nástroj ChatGPT na světě teprve přesně rok.
My lidé se takto bleskově učit neumíme. Asi proto je nám svět umělé inteligence tak cizí. Je to setkání s jakousi entitou, která mluví naším jazykem a tváří se, že rozumí našemu světu. Ale jak můžeme věřit tomu, co z té neuronové sítě padá, když vůbec neumíme pojmenovat, co vlastně umí, a co ne?
Šokující síla obyčejné konverzace
Kdo před rokem znal jméno firmy OpenAI? Hlavně akademici, programátoři a nadšenci. Ti věděli, že firma už několik let vyvíjí nástroj GPT pro dokončování textů. Pár lidí s touto hračkou experimentovalo, ale rozhodně to nebylo nic, o čem by se mluvilo jako o přelomové technologii, která má potenciál změnit lidskou společnost.
A pak přišel ChatGPT. Oznámení přišlo 30. listopadu 2022, a dnes víme, že ani jeho tvůrci nečekali, že by byla tato hračka nějak zvlášť úspěšná. Vždyť šlo vlastně jen o nové rozhraní ke starému generátoru textu. Jenže právě nové rozhraní – spolu s chytrým dotrénováním – se stalo klíčem k rapidnímu a masovému úspěchu.
První zkušenosti s ChatGPT
V prosinci 2022 jsme poprvé psali o ChatGPT. Zdůraznili jsme, že umí odpovídat na velmi rozmanité otázky, a také jsme ukázali, že si vymýšlí (kecá) a nemůžete mu všechno věřit.
Největší překvapení tehdy určitě bylo, že umí česky (přestože to celkem vtipně popíral). Toto je záznam naší první konverzace:
ChatGPT totiž přišel s tím nejjednodušším rozhraním, jaké si lze představit. Je to formát, který zná každý, kdo někdy v posledních dvaceti letech někomu napsal textovou zprávu nebo e-mail. Napíšete text, potvrdíte, objeví se bublina s vaší otázkou. A váš diskuzní partner se zamyslí a napíše odpověď. A to je celé.
Slovíčko po slovíčku
Zkratka GPT znamená generativní předtrénovaný transformátor. Můžeme si to přeložit jako: neuronová síť, která je vycvičená k transformování. Skládá za sebe slova způsobem, který vypadá smysluplně.
Dokončování textu nebylo nové. Všichni uživatelé něco podobného znali třeba z prediktivní klávesnice na mobilním telefonu. Ale vytřískat z dokončovače textu něco užitečného bývalo i pro zkušené uživatele složité a zdlouhavé. Aby tedy konverzace fungovala, musela firma OpenAI svůj „dokončovač textu“ (jazykový model GPT-3.5) vytrénovat k užitečnosti.
Hlavní trik je vlastně v tom, že se ChatGPT začal tvářit užitečně. A protože je to dokončovač textu, tak když začal předstírat užitečnosti, začal tím pádem generovat užitečné texty. Armáda lidských školitelů jej k tomu vychovala tím, že různé generované odpovědi řadili podle toho, jak užitečné jim přišly. A tak se neuronová síť naučila místo „nevím“ říkat „ale samozřejmě“.
Nepochopitelné halucinace, úžasná kreativita
Právě odpovědi typu „Jasně, rád pro vás vytvořím…“ se staly typickými pro kreativní nástroje jako ChatGPT i další chatboty, kteří jej následovali: Google Bard, Bing Chat nebo Anthropic Claude. Jejich odpovědi nejsou nějakým „kopírováním již napsaného“, jako je tomu obvyklé u vyhledávačů. Každý text je originální, vytvořený přímo na míru danému uživateli dle textového (a později i obrazového) zadání.
Jenže tady se dostáváme k problému, který je známý od samého počátku. Přesto je ale pro uživatele pokaždé překvapivý: padají z něj občas podivnosti, šílenosti, haluze. Odborníci tomu říkají halucinace.
Když často píšeme, že je ChatGPT „kecálek“, myslíme to doslova. Nástroj neví, co je pravda, a co ne. Skládá odpověď tak, aby výsledný text vypadal smysluplně a užitečně. Ale zda je pravdivý? To samotný jazykový model posoudit neumí. Zní to věrohodně, tak to tam prskne a jede dál. Na rozdíl od člověka nemá ani zodpovědnost, ani svědomí.
Nevěřte všemu, co AI vytvoří
ChatGPT a podobní chatboti chtějí být užiteční. A někdy to znamená, že si vymyslí odpovědi přesně na míru. Texty působí důvěryhodně, ale to neznamená, že mají jakýkoli vztah s realitou.
Na druhou stranu, právě díky těmto halucinacím je ChatGPT kreativní a užitečný úplně novými způsoby. Vědci zkoumají, čím jsou halucinace jazykových modelů přesně způsobené, a hledají způsoby, jak jim předejít. Řada lidí ale pochopila, že právě bezbřehá kreativita ChatGPT a „drzost“, s jakou se pouští do prakticky jakéhokoli úkolu, není jen jeho slabinou, ale také hlavní výhodou.
Neznamená to, že byste měli bezhlavě kopírovat cokoli, co vám ChatGPT vygeneruje. Musíte najít smysluplnou a zodpovědnou hranici. Třeba u nás v redakci jsme si jasně stanovili, že nebudeme texty článků generovat pomocí AI nástrojů.
Nemohli bychom totiž přesně vědět, jaké informace a z jakých zdrojů se do takových vygenerovaných textů „přimíchaly“. Na druhou stranu, to nám nebrání experimentovat se zapojením ChatGPT do hledání témat, nápadů, vylepšování textů, tvorby ilustrací nebo při hromadné korespondenci.
Ujeli konkurenci o parník
ChatGPT se zřejmě stal nejrychleji rostoucím projektem v lidské historii. Trvalo pouhé dva měsíce, než si získal sto milionů uživatelů. Nutno dodat, že slovo „uživatel“ bylo – aspoň zpočátku – trochu nadnesené. Většina lidí si nejspíše hrála. Zkoušeli jsme nesmyslné otázky a bavili se tím, jak si s nimi ten podivný kecálek poradí.
Seznamovali jsme se s tím zvláštním mimozemšťanem, a netušili, že na orbitě už k vylodění čeká další. Zatímco slavný akademik Noam Chomsky sepisoval svou filipiku o tom, že neuronové sítě nemohou „skutečně porozumět“ smyslu slov, v laboratořích OpenAI dokončovali model GPT-4.
Chomsky spolu s kolegy ve sloupku pro New York Times „rozcupoval“ ChatGPT coby stupidního papouška. Ukázal na několika konkrétních příkladech, proč nelze mluvit o porozumění.
Prezident OpenAI, Greg Brockman, představil verzi GPT-4 jen týden poté. Šlo o ohromný skok dopředu. Nový model si poradil s každým z příkladů, který Chomsky považoval za „umělou inteligencí neřešitelný“. A předvedl i mnohem zajímavější věci: třeba dokázal naprogramovat webovou stránku jen podle rychlého náčrtku se sotva čitelným škrabopisem.
Dodnes je GPT-4 považován za nejlepší dostupný jazykový model. OpenAI jej zpřístupnilo vývojářům z celého světa za poplatek podle rozsahu používání. Běžní uživatelé pak mohou GPT-4 zapřáhnout pomocí placené verze ChatGPT Plus (cca 500 korun měsíčně).
Už v březnu jsme tak dostali důležitou lekci: pokud na základě svých zkušeností tvrdíme, že umělá inteligence si s něčím neví rady, neměli bychom z toho vyvozovat, že to neumí. Někdo jiný zřejmě otázku zadá jinak, použije jinou kombinaci a dosáhne lepšího výsledku. A dost možná už v tu chvíli někde trénují další verzi neuronové sítě, která si s tím, co považujete za „zhola nemožné“, poradí lépe než vy.
Ohromným – i když celkem málo známým – pokrokem bylo zapojení programování přímo do ChatGPT. Když jste dříve nechali chatbota, aby vám zanalyzoval data, hrozilo, že si bude vymýšlet statistiky a čísla. Je to jazykový model, nikoli kalkulačka. Ale nyní umí sáhnout po externích nástrojích – v tomto případě po programovacím jazyce Python – a jeho možnosti a schopnosti tak ohromně narostly.
Nejnovější verze (GPT-4 Turbo) přišla v listopadu 2023, a opět posunula možnosti ChatGPT dál. Uživatelé mohou nahrávat soubory (obrázky, PDF, dokumenty, data) a nástroj si s nimi poradí. Rozumí lidské řeči a dokáže nečekaně pěkně modulovat hlas. Nebýt občasných zaškobrtnutí, v hlasovém režimu snadno zapomenete, že se právě bavíte se strojem.
Navíc umí generovat opravdu povedené obrázky a fotografie pomocí generátoru DALL-E 3, což jej posouvá na novou úroveň.
Co umí nový ChatGPT?
Současný ChatGPT v placené verzi nabízí také možnost trénovat si své vlastní chatboty. Není zatím jasné, zda si na tuto funkci lidé zvyknou a začnou si třeba trénovat své vlastní „virtuální asistenty“ pro různé úkoly. Ale ta možnost tady je.
Hozeni do vody
Osobně mne překvapilo, jak rychle se vyprofilovaly tábory optimistů a skeptiků. Nástroj ChatGPT tu byl sotva několik měsíců a lidé už na něj měli hotový jasný názor: tohle do konce roku připraví půlku lidstva o práci. Nebo naopak: tohle je nesmysl, který k ničemu nemůže být užitečný a bublina do konce roku splaskne.
Dnes víme, že ani jedna z těchto extrémních predikcí se nenaplnila. Není to až tak překvapivé. Máme sklon podle svých vlastních zkušeností předjímat reakce ostatních. Optimisté podcenili setrvačnost lidské společnosti, zatímco pesimisté podcenili lavinový efekt.
Pokud používá nástroje umělé inteligence jeden člověk, může si pomocí nich výrazně urychlit své běžné činnosti. To si ještě obvykle umíme představit. O něco těžší je ale domyslet tuto situací do logického důsledku: pokud takový nástroj nemám jen já, ale všichni, tak „konkurenční výhoda“ mizí. Místo toho nastává akcelerace a postupná proměna celých odvětví.
Jak ChatGPT a AI mění pracovní trh?
Už od nástupu ChatGPT na trh se samozřejmě lidé po celém světě zajímají o to, jaký vliv to bude mít na pracovní trh. První odhady z počátku 2022 mluvily o tom, že se tyto nástroje dotknou přibližně dvou třetin lidí. Nejvíce se nová vlna automatizace dotýká profesí, které pracují s informacemi, kreativitou nebo odbornými znalostmi v nějakém odvětví.
„Dříve se tradovalo, že automatizace dopadne na manuální pracovníky, pak na kanceláře a jednou možná zvládne i kreativní práci. Teď to vypadá, že to půjde v opačném pořadí,“ všímá si Sam Altman, zakladatel a šéf OpenAI.
Máme tendenci přeceňovat okamžité dopady AI. Ve skutečnosti je lidská společnost moc složitá a spletitá na to, aby se razantně změnila v řádech dnů nebo týdnů. Ale dlouhodobé dopady naopak podceňujeme, respektive nedokážeme domyslet.
„Rád říkám, že v krátkodobém časovém horizontu umělá inteligence nezmění nic,“ řekl Michael Schwarz, hlavní ekonom Microsoftu. „V dlouhodobém horizontu ale změní úplně všechno.“
Když stoupá voda v přehradě, nic se na první pohled neděje. Stejně tak se postupně vylepšovaly algoritmy strojového učení a jazykové modely, aniž si toho veřejnost všímala. Ale pak přišel zlom: protrhla se přehrada. ChatGPT ukázal všem, že umělá inteligence může mít dopady na jakoukoli část života, kde jsou podstatná slova.
Snažit se přesně popsat schopnosti nástrojů umělé inteligence, se kterými se za posledních 12 měsíců roztrhl pytel, je prakticky nemožné. Vznikají jich stovky za týden. A ani jejich tvůrci nevědí, k čemu všemu budou vlastně dobré.
To je zásadní rozdíl oproti počítačovým programům a nástrojům, které důvěrně známe. Není žádný seznam funkcí. Místo toho uživatelé „přemlouvají“ chatbota, aby pro ně udělal to nebo ono. A zjišťují, zda to zvládne, nebo ne. Musíte to vyzkoušet. A lidé po celém světě už to rok zkouší, a postupně nacházejí miliony různých použití.
Jako děti objevující novou hračku testujeme limity nových AI nástrojů. Jsou značně neintuitivní, a tak potkáte deset lidí, kteří vyzkoušeli ChatGPT, a každý bude mít úplně jiné dojmy a zážitky.
Už rok zkouším ukazovat přátelům, kolegům, lidem ve firmách, vědcům nebo učitelům, jak mohou ChatGPT zapřáhnout do svého života. Není žádný univerzální návod. Jde o úplně novou situaci, a nikdo neví, jak se bude vyvíjet dále. Když ani tvůrci ChatGPT nevědí, co všechno umí, jak bychom to mohli vědět my? Všichni jsme hozeni do vody jako začátečníci.
Nečekejte na to, až vám dá někdo jasný návod. „Vaši šéfové nemají ponětí, k čemu jsou nástroje AI dobré,“ zdůrazňuje Ethan Mollick, odborník na inovace z University of Pennsylvania. „Není důvod se domnívat, že vedení má nějakou zvláštní magickou intuici ohledně toho, jak by umělá inteligence mohla pomoci konkrétnímu zaměstnanci s konkrétním úkolem.“
Přehrada se protrhla. Je čas naučit se plavat.