Článek
Článek si také můžete poslechnout v audioverzi.
„Dnes uvádíme náš nejnovější vlajkový model umělé inteligence, GPT-4o (čtyři-ó, nikoli čtyřicet, pozn. red.),“ uvedla bez větších okolků Mira Murati, technická ředitelka firmy OpenAI hned na začátku půlhodinové tiskové konference. Navzdory krátké stopáži publikum nebylo zklamané.
„Nejdůležitější na GPT-4 verze o je, že bude k dispozici všem lidem zdarma, a přinese jim tak možnost pracovat s opravdu chytrým modelem úrovně GPT-4,“ uvedla Mirati.
Narážela tím na to, že dosud mohli lidé v bezplatné verzi populárního nástroje ChatGPT používat pouze více než rok starý (byť aktualizovaný) model GPT-3.5. Řada uživatelů si tak o schopnostech chatbotu udělala zkreslenou představu a má tendenci schopnosti umělé inteligence podceňovat. Rozdíl mezi GPT-3.5 a GPT-4 je přitom významný, zejména u úloh souvisejících s uvažováním, programováním, analýzou a kreativitou.
Nyní ale více než sto milionů uživatelů získá přístup k novince, která je nejenom založená na GPT-4, ale je údajně ještě lepší než současná GPT-4 turbo.
„Velmi důležitou součástí našeho poslání je zpřístupnit naše pokročilé nástroje umělé inteligence všem zdarma,“ podtrhla Murati. „Myslíme si, že je nesmírně důležité, aby lidé věděli, co tato technologie dokáže,“ dodala.
Uživatelé bezplatné verze ChatGPT budou mít nově přístup i do obchodu s tzv. „vlastními chatboty“, což byla funkce dosud přístupná jen platícím zákazníkům. To dává celé platformě nové možnosti: „Profesoři budou moci se svými žáky sdílet na míru vytvořené chatboty, aniž by žáci za používání museli platit,“ vysvětlila konkrétní výhodu Murati. Jen tento samotný krok může přinést nový vítr do tvorby a využívání jednoúčelových nebo jednorázových chatbotů, které byly zatím trochu stranou hlavního dění.
Uvažování bez přepínání
Zpátky k revolučnímu modelu „GPT-4o“. Písmeno „o“ odkazuje na slovo „omnimodel“. Zatímco předchozí modely měly problém s analýzou například mezi hlasem, textem a obrazem, nový model to prý má zvládnuté. Tam, kde předchozí modely musely na pozadí převádět hlas na text a teprve pak se pustit do „přemýšlení“, nový model umí uvažovat bez přepínání a převádění.
„Pokládáme za klíčové, aby lidé získali intuitivní porozumění tomu, jaká technologická změna se chystá,“ uvedla Murati. Platící zákazníci ale stále budou mít výhody, které se bezplatné verze netýkají, například pětkrát vyšší limity na počet zpráv denně, možnost tvorby vlastních GPT apod.
Co chystá konkurence?
OpenAI naplánovala svou tiskovou konferenci – jistě ne náhodou – přesně tak, aby o den předběhla dlouho oznámenou vývojářskou konferenci Google I/O. Na loňské tiskovce šéf Googlu poprvé zmínil model Gemini, který pak veřejnosti odhalil v prosinci 2023. V únoru 2024 na něj navázal verzí 1.5 s ohromným kontextovým oknem.
Co čekáme od AI v roce 2024?
Předpokládá se, že společnost Google letos ukáže a prohloubí zapojení umělé inteligence do svých populárních produktů: Gmail, Android, Fotky i samotné vyhledávání Google. Vzhledem k nedávným personálním změnám v týmu Google Assistant panují očekávání ohledně výrazného vylepšení tohoto pomocníka, který v době velkých jazykových modelů působí již dost zastarale.
Také společnost Apple na své konferenci WWDC (plánované na 10. června 2024) zřejmě představí nové možnosti, jak zapojit umělou inteligenci přímo v rámci jejich operačního systému pro iPhony, iPady, Apple Watch a počítače Mac. Kromě toho, že Apple vyvíjí vlastní jazykové modely, údajně také vyjednává spolupráci s OpenAI.
Kdo sleduje dění v oblasti generativní umělé inteligence, možná už si schopnosti nového GPT-4o vyzkoušel ještě před jeho uvedením. Firma OpenAI jej totiž testovala v rámci „chatbot arény“, kde si mohou uživatelé vyzkoušet, který model je lepší pro různé účely.
Není to až takové překvapení. Sám spoluzakladatel a šéf OpenAI to již před týdnem ne až tak nenápadně naznačoval.
Konverzační hrátky plné emocí (a přerušení)
Celá předváděcí akce OpenAI byla sotva půlhodinová. Publikum ale zjevně zklamané nebylo. Dočkalo se totiž nejen novinek, ale i jejich živého předvádění, což nebývá u těchto akcí vždy samozřejmostí. Obvykle se u nových nástrojů založených na umělé inteligenci není snadné vyhnout nějakým vrtochům, a tak je šéfové raději prezentují z předem připraveného videa.
Tady se ale na pódiu tři zaměstnanci OpenAI odhodlali ukázat postupně hned několik velkých i malých novinek, které omnimodel GPT-4o nabídne. První předváděčka byla spíše úsměvná a provázela ji řada drobných chybek, které jsou ostatně pro hlasový režim ChatGPT i dnes typické.
Ukázka konverzace s novým ChatGPT:
Bylo zjevné, že hlasová konverzace s ChatGPT je zase o velký skok lepší: můžete mu skákat do řeči a rychle si všimnete i většího emočního rozsahu v hlase. Pozor, to samozřejmě neznamená, že by chatbot „měl emoce“, jen je umí u lidí rozpoznat a sám také dobře napodobit.
Také řešení velmi triviální rovnice bylo spíše legrační než poučné. Ukazovalo nicméně scénář, kdy se malé dítě může učit nové věci s trpělivým učitelem.
Další prezentace už byly o dost pokročilejší. Programování, pokročilé uvažování, vyprávění pohádky včetně změn hlasů.
Podívejte se na ukázku programování s ChatGPT pomocí desktopové aplikace:
To všechno byly věci, které v konverzačním módu zatím žádný AI nástroj současnosti takto spolehlivě – a na počkání – nezvládl. A GPT-4o sice občas zaškobrtlo, ale celkově udělalo fantastický dojem.
Ne všechny funkce budou hned k dispozici všem v jejich ChatGPT. „Je těžké uvést tyto nové technologie rychle a pro velké publikum, ale zároveň bezpečně a zodpovědně,“ zdůraznila Murati. „Pracujeme s řadou organizací na tom, abychom postupně zprovoznili všechny tyto novinky široké veřejnosti.“
Generativní umělá inteligence na vzestupu
Od listopadu 2022, kdy firma OpenAI představila nástroj ChatGPT, lidé po celém světě experimentují s tím, jak jim generativní umělá inteligence může pomoci.
O tom, co nové nástroje umí, nebo neumí, se diskutuje z mnoha pohledů. Jedná se o skutečnou inteligenci a kreativitu? Výsledky jsou totiž nejen ohromující, ale také bizarní.
Aktualizace: Do článku jsme doplnili videoukázky z prezentace.