Hlavní obsah

Zavádění AI do praxe pokulhává. Pomohou otevřené modely?

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Řada lidí sleduje pokroky umělé inteligence z pozice diváka a sami AI nástroje nevyužívají.

Proč uvádí giganti svoje jazykové modely zdarma, ještě navíc jako open-source? Nepřipravují se tak náhodou o zisk? Podíváme se, že to není až tak naivně altruistické, jak se může na první pohled zdát.

Článek

Předpokládám, že když odebíráte náš newsletter, baví vás dívat se novým technologiím a trendům takříkajíc pod kapotu. Dnes ale zkusím nahlédnout směrem přesně opačným. Na to, kam nás ten motor může dostat.

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Když začal vynález spalovacího motoru pohánět první auta, byla to spíš záležitost pro potem a benzinem nasáklé nadšence. Časem se z prvních aut, řízených dalšími odvážlivci, stala i atrakce, na kterou se veřejnost chodila koukat. Diváci sledovali stále rychlejší auta, jak lámou rychlostní rekordy a dostávají pod kapotu stále více koňských sil.

Třeba ve slavném americkém závodě Vanderbilt v roce 1906 se spolu utkaly automobily o výkonu 120 a 130 koňských sil, které jezdily po asi 48kilometrovém okruhu přibližně pět hodin.

Foto: Public Domain/Encyclopedia Britannica

Fotografie z automobilového závodu z roku 1906.

Průměrná rychlost tehdy činila asi 80 km/h, což je i z dnešního pohledu rozhodně úctyhodné. Ale o reálném nasazení aut to až tolik nevypovídalo. Kdybyste se podívali na celé Spojené státy, zjistili byste, že svůj automobil tehdy vlastnilo méně než 0,1 % populace.

Závody jinými slovy neměly moc společného s tím, jak se proměnil život lidí. Naprostá většina diváků zřejmě neměla svůj vlastní automobil. A ti, kteří jej měli, s ním beztak nemohli jezdit, kam se jim zachtělo: Chyběla k tomu infrastruktura.

Jak víme, teprve nástup slavného modelu T od firmy Ford udělal z automobilů masovější záležitost. Měl motor o síle dvaceti koní, tedy „slaboučký“ v porovnání s auty, která se utkala ve výše zmíněném vyčerpávajícím desetihodinovém závodě.

Foto: Public Domain/Wikimedia

Automobil Ford T z roku 1910. Na černobílé fotografii není zřejmé, jakou měl barvu. Od roku 1914 ale Henry Ford prosadil své slavné pravidlo: „Každý zákazník si může vybrat barvu auta, jakou chce, pokud to tedy bude černá.“

Ale společenský dopad byl řádově větší. Na to navázala infrastruktura, začaly vznikat motely, meziměstské a mezistátní silnice.

„Postavím motorové vozidlo pro masy. Bude dostatečně velké pro rodinu, ale dostatečně malé, aby ho mohl řídit a obstarat jednotlivec. Bude zkonstruováno z nejlepších materiálů, nejlepšími lidmi, které lze sehnat, podle nejjednodušších konstrukcí, které moderní technika dokáže vymyslet,“ napsal tehdy Henry Ford. „Cena však bude tak nízká, že si jej bude moci dovolit každý člověk s dobrým platem. Kdokoli si bude moci užívat se svou rodinou cestování po širém světě, který nám Bůh dal.“

Dopouštím se zde záměrného zjednodušení. Nástup automobilového průmyslu – a to, jak postupně ve 20. století proměnil Ameriku i celý svět – je samozřejmě mnohem spletitější a má více hrdinů a klíčových momentů. Já chci vypíchnout tento, protože se mi hodí do následující historické paralely.

Otevřené modely jsou sázka na budoucnost

Myslím totiž, že jsme nyní v podobné situaci. Řada lidí sleduje pokroky umělé inteligence z pozice diváka. Vidí, čeho jsou tyto „stroje“ teoreticky schopné, a fascinují je závody velkých firem o prvenství. Ale sami ty nástroje nevyužívají. Stejně jako diváci automobilových závodů 1906 obvykle nejezdili autem do práce.

Teprve až přijde „fordizace umělé inteligence“, až někdo dokáže zkombinovat přístupnost, snadné ovládání a zjevnou užitečnost, posuneme se do další fáze. Do fáze masového nasazení, které od základu promění naši společnost ve všech ohledech.

Nevím samozřejmě, jak konkrétně to bude vypadat a komu se to podaří. Je ale jasné, že velká trojka na poli umělé inteligence (OpenAI + Microsoft, Anthropic + Amazon a Google) už nejsou jediní relevantní hráči. V posledních dnech totiž hlavní zprávy v oblasti AI patřily otevřeným modelům. Tedy takovým, které jsou uvolněny pod licencí open-source, a kdokoli je tak může využít.

Meta ukázala svého chatbota

Nový kecálek Meta.ai zatím funguje jen v anglicky mluvících zemích. Firma Meta jej integruje i do svých služeb: Facebook, Instagram a WhatsApp. To by z něj časem mohlo udělat nástroj přístupný více než polovině světové populace.

Napřed společnost Meta ukázala svého kecálka Meta AI, postaveného na opensourcovém jazykovém modelu Llama 3. Podle jejich měření by měl excelovat: „Zjednodušeně řečeno, věříme, že Meta AI je nyní nejchytřejší asistent, který je vám k dispozici zdarma,“ domnívá se neskromně Zuckerberg. Zatím jej uvolnili jen v anglicky mluvících zemích, ale samotný jazykový model Llama 3 tím nijak omezen není.

Jen o pár dní později přispěchal Microsoft se svým otevřeným jazykovým modelem Phi-3. Ten je pozoruhodný především svou malou velikostí. Dokonce má přezdívku SLM, tedy small language models, aby se odlišil od LLM, velkých jazykových modelů. Nejmenší variantu Phi-3 mini prý půjde provozovat i na mobilních zařízeních, a přitom se údajně v mnoha ohledech vyrovná těm velkým.

Foto: Microsoft

Srovnání nových Phi-3 modelů s open-source konkurencí. (Zdroj: Microsoft)

Na rozdíl od pokročilých modelů OpenAI nebo Google, u kterých je každé použití zpoplatněné, jsou opensourcové modely k dispozici zdarma komukoli, kdo je dokáže rozběhnout. Firmy tedy mohou experimentovat s nasazením na vlastních strojích, mohou si svá data ponechat a zkoušet, co z nich pomocí jazykových modelů „vykřešou“.

Podle mého se může časem jednat o podobně důležitý vývoj, jako byl svého času Ford T. Levné jazykové modely budou tlačit na obecné zlevnění celého odvětví. A zároveň otevřou cestu k užitečnému zapojení těchto nových nástrojů i v těch firmách, které z různých důvodů nechtěly svá data posílat mimo svou zabezpečenou síť.

Jak lze na open-source modelech vydělat?

A proč vůbec Meta nebo Microsoft uvolňují k obecnému použití něco, co by jinak mohly zpeněžit? Tím spíše, že víme, jak drahé ono trénování špičkových jazykových modelů může být. „Náklady na výcvik nejmodernějších modelů umělé inteligence dosáhly bezprecedentní úrovně,“ píšou autoři Stanford AI Report. „Například trénování modelu GPT-4 společnosti OpenAI stálo odhadem 78 milionů dolarů, zatímco model Gemini Ultra společnosti Google stál 191 milionů dolarů (výpočetního výkonu).“

Přesto lze ukázat, že to může být strategická a zisková investice. A to jak pro firmu Meta, tak pro Microsoft. I když pro každou z trochu jiných důvodů.

Mark Zuckerberg vysvětlil výhody uvolnění modelu Llama 3 následovně: „Máme dlouhou tradici uvolňování našich produktů do open-source domény,“ vysvětlil zakladatel Facebooku a šéf Meta. „Asi největší v naší historii byl projekt Open Compute.“ Facebook v roce 2011 zveřejnil, jak fungují jeho datová centra, a kterákoli firma mohla jejich architekturu použít.

Může to vypadat jako bláznivě altruistický tah, ale Zuckerberg vyjmenovává výhody, které to pro jeho firmu mělo: „Opravdu nám to pomohlo. Protože teď se z naší architektury stal průmyslový standard. Takže i celý dodavatelský řetězec se přizpůsobil našim potřebám. Protože všichni si objednávají (stejný hardware jako my), tak klesly ceny pro všechny, což nám ušetřilo miliardy dolarů.“

Podobné výhody Zuckerberg očekává i u jazykových modelů. Pokud bude moci komunita vývojářů z celého světa stavět na jejich modelu, tak zřejmě dojde k jeho optimalizaci. „I kdyby to bylo jen 10% zrychlení, tak nám to ušetří třeba desítky miliard dolarů,“ spekuluje Zuckerberg.

Letos v únoru také Zuckerberg investorům řekl i o dalších výhodách open-source: „Zaprvé, software s otevřeným zdrojovým kódem je obvykle bezpečnější. (…) Zlepšení efektivity a snížení výpočetních nákladů je také přínosem pro všechny, včetně nás. Za druhé, software s otevřeným zdrojovým kódem se často stává průmyslovým standardem. (…) Za třetí, open-source je mezi vývojáři a výzkumníky nesmírně populární. A my víme, že lidé chtějí pracovat na otevřených systémech, které budou široce přijaty. To nám tedy pomáhá získávat do společnosti Meta ty nejlepší lidi, což je pro vedoucí postavení v jakékoli nové technologické oblasti velmi důležité.“

Čtvrtý důvod neřekl, ale my si jej můžeme domyslet: Uvolnění kvalitních modelů do open-source snižuje cenu konkurenčních modelů. Pokud je Llama-3 v řadě ohledů tak dobrá, že vývojář nemusí sahat po placeném GPT-3.5, znamená to, že konkurence nebude moci tolik vydělávat na tom, na čem doposud vydělávala. Tlačí to cenu směrem dolů, což opět vyhovuje velkým odběratelům.

Jak ChatGPT a AI mění pracovní trh?

Už od nástupu ChatGPT na trh se samozřejmě lidé po celém světě zajímají o to, jaký vliv to bude mít na pracovní trh. První odhady z počátku 2022 mluvily o tom, že se tyto nástroje dotknou přibližně dvou třetin lidí. Nejvíce se nová vlna automatizace dotýká profesí, které pracují s informacemi, kreativitou nebo odbornými znalostmi v nějakém odvětví.

„Dříve se tradovalo, že automatizace dopadne na manuální pracovníky, pak na kanceláře a jednou možná zvládne i kreativní práci. Teď to vypadá, že to půjde v opačném pořadí,“ všímá si Sam Altman, zakladatel a šéf OpenAI.

Microsoft je v poněkud jiné pozici. Jakožto hlavní investor OpenAI má pochopitelně zájem na úspěchu jejich modelů. Microsoft Copilot staví právě na jádru GPT-4 a GPT-4 Turbo. Zároveň je ale firma Microsoft jedním z největších provozovatelů a prodejců cloudové infrastruktury. A proto se jim vyplatí vyvíjet a uvolňovat nové jazykové modely.

Čím více firem totiž začne využívat umělou inteligenci, tím větší bude poptávka po cloudových službách, které umožní firmám tyto nástroje bezpečně a pohodlně provozovat. Zatímco OpenAI vydělává jen tehdy, kdy lidé platí za využití jejich modelů, Microsoft vydělá i na těch bezplatně dostupných.

Foto: Pavel Kasík, Seznam Zprávy

Open-source jazykové modely můžete provozovat na svém počítači lokálně. Je to obvykle celkem pomalé, ale zase se na vás nevtahují žádné limity a neplatíte nic navíc. Na ukázce běží menší verze modelu Llama 3 v programu LM Studio (dostupný pro Windows, Mac i Linux).

Kdybych si měl tipnout, kam tyto nové bezplatné modely pomůžou posunout zapojení AI do běžných úkonů, tak zůstanu spíše při zemi. Vím totiž, jak nepředvídatelné a divoké bývá zavádění umělé inteligence do běžných procesů v rámci firem. Nečekal bych proto žádné převratné nebo okamžité změny. Je to spíše podobné „stavbě silnic“, což byla nutná podmínka pro to, aby se počátkem 20. století auta rozšířila do celých USA a do celého světa. Jakmile je na místě silnice, stoupne zájem o auta.

Tahle historická paralela také podtrhuje určité varování: Ve chvíli, kdy všude budou silnice, auta se jakoby přes noc stanou pro většinu lidí jedinou myslitelnou formou dopravy. Co to bude znamenat v případě umělé inteligence? A kam bychom tyto pomyslné silnice raději zavádět neměli? Měli bychom to začít intenzivně řešit už nyní.

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Generativní umělá inteligence na vzestupu

Od listopadu 2022, kdy firma OpenAI představila nástroj ChatGPT, lidé po celém světě experimentují s tím, jak jim generativní umělá inteligence může pomoci.

O tom, co nové nástroje umí, nebo neumí, se diskutuje z mnoha pohledů. Jedná se o skutečnou inteligenci a kreativitu? Výsledky jsou totiž nejen ohromující, ale také bizarní.

Doporučované