Článek
V newsletteru Pod čarou popisuje každou sobotu Matouš Hrdina společenské trendy, které sice vídáme všude kolem sebe, ale v přílivu každodenního zpravodajství trochu zanikají mezi řádky. Pokud vás ukázka zaujme, přihlaste se k odběru plné verze newsletteru.
Na začátku minulého týdne firma OpenAI představila nové funkce svého LLM modelu GPT-4o, který teď umí vytvářet obrázky výrazně lépe než dosavadní varianty. Díky takzvanému multimodálnímu procesu se vyhýbá dosud častým omylům a zkreslením, lépe si poradí s textem v obrazu a dalšími oříšky, a dá se s ním pracovat mnohem intuitivnějším způsobem.
Působilo to jako další z řady oznámení o nových AI nástrojích a modelech, kterým už věnují pozornost převážně jen profesionálové a nadšenci a většinou nemívají velký mediální ohlas. Pak ale bývalý vývojář Amazonu Grant Slatton na síti X v praxi ukázal, k čemu je možné „vylepšené“ ChatGPT použít – nechal svou fotku upravit ve stylu animovaných filmů japonského studia Ghibli.
O dalším vývoji se nejspíš nemusím příliš rozepisovat, protože jej sledoval každý, kdo tráví jen trochu více času na sociálních sítích. Z „Ghibli filtru“ se stala virální móda. Do roztomilého anime stylu začali své fotky převádět nejen běžní uživatelé, ale takřka obratem i značky a politici. Řada lidí ale začala kritizovat fakt, že OpenAI zcela otevřeně vykrádá práci slavného japonského animátora Hajao Mijazakiho a jeho studia. A poslední zbytky legrace vyprchaly ve chvíli, kdy na sociálních sítích začal Bílý dům ghiblifikovat hrozivé fotky deportací z USA.
Po necelých dvou týdnech již jde o zcela mrtvý mem, který si ale stále zasluhuje pozornost. Je totiž skvělým symbolem všech výzev současného AI průmyslu a výstižně ukazuje, že přes všechny sliby o blížící se AI revoluci jde stále o nepochopenou a neumětelsky využívanou technologii založenou na neudržitelném obchodním modelu.
Velká umělecká krádež
Tou méně zajímavou, ale převažující složkou bouřlivé debaty okolo Ghibli filtru (v praxi jde o běžný prompt pro chatbota, žádný „filtr“) byly spory o to, zda a jak bere práci umělcům a poškozuje vnímání a hodnotu umění jako takového.
Poslechněte si audioverzi newsletteru načtenou autorem.
Na čistě materiální rovině jde o smutnou banalitu, která je v posledních letech opakovaně a bohužel bezvýsledně diskutována na celém světě. Trénování velkých jazykových modelů pohánějících nástroje typu ChatGPT je založeno na bezostyšném drancování obsahu takřka celého internetu a ani filmy studia Ghibli zjevně nejsou výjimkou.
Prostřednictvím nových funkcí GPT-4o je možné generovat obrázky v nespočtu dalších „autorských“ stylů (někteří uživatelé převáděli obrázky do stylu jiných známých animátorů nebo výtvarných směrů), ale povyk vyvolalo až vytěžování Mijazakiho tvorby.
Nejspíš za to mohou formální kvality filmů od studia Ghibli, které se vyznačují nejen precizním výtvarným zpracováním, ale i silnými a emotivními příběhy, díky kterým si k nim publikum vytváří blízký vztah a pak zcela oprávněně těžce nese, když jsou vytěžovány AI mašinou.
Řada lidí obratem citovala Mijazakiho hlášku o tom, že AI je „urážka samotného života“ (která ovšem padla už v roce 2016 v poněkud jiném kontextu), a objevila se i pádná upozornění na neuvěřitelnou náročnost jeho animací – filmy studia Ghibli vznikají prostřednictvím desítek tisíc ručně kreslených políček a jejich AI zneužití pro nehybné memy tak ještě více bije do očí.
Samotné studio Ghibli virální mem nejspíš moc nepoškodí – spíše mu udělá reklamu a dost možná bude OpenAI žalovat, ať už za „inspiraci“ jeho tvorbou nebo (a to by před soudem mohl být pádnější argument) nelegální využití jeho filmů coby tréninkových dat. Mnohem hůře jsou na tom zástupy méně známých tvůrců, jejichž díla byla velkými jazykovými modely pohlcena také, ale na rozdíl od Ghibli nemají takovou veřejnou podporu a renomé.
Největší ranou je nejen pro Ghibli spíše celková devalvace tvorby – ilustrátor Reid Southen upozorňuje, že mimořádně náročná tvorba animátorů může být díky lehkosti práce s ChatGPT lidmi vnímána jako jednoduchá záležitost a tím ztrácí na hodnotě. To následně postihne nejen velká jména, ale opět i ony začínající a méně známé tvůrce, kteří se za svou práci budou marně domáhat odpovídající odměny.
Není umění jako umění
Ekonomické dopady AI na živobytí animátorů, ilustrátorů, fotografů a dalších tvůrců jsou zásadní problém, který ale občas svádí k poněkud hysterickým debatám o tom, že AI zničí umění jako takové. Jde o mnohokrát diskutované téma (loni jsem se mu věnoval i v tomto newsletteru), které lze jednoduše shrnout tak, že AI sice možná připraví umělce o peníze, ale abstraktní hodnotu a smysl jejich práce nijak výrazně nepoškozuje.
Dobrý postřeh měla v tomto kontextu blogerka Kyla Scanlon, která podotýká, že nástup AI nástrojů vede jen k dílčímu hodnotovému posunu. Ghibli memy ukazují, že u některých typů umění (pořád se bavíme hlavně o ilustraci, grafickém designu či fotografii, což je relativně malý výsek z možných uměleckých forem) klesá inherentní hodnota samotného obsahu a na důležitosti nabývá autor, jeho záměr, kontext a rámování celé věci – kresba od Mijazakiho bude mít vždy jiný význam a přijetí než „úplně stejný“ obrázek vyplivnutý ChatGPT pro stážistu v Bílém domě.
Řada komentátorů začala navíc po kauze Ghibli upozorňovat, jestli to nepřeháníme s používáním výrazu „umění“. Současná mediální debata často vypadá tak, že na jedné straně stojí škodolibí a mírně zamindrákování lidé z prostředí technologického průmyslu, kteří tvrdí, že AI „demokratizuje“ umění, odstraňuje údajné elitářské bariéry a dává možnost volné kreativní tvorby „do rukou lidu“. Opačný tábor pak tvoří umělci, kteří zvedají výše uvedené argumenty a oprávněně si stěžují, že AI průmysl jen vykrádá jejich tvorbu a prostřednictvím divoké automatizace je připravuje o práci a postavení.
Marketingový specialista Sean Monahan ale cynicky konstatuje, že tato debata je naprosto odtržená od toho, jak AI nástroje vnímá široká veřejnost – nikdo příčetný totiž obrázky z AI generátorů nebere jako „umění“. Všichni intuitivně tuší, že „opravdové“ umění vzniká jinde a jinak (ať už si ho představují jakkoliv), a lidé zkrátka chápou AI memy jako nezávaznou legraci bez hlubšího významu a hodnoty. Grafikům či ilustrátorům to sice peněženky znovu nenaplní, ale zároveň to vyvrací představy lídrů Silicon Valley o tom, že „umění“ teď bude jejich.
Do teoretických definic toho, co je umění, se zde radši nebudu pouštět, ale Monahan celkem výstižně říká, že i z pohledu selského rozumu musí umění mít nějaký specifický a hlubší význam, autora a původ – a náhodný obrázek, nad kterým se při scrollování instagramem na vteřinu zasmějeme a pak na něj zapomeneme, do této škatulky rozhodně nepatří.
Virální, ale pomíjivá reklama
Fotky protažené Ghibli filtrem z hlediska oné lidové definice nejsou umění, navíc je otázkou, zda je vůbec lze označovat za mem. Blogerka Kathryn Winn (jejíž newsletter o nových memech vřele doporučuji) upozorňuje, že logika memu spočívá v tom, že vzniká zespodu jako relativně spontánní humor a význam pak nabývá díky tomu, že jej lidé neustále upravují a něco k němu přidávají. Pokud ale všichni dělají tentýž jednoduchý trik s ChatGPT, není to mem, ale jen velmi pomíjivá a nudná virální móda.
Dá se to říct i tak, že dobré memy alespoň chvíli fungují jako interní humor ve skupině zasvěcených, ale když stejný fór začne do pár hodin používat Elon Musk i Danuše Nerudová, ztrácí jakýkoliv půvab a smysl. Navíc to znovu dokazuje, že AI generátory rozhodně neohrožují společenskou pozici umění – pokud nový nástroj teoreticky umožňuje tvorbu jakéhokoliv obrazu, ale všichni s jeho pomocí udělají totéž, je jasné, že respektovaná umělecká tvorba si vyžaduje víc předpokladů než jen přístup k ChatGPT.
Rychlost a plytkost, s jakou Ghibli „memy“ prolétly sítěmi a za pár dnů byly zapomenuty, je zásadní indicií pro pochopení jejich skutečného účelu – byla to prostě živelná reklamní kampaň firmy OpenAI.
Podobné pokročilé funkce u svých AI nástrojů ve stejnou dobu představil i Google, ale veškerou pozornost si na sebe díky Ghibli filtru strhnul Sam Altman, který díky němu může zase o chvíli déle předstírat, že vede úspěšnou a profitabilní firmu. Opak je ovšem pravdou, a i když by Ghibli filtr mohl na první pohled vypadat jako geniální reklamní tah, nakonec jen zdůrazňuje, na jak vratkých nohách celý AI byznys stojí.
Na tomto místě je potřeba podotknout, že není AI jako AI. Vývoj umělé inteligence se může ubírat celou řadou cest (velmi pěkně to nedávno v podcastu Prompt na webu Voxpot vysvětloval matematik Robert Neruda), které jsou často velmi slibné a mají pozoruhodná využití. Bylo by proto nesmyslné a bláhové provolávat obecné předpovědi o tom, že AI je přeceňovaná technologie, AI revoluce se nekoná apod.
Na rovině běžné veřejné debaty se dnes ale pod pojmem „AI“ téměř vždy rozumí audiovizuální a textové generátory čili „chatboti“ založené na strojovém učení a velkých jazykových modelech, tedy především ChatGPT a obdobné nástroje, a v jejich případě je skepse více než důvodná.
Když Altman a další lídři Silicon Valley vychvalují své AI produkty, většinou tvrdí, že jde o převratnou technologii s nesčetným množstvím využití, která již brzy promění všechny oblasti života a společnosti. Teoreticky by to mohla být pravda, ale při pohledu do praxe je zjevné, že tento utopický obrázek neodpovídá realitě.
Pěkně to vystihl bloger Max Read, který dospěl k podobnému závěru jako Monahan a konstatuje, že převažujícím využitím AI nástrojů typu ChatGPT se v současnosti stala zábava – tedy zvědavé experimentování, vykecávání se s chatboty a tvorba jednoduchých fórků typu Ghibli filtru, nebo v horším případě výroba obrazového a textového spamu zaplavujícího sociální sítě. Altman tvrdí a možná i věří, že buduje centrální mozek lidstva, ale ve skutečnosti jeho firma vytvořila neuvěřitelně složitý a drahý stroj na memy a fotografický filtr.
Velmi děravý byznys
Leckdo by v tuto chvíli jistě oponoval, že to není pravda a ChatGPT či konkurenční nástroje mají již teď zásadní využití v mnoha sektorech. Zkuste se ale zamyslet, jak rozšířená tato využití ve skutečnosti jsou.
Nepřímo to přiznává i americký akademik Ethan Mollick, který ve svém newsletteru pravidelně přináší zajímavé návody na různé aplikace AI nástrojů. Na obecné rovině tvrdí, že se spontánně vynořují stále nová a nečekaná využití chatbotů, ale když musí jmenovat konkrétní praktické příklady, dojde například k tomu, že nové funkce GPT-4o umožňují vytvořit lepší videoherní textury, složité vizualizace a grafy nebo ilustrované recepty.
To je jistě fascinující a určitě to připraví o práci spoustu grafiků či copywriterů, ale pořád jde jen o velmi malé spektrum aktivit, kterým se věnují jen jisté skupiny kancelářských zaměstnanců a široká veřejnost pro ně zpravidla nemá využití. ChatGPT sice dokáže plnit zadání typu „Napiš dvacetistránkovou strategii využití AI při výuce makroekonomie a pak k tomu nakóduj mobilní aplikaci“, jenže to ocení jen malá skupina uživatelů, kteří extrémně drahou službu nedokážou zafinancovat.
Dlouhodobě na to upozorňuje kritik technologického průmyslu Ed Zitron, který opakovaně podotýká, že aktuální AI technologie typu ChatGPT rozhodně nejsou totéž, co býval nástup internetu a později smartphonů. Ani po několika letech totiž stále nenašly svou „killer app“ – tedy zásadní, potřebné a nenahraditelné využití pro miliardy lidí, díky kterému by dobyly svět a staly se udržitelným a ziskovým byznysem.
Důležitá je právě ona udržitelnost a ziskovost. Zitron nepopírá, že se již našla legitimní a populární využití AI generátorů. Ve velkém si je oblíbili programátoři, dobře se s nimi shrnují a prohledávají dokumenty, jsou velmi užitečné pro korektury, překlady, brainstorming a různé drobné kancelářské práce.
To ovšem firmám typu OpenAI získá jen omezené množství uživatelů placených verzí jejich služeb, a neřeší to fakt, že ChatGPT je pořád v drtivé většině používán především ke zmiňované výrobě srandiček a braku, tvorbě domácích úkolů a jiných podvodů a plagiátů, nebo (vzhledem k povaze dané technologie zcela nesmyslně) jako webový vyhledavač a krutě nepřesný „rádce“. Vše se děje prostřednictvím bezplatných verzí a OpenAI, ale i Meta či Anthropic a další firmy tak propalují miliardy dolarů jako o závod a nezdá se, že by se někdy dostaly do černých čísel.
Když přemýšlím o tom, co nástup AI chatbotů reálně připomíná, napadají mě 3D tiskárny. Ty také původně technologičtí evangelisté razili jako revoluční technologii, která si brzy najde cestu do každé domácnosti. Pak se ovšem ukázalo, že jde sice o bezesporu přelomový vynález, který má ale místo jen ve specifických případech a využijí jej hlavně firmy a profesionálové, protože běžný uživatel si opravdu nebude na domácí 3D tiskárně v kumbálu vyrábět nové kolíčky na prádlo nebo kryt na telefon.
Pokud touto analogií nahlédneme AI chatboty, vypadalo by to tak, že by k bezplatným 3D tiskárnám měl dnes přístup naprosto každý a lidé by si na nich denně zdarma vyráběli nekonečné závěje legračních nesmyslů. Takový byznys by jistě obratem zkrachoval a je to situace, do které se teď dostává OpenAI.
Právě v tuto chvíli přicházejí ke slovu efektní triky typu Ghibli filtru. Snaží se zakrýt děravý byznys v pozadí, ale ve skutečnosti ještě podtrhávají, že hlavní a nejpopulárnější využití chatbotů nedává žádný ekonomický smysl.
Možná přitáhnou pozornost k novým produktům OpenAI, jenže jen těžko získají mnoho nových předplatitelů, protože většina lidí prostě ve svém životě nemá (nad rámec tvorby memů a náhodných experimentů) žádnou silnou a reálnou potřebu generování obrázků a textů a rozhodně za to nehodlá platit. A pokud už na Ghibli memech někdo něco vydělává, jsou to hlavně velké sociální sítě, na kterých je uživatelé sdílejí.
Altman a jeho parťáci proto musí jen donekonečna slibovat zázraky, které AI již brzy určitě přinese, aby nalákali další investory a drželi svůj nerentabilní byznys nad vodou. Zitron v zevrubné analýze přehledně vyčísluje, že obchodní model OpenAI je doslova letadlo závislé na neustálém přílivu peněz od spekulantů a v současnosti nejspíš neexistuje žádná firma, která by někdy dokázala dotlačit svůj AI byznys k tvorbě reálného zisku.
Skutečný zájem a možnosti využití jsou prostě moc malé, náklady obrovské – a i aktuální cena předplatného ChatGPT je tak nízká, že OpenAI svůj produkt stále prodává pod cenou reálných nákladů (dobrým čtením o blížícím se puknutí AI bubliny je i tato analýza Bryana McMahona na webu American Prospect).
Kauza Ghibli tak byla nejen reklamou pro širokou veřejnost, ale i falešnou vějičkou pro naivní investory. A vedle slova reklama se nabízí ještě jiný pádný výraz – je to tak trochu úplatek.
ChatGPT a další podobné nástroje jsou nejen drahé, ale také ekologicky zničující, a především mají řadu škodlivých společenských dopadů – od zmiňovaného spamu a porušování autorských práv přes různé podvody či tvorbu deepfake pornografie až po šíření dezinformací a politickou destabilizaci. A aby veřejnost, novináři i politici tyto poklesky přehlédli a stále nechali technologickým firmám volnou ruku v jejich destruktivním byznysu, je potřeba je nějak symbolicky (pokud ne doslova) zkorumpovat.
Tento pomyslný úplatek může v případě široké veřejnosti nabýt formu právě onoho návykově zábavného generátoru memů. A kdyby nad tím snad některé intelektuálnější typy ohrnovaly nos, jsou tu i jiné možnosti. Jak podotýká tato povedená esej, bývá to třeba oblíbený argument, že AI má přece úžasné využití v medicíně a nemůžeme tak regulovat či potírat technologii, která má potenciál zachraňovat životy.
Je to figura, kterou už technologický průmysl používá v různých variantách celé dekády a která se při bližším zkoumání okamžitě rozpadne. Téměř nikdy ji totiž neříkají lékaři, ale právě zaměstnanci či fandové firem jako je OpenAI. A pokud byste snad namítli, že tedy můžeme přistřihnout křídla přiznaně problémovým variantám AI technologií a přesměrovat síly a finance do aplikací v medicínském výzkumu, setkáte se s velmi vzteklými reakcemi a nadávkami do kazisvětů a staromilců.
Je pravděpodobné, že za pár týdnů se zase vynoří další virální móda či mem typu Ghibli filtru. A zase se ukáže, že pokud bude AI průmysl ponechán bez kontroly výměnou za utopické sliby a veselé obrázky, bude se stále roztáčet destruktivní a neudržitelná spirála vedoucí ke krachu a nepěkným koncům. AI byznys se tak nakonec skutečně zreguluje tržně a samovolně, ale pokud by do toho veřejnost a politici vstoupili proaktivně již nyní, ušetříme si spoustu slz a zbytečných starostí.
Pokud se vám ukázka z newsletteru Pod čarou líbila, přihlaste se k odběru. Každou sobotu ho dostanete přímo do vašeho e-mailu, včetně tipů na další zajímavé čtení z českých i zahraničních médií.