Hlavní obsah

TechMIX: Generátory obrazů válcují umělce. Odpůrci mají pravdu, ale prohrají

Foto: Pavel Kasík, Seznam Zprávy

Letos se vyrojily služby, které využívají neuronových sítí ke generování portrétů.

Dnešní newsletter bude opět o umělé inteligenci. O tom, jak se budeme muset vyrovnat s novou realitou. V některých odvětvích totiž přijde za pár let, ale jinde už dělá paseku nyní.

Článek

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Minulý týden se o konverzačním nástroji ChatGPT dozvěděl snad každý. Po sociálních sítích, podcastech, webových článcích i televizních reportážích kolovaly nejrůznější ukázky (můj podrobný souhrn najdete zde). Ale to nebyla ta podstatná novinka. Vždyť už několik let vycházely v novinách různé „rozhovory s umělou inteligencí“, nemluvě o divadelních hrách napsaných strojovým učením, povídkách, článcích a podobně.

Setkal jsem se proto u některých odborníků s názorem, že vlastně o nic přelomového nejde. ChatGPT přece využívá jen trochu vylepšený model GPT-3, který tu je už víc jak dva roky. Z pohledu lidí, kteří vývoj strojového učení sledují, šlo spíše o nový kabát pro starou známou technologii.

Jenže ChatGPT dal poprvé každému možnost si tuto těžko předatelnou zkušenost prožít na vlastní kůži. Vy, vaše děti, vaši rodiče a kdokoli jiný si může na stránkách ChatGPT od OpenAI vyzkoušet komunikaci se strojovým učením a ověřit si, co umí a co ne.

Jinými slovy to, co odborná veřejnost ohledně využití a zneužití takzvané „umělé inteligence“ vstřebávala v průběhu posledních dvou let, to nyní veřejnost zažívá v rámci šíleně koncentrovaného rychlokurzu. Nedivím se, že se z toho řadě lidí točí hlava. Je to zcela adekvátní reakce na kontakt s technologií, jejíž schopnosti i nedostatky jsou tak neintuitivní.

Není to vyhledávač, není to kalkulačka, není to knihovna, není to vědomostní databáze, není to překladač, není to terapeut, není to umělec… ale umí se tak tvářit. A to velmi přesvědčivě. Sám vám to ostatně přizná, když jej nachytáte, jak si vymýšlí: „Je mi líto, že jsem vás zmýlil nebo způsobil nějaké potíže. Jako velký jazykový model jsem byl vytvořený tak, abych odpovídal na otázky s co největší přesností a přesvědčivostí.“

Jak jsem zdůraznil ve svém článku na toto téma: „Služba ChatGPT bere v potaz celou předchozí konverzaci s uživatelem. Na základě toho, co již zaznělo, sestavuje odpovědi tak, aby byl výsledný text vnitřně co nejvíce konzistentní. Výsledek tedy může být pravdivá odpověď, ale také jen věrohodně znějící nesmysl.“

Foto: Pavel Kasík, Seznam Zprávy

Stroj vám odpoví cokoli, co bude vypadat důvěryhodně. Asi jako student, který si u zkoušky vylosoval otázku, na kterou se nenaučil, a tak to zkouší zakamuflovat.

Je myslím užitečné si uvědomit, že ChatGPT prostě kecá. A to slovo „kecat“ nezaměňujme se slovem lhát. Skutečně lhát může pouze někdo, kdo si myslí, že ví, jaká je pravda, a vědomě tuto pravdu zatajuje nebo zkresluje. Ale kecání vůbec nevyžaduje znalost pravdy. Jak píše filozof Harry Frankfurt ve své slavné knize O kecání, kecy jsou vlastně ještě horší lži.

„Lhář zná pravdu a popírá ji. Ale když někdo kecá, vůbec mu na pravdě nezáleží,“ zdůrazňuje Frankfurt. Místo toho jsou kecy zaměřené na to, aby zněly přesvědčivě. Občas dokonce budou pravdivé. Jejich problémem není nepravdivost, ale to, že se vůči realitě vůbec nemusí vztahovat.

Jde především o zachování co největší „konzistence“. Neuronová síť hledá takovou odpověď, aby „vypadala, že navazuje na zadanou otázku“. A když je síť dobře natrénovaná, často je výsledek až překvapivě dobrý.

Ale je dobré si pamatovat, že AI za své výtvory neručí. A když se zeptáte znovu, můžete dostat úplně jinou odpověď. Kdyby nám něco takového bez mrknutí oka dělal člověk, vyslouží si přezdívku Baron Prášil.

Generované umění dobývá svět

Podobně fungují i generátory obrazů. Nesnaží se o nějaké „zachycení skutečnosti“ nebo „vyjádření pocitů“, což je často cílem uměleckého díla. Namísto toho jsou neuronové sítě jako DALL-E, Midjourney nebo Stable Diffusion natrénovány k tomu, aby generovaly obraz, který co nejvíce odpovídá zadanému textu, tedy nevybočuje z očekávání a tvoří s textem konzistentní pár.

Můžete si to představit jako dvě neuronové sítě, které se spolu dohadují. Jedna umí tvořit, druhá kritizovat. Tvůrce dostane na začátku hromadu šumu a snaží se z toho „něco“ poskládat. Kritik mu říká, zda se blíží zadání, nebo to má zbořit a začít znovu. Po milionech pokusů se některé „zadaří“ a postupuje se do dalšího kola. Během několika desítek takovýchto „konstruktivních dialogů“ je na světě obraz, který „nějak“ odpovídá textovému zadání.

Zní to, jako že by to nemělo fungovat, ale výsledky hovoří samy za sebe. A co víc, každý měsíc se zlepšují. Když jsem na jaře 2022 poprvé volal několika umělcům o vyjádření k těmto generátorům obrazů, většina vůbec nevěděla, o co jde. Případně předpokládali, že tyto vygenerované obrazy budou na první pohled rozeznatelné od „skutečného umění“.

Někteří ale prokázali větší představivost: „Mě to děsí. Výrazně to zasahuje do území, které jsem vždy považoval za výsostně lidské, do vizuálního projevu,“ řekl mi tehdy ilustrátor Vladimír Strejček. „Kdyby to fungovalo tak, že lze nadiktovat obsah ilustrace a specifikovat styl, tak by 95 % ilustrátorů nemělo během jednoho dne zakázky. Přes 90 % všech komerčních, užitých nebo knižních ilustrací je kresleno styly, které již existují. Umělá inteligence se je tudíž může naučit.“

Kde je hranice umění, autorství, lidské kreativity?

Přesně to se nyní děje a ilustrátoři po celém světě to už začínají pociťovat. Pokud nejste v těch správných bublinách, asi jste to nezaznamenali, ale na internetu se v současné době rozehrává bitva mezi skutečnými umělci z masa a kostí a nadšenci do generování AI umění. Sám se v tom teď teprve zkouším zorientovat, ale dobrá ukázka je třeba tento povzdech ze strany „skutečné umělkyně“.

Na první pohled by se mohlo zdát, že jde o čistě filozofickou až sémantickou přetahovanou: Kdo je to umělec? Kdo je to autor? Může si nálepku „umělec“ nebo „autor díla“ skutečně přivlastnit člověk, který „jen“ zadal pár řádek textu a pak si hrál s posuvníky, dokud nedostal obrázek, který se mu líbil? Kde je hranice umění, autorství, lidské kreativity?

Bojovníci proti AI mají pravdu, ale prohrají

Jenže ona je to čím dál víc i otázka praktická. Generátory umění se totiž trénovaly na ohromném množství dat. A umělci zjišťují (třeba pomocí speciální stránky nebo ukázek dat), že právě jejich díla byla (často omylem, ale to je nakonec celkem jedno) zařazena do trénovacích sad se stovkami milionů dalších obrazů.

Výsledkem je pochopitelná nevole umělců, kteří bezmocně sledují, jak stoupá poptávka po umění generovaném počítačem. „V komunitě digital painterů apod. vládne docela chaos a hysterie, mnoho z nich se cítí poškozeno,“ napsal mi ilustrátor Milan Martinec. Odkazuje třeba na e-mail, ve kterém umělec dostal nabídku, aby rozhodl, která neuronová síť umí nejlépe napodobovat jeho styl. „Nelíbí se mi to,“ dodává Martinec a není sám.

Foto: Artstation.com/Pavel Kasík

Na stránce ArtStation.com umělci hromadně protestují proti tomu, aby neuronové sítě využívaly jejich obrazů k trénování a tvorbě.

Rád bych měl pro umělce nějakou dobrou zprávu. Něco ve stylu, že lidi omrzí hrát si se strojovým učením a uvědomí si, že není nad dotyk skutečného, talentovaného umělce z masa a kostí. Nebo že se povede trend zvrátit a donutit firmy, aby trénovaly své sítě jen na autorech „bezpečně mrtvých“, jak říkal Cimrman, tedy na obrázcích, které jsou v public domain a nevztahují se na ně autorská práva.

Luddité nebyli dětinští, ani naivní. Byli to lidé, kteří se zoufale snažili zachránit svá práva… Ale prohráli.
Neil Postman, autor knihy Technopoly

Pragmaticky vzato ale očekávám pravý opak. Jsme na úplném začátku generovaného obsahu, který na scénu naplno vtrhnul až letos. A neumím si představit, že by šel tenhle džin vrátit zpátky do lahve. Jak je tkalcovský stroj jednou vynalezen, bude využíván.

Narážím samozřejmě na známý historický příběh z Anglie počátku 19. století. Nástup tkalcovského stroje naprosto změnil status quo. Masová a levná výroba v továrnách – kde mohl pracovat kdokoli, žádné předchozí zkušenosti nebyly třeba – připravila o živobytí celou řadu tkalců, kteří vyráběli látky v domácích dílnách. Řada lidí proti této revoluci protestovala rozbíjením strojů, které jim „braly práci“. Říkali si luddité a dnes je často používáme jako příklad „iracionálního strachu z technologií“.

„Jenže luddité nebyli ani dětinští, ani naivní,“ píše Neil Postman v knize Technopoly (ze které teď asi budu citovat v každém druhém newsletteru). „Byli to lidé, kteří se zoufale snažili zachránit svá práva, výsady, možnosti, zákony a zvyky, které jim ve světě, který znali, zajišťovaly spravedlnost. Ale prohráli.“

Jsme v situaci, kdy se zásadně mění, kdo může na počkání produkovat krásné obrazy. Dříve na tuto činnost měli monopol trénovaní, talentovaní umělci a na této schopnosti mohli postavit svou kariéru, živnost nebo identitu. Což ostatně budou moci i v budoucnosti, ale už nebudou mít monopol. A co hůře, jestli bylo pro umělce těžké prosadit se doteď, tak v novém prostředí to bude opravdu tvrdý boj.

Portrét na míru k Vánocům? Kolik zaplatíte?

Podívejme se třeba, co se stalo s portréty. V 18. století měli portrét jen nejbohatší lidé, tvorba portrétu byla časově i finančně náročná a schopnost malovat realistický portrét byla velmi vzácná. Byla to ukázka statusu a otázka prestiže. Za některé portréty slavní umělci inkasovali sumy, které bychom dnes počítali přibližně ve vyšších desetitisících korun.

V 19. a především 20. století toto zcela změnil nástup fotografie. Kdokoli se mohl nechat vyfotit, cena šla dolů, počet portrétů vzrostl z tisíců na miliardy. V 21. století pak jen vytáhneme telefon z kapsy a pořídíme ucházející autoportrét (selfie), kdykoli, kdekoli, klidně stokrát za den.

Pokud ale někdo chce ukázat, že na to má, pořád si může nechat namalovat portrét ručně. Už to není taková drahota a nemusíte sedět nehybně na židli jako v 18. století. Malíři vám rádi vytvoří portrét na míru, v libovolném stylu, podle vaší fotografie. Zaplatíte jen pár tisíc.

No a letos – akorát včas na Vánoce – se vyrojily služby, které využívají neuronových sítí ke generování portrétů. Můžete k tomu ostatně využít vlastní neuronovou síť (kombinace nástrojů Stable DiffusionDreambooth). Ale pokud nechcete experimentovat, zaplatíte jen asi dvě stovky, nahrajete dvě desítky svých fotek a neuronová síť vám vyplivne přes sto snímků ve stylech, jaké si naklikáte.

Foto: Avatarai.me/Pavel Kasík

Tohle jsem já jako viking, superhrdina, portét van Gogha, postava v počítačové hře, pirát a malíř. Za 120 portrétů jsem zaplatil asi 170 Kč.

Už nyní si můžou zájemci vybrat z mnoha nástrojů (AvatarAI.me, StarryAI, Lensa a další). Ne, není to dokonalé. Podle některých ani etické. A má to své stinné stránky (takový titulek si jako tvůrce služby fakt nechcete v novinách přečíst).

Ale je to ukázka reality, ve které žijeme. Neříkám, že je to správně. Ale myslím si, že už není cesty zpátky. Budeme se s tím muset naučit žít. Najít způsob, jak v tomto světě fungovat.

Určitě v tomto ohledu proběhne mnoho komplikovaných soudních sporů. A zatímco se právníci budou přetahovat o definice slov „inspirace“ nebo „trénování“, desítky milionů lidí budou generovat obrazy pomocí strojového učení.

Umělci to začnou používat. Pustí se do toho velké firmy. A někteří umělci začnou raději spolupracovat na trénování strojového učení, než aby proti němu bojovali. Vzniknou úplně nové profese: kurátor promptů, opravář zpitvořených rukou, ladič neuronek a desítky dalších.

Bude to divoké. A pokud nejste umělci, nemyslete si, že se vás to netýká. Strojové učení ovlivní moji i vaši profesi. Respektive už ovlivňuje, jen si toho zatím možná nejsme tolik vědomi. Ale případ generátorů obrazů nám připomíná, že nástup může být opravdu skokový.

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Doporučované