Hlavní obsah

Tyto neuvěřitelné obrazy vytvořil stroj. Je to návykové, varují nadšenci

Foto: koláž: Pavel Kasík, Seznam Zprávy, obrazy vygenerované neuronovými sítěmi Midjourney, Stable Diffusion a DALL-E 2

Jak si kreativní neuronová síť představuje sama sebe? Vygenerování neuronovou sítí Stable Diffusion, v pozadí další AI výtvory.

Fantastické, realistické, vtipné… až děsivé? Ještě před rokem bylo nepředstavitelné, že by počítač vytvářel na počkání taková díla. Teď to může vyzkoušet každý. Podívejte se na nejzajímavější obrázky a dojmy jejich „autorů“.

Článek

Poslední měsíc jsem strávil objevováním mimozemské civilizace.

Tedy ne tak docela. Zkoumám po večerech schopnosti neuronových sítí, které na základě zadaného textu generují obrázky. K mimozemské civilizaci je přirovnávám proto, že tyto generátory jsou nezvykle mocné. A navíc svým způsobem zkoušejí chápat náš svět. Mají nás lidi –⁠ a naše výtvory –⁠ nastudované, ale někdy nám rozumí… zkrátka jinak. Po týdnech experimentování mě možnosti těchto programů fascinují ještě víc než na začátku. A nejsem sám.

Syntetické obrazy, které (stroj) vytváří, pro mě předčí většinu věcí vytvořených lidmi. Nesmírně se mi to líbí.
Eva Nečasová, výtvarnice a kutilka

Desítce lidí, kteří podobně jako já propadli kouzlu této „kreativní síly“, jsem se ozval a na základě jejich odpovědí jsem sestavil výběr zhruba stovky obrázků.

U každého najdete kromě obrázku i instrukce, které zadal „autor“ neuronové síti, přeložené z původní angličtiny do češtiny. Dole také najdete údaj o tom, který systém k vygenerování použil. Galerii můžete rozkliknout a prohlédnout přímo v článku.

+8

„Nejvíc mě překvapila kreativita algoritmu. Dokázal vygenerovat věci, u kterých jsem si řekl prostě wow,“ popsal mi své dojmy spisovatel a datový analytik Petr Ludwig, který na facebooku založil českou skupinu pro sdílení vygenerovaných výtvorů. „Umělá inteligence změní velmi brzy všechny kreativní profese.“

Jeho nadšení sdílí i někteří zástupci z řad umělců: „Překvapuje mne to neustále,“ říká Eva Nečasová, výtvarnice, která také pomáhá žákům pochopit strojové učení. „Syntetické obrazy, které (stroj) vytváří, pro mě předčí většinu věcí vytvořených lidmi. Nesmírně se mi ty obrazy líbí. Nesmírně.“

Exploze kreativity i kopírování

Poslední týdny jste se s těmito a podobnými obrázky určitě setkali. Asi jste i zaznamenali, že v USA obraz vygenerovaný strojovým učením vyhrál první místo v oblastní umělecké soutěži.

Hlavní změnou oproti jaru, kdy jsme o těchto generátorech psali poprvé, je totiž obecná dostupnost těchto nástrojů. Midjourney, Stable Diffusion nebo Craiyon jsou zdarma nebo za malý poplatek otevřeny každému. Logicky to povede k ohromnému množství „umělých obrázků“, které zaplaví nejen sociální sítě.

Napoprvé lidé obvykle nezadají neuronové síti žádnou komplikovanou instrukci. Chtějí prostě vyzkoušet, co systém umí. A obvykle jsou příjemně překvapeni.

Toto jsou ukázky prvních pokusů některých lidí, se kterými jsem se o generátorech obrázků bavil:

+2

„Kreativita se nám přesouvá od práce se štětcem ke schopnosti formulovat požadavek. Což je skvělá zpráva pro nás, kteří neumí nakreslit kruh, aniž by vypadal jako brambora, ale zato vládnou psanému slovu,“ popisuje změnu David Grudl, vývojář, lektor a blogger.

Pamatuje si, co zadal neuronce jako vůbec první instrukci? „Ano, zadal jsem jí úkol nakreslit programátora pijícího latté. Pln očekávání jsem stiskl enter a za pár vteřin dostal čtyři fotografie, na každé šálek s typickou pěnou a obézní, brýlatý, od pohledu asociální muž,“ vzpomíná vývojář. „Řekl jsem si: ‚Wow, to nemá chybu!‘“

Dobrá zpráva pro mrtvé umělce

Obvykle však nezůstane jen u jednoho generovaného obrazu. Kdybyste se setkali se skutečným mimozemšťanem, spokojili byste se snad s jednou otázkou?

Během komunikace s touto novou „formou života“ navíc zjistíte, že vám často nerozumí. Dělá divné chyby, nechápe kompozici nebo lidem zcela zjevné souvislosti.

„Současná AI dosahuje výsledků srovnatelných s lidmi, ale dochází k nim dost jinými procesy než člověk,“ připomíná režisér Petr Salaba, který experimentuje s generátorem DALL-E 2. „Perverze, horor, emoce, to všechno stroj dovede zpracovat lépe než průměrný profesionální umělec.“

Je to taková šílená hra pokus–omyl. Jedna neuronová síť se snaží vytvářet obrázek, druhá jí dává zpětnou vazbu.
David Grudl, vývojář

Od profesionálních umělců se nicméně strojové učení inspiruje. Konkrétně tak, že na jejich obrazech – a miliardách dalších fotek z internetu, fotobanky a dalších zdrojů – trénuje své algoritmy a modely chápání vztahu mezi textem a obrazem. Pokud je nějaký umělec v databázi zastoupen častěji, bude neuronová síť umět jeho styl lépe napodobit.

Ze světových malířů je často napodobován třeba Vincent van Gogh. České umělce ale v novém světě počítačové kreativity zdatně reprezentuje Alfons Mucha. Řada experimentátorů a tvůrců na něj nedá dopustit a jeho jméno přidávají do instrukcí, prý je pak výsledkem „elegantně čistá a prostě nádherná kompozice“.

Podívejte se na obrázky, ve kterých se neuronové sítě snažily napodobit umělecký styl konkrétního umělce:

+12

„Milý pane Mucho, 83 let po vaší smrti vytvoří lidi nástroj, který dokáže za pár vteřin namalovat cokoliv. Když to budou chtít zvlášť hezké, připíšou k zadání vaše jméno. Co na to říkáte?“ glosuje to komentátor Michal Kašpárek. Podle něj by to Muchovi určitě udělalo radost. „Ale pro žijící umělce to může být peklo.“

V některých systémech je totiž možné generovat fotografie obsahující reálné žijící lidi nebo napodobovat styl žijících umělců. „Generování děl konkrétních autorů nepochybně kráčí po hraně autorského práva, ne-li za ní,“ domnívá se ilustrátor Karel Hejkal, „předpokládám, že diskuse ohledně ochrany práv bude ještě bouřlivá,“ dodal.

Jak to vlastně funguje?

Většina lidí nebude nejspíš příliš řešit, co mají tyto „kouzelné kreativní stroje“ pod kapotou. Ale to je škoda. Když pochopíme, jak tvorba funguje, budeme umět lépe odhadnout, co půjde vytvořit a také jak.

Především nesmíme zapomínat na to, že každý algoritmus strojového učení vychází z nějakých dat. „Je dobré formulovat své požadavky přesně a srozumitelně, zásadní jsou zřejmě klíčová slova, podle kterých hledá AI ve své databázi,“ připomíná novinářka Lucie Tomanová. Ukázku zdrojové databáze obrázků najdete třeba na této stránce.

Neuronová síť tedy tvoří úplně jinak než lidé. Dalo by se to přirovnat ke klasickému vtipu.

Když se slavného renesančního sochaře Michelangela zeptali, jak dokázal vytesat nádhernou sochu Davida, odpověděl prý lakonicky: „Ale to je jednoduché. Vzal jsem velký kámen, podíval se na něj a pak z něj odštípl vše, co nevypadalo jako David.“

V útrobách generativní neuronové sítě to skutečně tak nějak probíhá. Akorát místo kusu mramoru je tu na začátku nějaký vesměs náhodný obraz.

„Je to taková šílená hra pokus–omyl dvou neuronových sítí. Jedna se snaží vytvářet obrázek, začíná od šmouh nebo šumu,“ popisuje přibližný princip Grudl. „Druhá posuzuje, nakolik se blíží zadání, a dává jí zpětnou vazbu. První se poučí a obrázek upraví a tak to jede stále dokola, dokud se dílko nezdaří.“

Nebo také nezadaří. Protože generátory tvoří výsledný obraz úplně jinak, než by jej tvořil člověk, vytvoří často velmi vtipné výsledky. Třeba když se pokouší o tvorbu nějakého textu, mohou být výsledky všelijaké, protože k písmenkům přistupuje trochu jako k obrázkům.

Vtipné obrázky vygenerované neuronovými sítěmi:

+13

„Lidé se domnívají, že AI tvoří, řekněme, lineárně, pouze od zadání k hotové kresbě. Netuší, že proces probíhá vylučovací metodou, generováním obrovského množství variant a postupným výběrem z nich a následnými iteracemi,“ připomíná Hejkal. Každopádně to, co vypadalo jako výlučně lidská aktivita, se ukázalo býti algoritmicky napodobitelné. „Stroj nám zcizil jedinečnost, na kterou jsme si dosud dělali nárok.“

Umělci budou mít zpočátku výhodu

„Vynález generování obrázků pomocí strojového učení je totéž, čím byl vynález fotografie před 150 lety,“ myslí si Grudl. „Výtvarný obor se tím od základu změní, ale nezanikne. Lidé sice dostanou do rukou zázračný nástroj, ale je to stále jen nástroj. Nenahradí umělce s vkusem a vizí. A ne každý ho bude umět mistrovsky používat.“

„Někteří lidé na vygenerované obrázky reagovali na sociálních sítích naštvaně, což chápu,“ popisuje své zkušenosti Eva Nečasová, která se sama výtvarným uměním živí. „Všichni jsme z těch výsledků asi neskutečně překvapení. Někdo je fascinovaný. V někom to způsobuje strach.“

„Grafické odvětví projde razantní změnou. Nyní se otevře možnost pořídit si grafiku na přání úplně bez rizika,“ domnívá se Hejkal. Některé neuronové sítě (třeba Stable Diffusion) totiž umožňují výsledky využít prakticky bez omezení, a to i ke komerčním účelům.

Umělec, novinář, lékař, právník, marketér, politik… když budou využívat strojové učení, budou kreativnější a výkonnější. Bude to divoké.
Petr Ludwig, spisovatel

David Grudl si tak například vygeneroval roztomile chlupaté ilustrační snímky na svůj blog. Já experimentálně používám ilustrační fotky vygenerované neuronovou sítí k některým svým článkům (ačkoli komunikace s našimi grafiky je výborná a nemám si rozhodně na co stěžovat). A na twitteru už funguje robot (účet ovládaný automatem), který umí nakreslit libovolný tweet pomocí strojového učení, a vy si pak rovnou můžete hotové dílo objednat vytištěné a zarámované.

Komunikace s neuronovou sítí bude ale trochu jiná než komunikace s umělcem, který pro vás zpracovává zakázku. Na jednu stranu budete moci vygenerovat rychle velké množství různých nápadů a ujasnit si svou představu. Na druhou stranu asi budete občas dost frustrovaní, alespoň zpočátku.

„Čím méně známou věc chci vytvořit a čím méně obecný požadavek mám, tím hůře si s tím systém poradí,“ napsal mi svou zkušenost Dan Přibáň, režisér známý trabantovými cestami kolem světa.

„Mnohokrát zobrazovanou Emmu Watson vystřelí systém Midjourney od pasu. Ale u trabanta si nebyl vůbec jistý, jak vlastně vypadá. Bylo ale zajímavé pozorovat, jak zkouší kombinovat auta podobné doby a kategorie jako Citroen 2CV, Austin Mini apod.“

„Co mě nejvíce zaujalo, bylo, že je to vlastně takové šlechtění. Požadavky jsem lehce upřesnil, ale ne příliš a dál jsem postupoval vytvářením dalších a dalších iterakcí,“ vysvětluje Přibáň. „Najednou v jedné začal trabant vypadat jako trabant a při dalších pokusech se mu k mému velkému překvapení objevila na střeše zahrádka a začal mít bílá kola, což je specifické pro naše auta.“

Softwarové generátory nepochybně neumí –⁠ alespoň v současné podobě –⁠ nahradit ty nejlepší umělce, špičky svého oboru, ty, kteří vymýšlejí nové koncepty. To ale není případ většiny lidí, kteří se kreativnímu řemeslu věnují. Ilustrátoři, grafici, fotografové, ti všichni mají důvod bedlivě sledovat následující vývoj. A ideálně se i naučit, jak nové technologie zapřáhnout, třeba k urychlení některých procesů.

„Kdo má vkus a orientuje se ve vizuální kultuře, pořád ještě dokáže modely lépe směřovat k zajímavějším obrazům, výstupy editovat, spojovat AI s jinými pomůckami a technikami,“ předpokládá výzkumník Jan Kulveit spolupráci mezi lidským a strojovým kreativcem. „V tom bude mít část dnešních profesionálů výhodu. Ale myslím, že se ztratí část řemesla.“

Anketa

Myslíte, že generátory obrázků připraví kreativce o práci?
rozhodně, většině kreativců to vezme práci
14,3 %
někomu to práci vezme, někomu naopak dá
70,5 %
vytvoří to více pracovních míst, než zničí
2,7 %
netuším, ale bude to jízda!
12,5 %
Celkem hlasovalo 1240 čtenářů.

„Kreativec využívající AI bude kreativnější než ten, který ji používat nebude,“ souhlasí Ludwig. „Novinář, vědec, lékař, psychoterapeut, právník, marketér využívající AI bude dělat daleko lepší práci než ten, který ne. Bohužel i politik-populista používající AI bude daleko lepší populista než ten, který ne. Bude to divoké.“

A možná také návykové. „Vážně se bojím, že strojově generovaný obsah v nás bude vyvolávat mnohem intenzivnější emoce než cokoliv hmotného kolem nás,“ spekuluje režisér Salaba.

„Už nějakou dobu je tohle problém třeba s pornografiií, která se pro mnoho lidí stala víc vzrušující než fyzický sex. Podobné je to s dopaminovými smyčkami ve videohrách a na sociálních sítích. Kreativní umělá inteligence nás pak může udělat citově impotentní a zároveň závislé úplně novým způsobem.“

Vzniká nový obor

„Grafici, ilustrátoři a fotografové zatím budou mít při tvorbě určité výhody,“ připomíná Kulveit. Zmenšil se ale podle něj rozdíl mezi tvůrcem a kritikem. „Pokud máte lepší představu, co chcete, dokážete to modelu lépe popsat. Pokud trochu znáte historii vizuální kultury, umíte si lépe představit, jak by nějaký námět mohl dopadnout v nějakém stylu. Vyberete také lepší výstupy. Při hraní s neuronovými sítěmi jsem vděčný, že jsem díky tátovi jako dítě listoval třeba Dějinami umění Josého Pijoana.“

Kdo se ale v uměleckých směrech moc nevyzná, může využít různé užitečné přehledy nebo konfigurátory. A nebo dlouho – opravdu dlouho –⁠ experimentovat, přidávat k instrukcím různá slova, hýbat s posuvníky ovlivňující počet „rozmazávacích a zpřesňovacích“ kroků generátoru.

Dlouhé ladění se ale vyplácí. Výsledky jsou často neuvěřitelně realistické a od skutečných fotek nebo obrazů prakticky k nerozeznání:

+5

„Odhaduju, že ten, kdo v rámci určitého modelu dokáže psát dobře instrukce, bude velmi ceněný,“ domnívá se Nečasová. „Myslím, že prompt engineer (tvůrce výchozích instrukcí pro AI, pozn. red.) je jedno z hodně smysluplných budoucích povolání.“

Nově lze také využít funkce img2img, tedy vytvořit nový obraz ze stávajícího obrazu a doplňkových instrukcí. Generátoru v podstatě nabídnete „předlohu“, se kterou má dále pracovat, a textově mu řeknete, co v ní má vidět. Tady si třeba můžete proklikat, co jsem pomocí různých instrukcí a parametrů vytvořil z jednoduchého barevného obrázku, který jsem za minutu načrtl v editoru Photopea.

Jeden z nadšenců, se kterými jsem téma konzultoval, nicméně protestoval proti tomu, abych jej nazýval autorem díla. A přitom zrovna jeho instrukce patřily k těm nejpropracovanějším a na tvorbě některých obrazů strávil několik hodin.

Foto: koláž: Pavel Kasík, Seznam Zprávy

Ukázka obrázku vygenerovaného pomocí poměrně komplikované série instrukcí (v rámečku je zkrácená verze).

„Neřekl bych, že jsme autoři nebo tvůrci těch obrazů,“ myslí si Leonardo Monteiro, jeden z aktivních členů komunity experimentátorů se sítí Stable Diffusion.

„Nenamaloval jsem nic z toho, je to spíše, jako když si něco vybírám v e-shopu. Svoji roli vnímám spíš jako roli drobného kurátora, přispěvatele do ohromného souboru všeho lidského umění. Z obrazů ostatních umělců a tvůrců totiž ta neuronová síť čerpá. Dalo by se říci, že v každém tomto obrazu je obsaženo veškeré lidské umění.“

„Myslím, že se nacházíme v přechodné éře,“ uvažuje Monteiro. „Neměli bychom to brát na lehkou váhu. Je to kolektivní dílo a musíme zajistit, aby to nevedlo k zániku pozic pro lidi, kteří se tvorbou živí. Měli bychom jim být vděční.“

Kde si můžete tvorbu vyzkoušet?

Existují již desítky nástrojů na generován obrazů pomocí textové instrukce. Některé jsou pouze pro zvané (DALL-E 2), ale většina je dnes již k dispozici široké veřejnosti.

Nejznámnější je v současnosti asi Midjourney, kde si obraz „objednáte“ přes komunikační platformu. Pro začátečníky je to trochu nepřehledné, ale funguje to dobře a zajišťuje to i určitý veřejný dohled. Výsledky jsou obvykle „snové“ a i s jednoduchými instrukcemi lze dosáhnout ohromujících výsledků.

Síť Stable Diffusion si může kdokoli rozběhnout na vlastním stroji, ale není to úplně jednoduché. Začátečníkům rozhodně doporučujeme některý z on-line nástrojů, třeba Dream Studio nebo některý další klon.

Pokud se rozhodnete generování obrazů vyzkoušet, mají pro vás nadšenci jednu nevšední radu: „Hlavně si vzít v práci dovolenou, nebo dát rovnou výpověď,“ žertuje Grudl. „A hrát si s tím, testovat, od rána do rána.“

„Vzal jsem si teď několik dní volno, čistě proto, abych Midjurney zkoumal a studoval. Není to prokrastinace, ale investice do budoucnosti. “ potvrzuje Ludwig, který v minulosti o prokrastinaci napsal populární knihu. „Teda prokrastinace je to samozřejmě taky, ale i tak v tom vidím smysl.“

Každý týden přibývají nové možnosti a z neuronových sítí lezou stále zajímavější výsledky. Více lidí totiž věnuje stále větší množství času, a objevují tak nové možnosti této poměrně revoluční novinky. Kde všude se tato revoluce projeví –⁠ a jak ovlivní náš vztah s uměním –⁠ zatím můžeme jen spekulovat. Rozhodně to ale bude fascinující podívaná.

Ukázka různorodých stylů, nápadů, vtipů a konceptů, vygenerovaných pomocí neuronových sítí:

+17

Doporučované