Hlavní obsah

„Většina přijde o práci.“ Umělá fantazie vás zaskočila. Co mají lidé navíc?

Foto: foto: OpenAI.com, koláž: Pavel Kasík, Seznam Zprávy

Neuronová síť od firmy OpenAI umí tvořit umělecká díla, která jsou k nerozeznání od těch vytvořených lidmi.

Počítač umí velmi přesvědčivě napodobit lidské umělce. Neuronová síť DALL-E 2 vygeneruje obraz na přání. Její „fantazie“ překvapila i námi oslovené umělce a grafiky. Bojí se tuctovosti, ale vidí i naději pro novou vlnu kreativity.

Článek

Většina lidí není schopna spolehlivě poznat umění vytvořené člověkem. To je hlavní závěr našeho nedávného průzkumu v článku o neuronové síti, která umí tvořit umělecká díla prakticky jen s námětem a v jakémkoli existujícím stylu. Výzkumníci americké společnosti OpenAI vytrénovali síť na existujících fotografiích a uměleckých dílech, ale výsledky připomínají vlastní „autorskou tvorbu“.

Můžete si to sami vyzkoušet. Tady je šest obrázků. Poznáte, které z nich vygeneroval počítačový program? Poté, co zadáte svůj tip, se hned dozvíte správné řešení.

Všechny počítačem vygenerované obrázky rozpoznaly jen 2 % všech účastníků. Více než čtvrtina si přitom věřila, že by počítačem generovaný obrázek rozpoznat spíše dokázali. Po testu nicméně stoupl počet lidí, kteří si svou schopností vůbec nebyli jistí. To je ostatně zjištění, kterým si postupně budeme muset projít všichni. Ať už jde o generování obrazů, textů, překladů nebo videa, počítače už dnes umí generovat extrémě realistické výsledky.

Je úžasné v přímém přenosu sledovat, jak přicházím o práci.
Samuel Smith, malíř a ilustrátor

Má ale počítač „fantazii“? Většina účastníků uvedla, že s takovou formulací spíše nesouhlasí. Možná je to částečně způsobeno tím, že všechny obrázky v našem kvízu byly v jednom stylu. Ve skutečnosti jich síť zvládá velké množství. A ke každému zadání může vygenerovat prakticky neomezené množství různých variací.

Foto: OpenAI.com

Nové ukázky vygenerovaných obrazů publikuje Open AI pravidelně na instagramu. Vždy zároveň uvádí, jak přesně zněly textové instrukce pro vytvoření obrazů.

Ať už tomu budeme říkat počítačová fantazie, nebo imitace kreativity, realita je jasná. Počítač má schopnost generovat obrázky k nerozeznání od lidských výtvorů. A čím dál více lidí si to uvědomuje. „Je úžasné sledovat v přímém přenosu, jak přicházím o práci,“ vystihl to na instagramu malíř a grafik Samuel Smith, který komentoval příspěvek s ukázkami toho, jak neuronová síť interpretuje námět a nakreslí jej v odlišných stylech, od vodovek po abstraktní umění.

Těžko uvěřitelná pestrost

Umělci, se kterými jsem o kreativní síti DALL-E 2 mluvil, někdy nejprve z mého vysvětlení nepochopili zásadní věc: tento software je schopen generovat skutečně velmi různorodé obrazy. To, že umí počítačový program skládat hudbu třeba ve stylu Dvořáka, je ostatně již obecně známé.

Přelomové je ale v případě DALL-E 2 právě ta všestrannost a stylová pestrost. Pro ilustraci jsem vytvořil nástroj, ve kterém si můžete projít 12 různých kombinací objekt + činnost + styl. U každé kombinace si můžete prolistovat deset vytvořených variant. To nám může dát dobrou představu o „talentu“ a „fantazii“ této neuronové sítě.

Obrázky pochází ze stránek projektu, kde naleznete i několik desítek dalších ilustrací. Firma také pravidelně publikuje nové ukázky na instagramu.

Vytváření obrázků na přání je jen jedna z úloh, kterou síť DALL-E 2 (pojmenovaná podle robota WALL-E a malíře Salvadora Dalího) zvládá. Můžete jí také zadat úkol pomocí kombinace textu a obrázku. Do existujícího obrazu můžete nechat něco dokreslit, něco odstranit nebo změnit. Stejně tak můžete nahrát třeba fotografii a požádat neuronovou síť, aby v ní něco pozměnila. Výsledky se zdají být překvapivě dobré.

Každý vygenerovaný obrázek – mají zatím všechny jednotné čtvercové rozlišení 1024 pixelů – navíc můžete použít k tomu, abyste s jeho pomocí vygenerovali další obrázky. Zadání a následné „vyjednávání“ se strojem tak může probíhat velmi podobně, jako je to v případě zadávání práce ilustrátorovi.

Proč byste zadávali práci člověku?

Představme si modelovou situaci. Spisovatelka chce ilustrace ke své knížce, řekněme ke knížce pro dětské čtenáře. Dnes by si na to našla profesionální ilustrátorku, se kterou by si dala schůzku. Dohodly by se na nějakém základním konceptu, ilustrátorka by po pár dnech poslala několik kreseb, nad kterými by se následně bavily. Když by se dohodly na celkovém stylu, začala by ilustrátorka vytvářet jednotlivé ilustrace a autorka by případně posílala připomínky. Dle rozsahu by mohlo být za pár dní či týdnů hotovo…

Pokud bude možné počítači nadiktovat obsah ilustrace a specifikovat styl, absolutně by to změnilo obor. Během jednoho dne by o zakázky přišlo 95 % ilustrátorů.
Vladimír Strejček, ilustrátor

Pokud by ale spisovatelka měla k dispozici neuronovou síť DALL-E 2 (respektive nějakou budoucí variantu), nemusela by se žádnými interakcemi zdržovat. Ilustrace by vlastními slovy zadala textově a postupně by zkoušela různé varianty. Neuronová síť generuje obrazy vždy od začátku, a tak by těch variant mohla za hodinu vytvořit několik tisíc. Postupně by si vybrala ty, které jí vyhovují, a ty by použila jako podklady pro vygenerování dalších. Za pár hodin by mohla mít ilustrace pro celou knihu hotové.

Foto: obrázky: Instagram/openaidalle, koláž: Pavel Kask

Ukázka různých zvířátek, která čekají na návštěvu u zubaře. Kdybyste takové ilustrace viděli v dětské knize, nejspíše se nad nimi nijak nepozastavíte.

„Technicky budou samozřejmě obrázky vygenerované počítačem od těch vytvořených člověkem k nerozeznání,“ myslí si český designér a režisér Karel Czech. „Místo na trhu si určitě najdou, ale předpokládám, že dominantní nebudou. Jistě bude spoustu nakladatelství, která budou tuto technologii využívat a zahlcovat trh spoustou knih, ale tato nakladatelství v podstatě už teď v některých případech pracují s ilustrátory jako s počítači.“

Ilustrátor Vladimír Strejček ze studia DRAWetc je v tomto ohledu pesimističtější: „Mě to děsí. Výrazně to zasahuje do území, které jsem vždy považoval za výsostně lidské, do vizuálního projevu.“

Strejček se domnívá, že až bude automatická okamžitá tvorba počítačových ilustrací komerčně dostupná, úplně to změní celý obor: „Kdyby to fungovalo tak, že lze nadiktovat obsah ilustrace a specifikovat styl, tak by 95 % ilustrátorů nemělo během jednoho dne zakázky. Přes 90 % všech komerčních, užitých nebo knižních ilustrací je kresleno styly, které již existují. Umělá inteligence se je tudíž může naučit.“

Podle Strejčka by se samozřejmě kreativní lidé mohli vytasit s novými a osobitými styly. Ale těžko by mohli tato díla „utajit“ před neuronovými sítěmi, takže ty by se jejich osobitý styl časem naučily také. „Nepochybuji ale, že také neuronové sítě by přicházely s novými styly, akorát že asi kvadrilionkrát rychleji… Nemám z toho dobrý pocit.“

Kdy to přijde?

Je evidentní, že tvorba fotomontáží všeho druhu bude v budoucnu opět jednodušší než doposud. Firma OpenAI se sice všemožně snaží zabránit tomu, aby byla její síť zneužitelná ke generování politických, propagandistických nebo pornografických montáží. Jenže i kdyby se jim dařilo – třeba pomocí týmu moderátorů každého vygenerovaného obrázku – zastavit neetické využití jejich programu, podobnou technologii může vytvořit kdokoli další. OpenAI nemá patent na neuronové sítě a je jen otázkou času, kdy někdo napodobí jejich postup a vytvoří použitelnou neuronovou síť, která si žádné servítky brát nebude.

Myslíte, že jsou připraveni to neuvolnit ke komerčnímu využití?
Matěj Forman, umělec

Většina čtenářů (73 %) v našem výzkumu uvedla, že by si s neuronovou sítí DALL-E 2 rádi hráli. Podobné nástroje nepochybně přinesou ohromnou „demokratizaci“ umění, podobně jako digitální fotoaparáty otevřely dříve úzký svět fotografie širokým masám. K tomu, abyste si nakreslili, co vás napadne, už nebudete muset trávit stovky hodin zdokonalováním svých dovedností. Co udělal strojový překlad pro porozumění cizím jazykům, to udělají „kreativní neuronky“ v oblasti umění.

Zatím ale nemáme možnost vyzkoušet si všechny možnosti neuronové sítě DALL-E 2. Po zkušenostech s různými lapáliemi z minula se společnost OpenAI rozhodla uvolňovat přístup postupně: „V rámci naší snahy o zodpovědný vývoj a nasazení umělé inteligence poskytujeme předběžný přístup k systému DALL-E omezenému počtu důvěryhodných uživatelů, kteří nám pomohou poznat možnosti a omezení této technologie,“ uvedl Fraser Kelton, produktový manažer OpenAI. Začátkem května měla přístup tisícovka uživatelů. „Postupem času plánujeme pozvat více lidí, jak se budeme učit a iterativně vylepšovat náš systém bezpečnostních pojistek.“

Vytvořené snímky zatím nesmějí být – podle podmínek služby – použity ke komerčním účelům. Zatím by tedy neměl nastat onen scénář, kdy ze dne na den přijde velká část ilustrátorů o výdělek.

Ale to se může snadno změnit. „Myslíte, že jsou připraveni to skutečně odložit, nezveřejnit, neuvolnit to ke komerčnímu využití?“ pochybuje český malíř a herec Matěj Forman. Osobně se nebojí, že by přišel o práci, ale má obavy o to, jaké dopady budou mít podobné systémy na umění a na společnost: „Neustále člověk nechává na počítači větší a větší část své práce, až nakonec předá skoro všechno. Používání takového nástroje přinese tuctovost. Neříkám, že by se to kvůli tomu nemělo využívat, ale mělo by se myslet na to, abychom nepropadli do tuctovosti.“

Jaké budou dopady, to zjistíme možná velmi brzy. Podle Sama Altmana, šéfa OpenAI, by mohla být nějaká verze DALL-E 2 otevřena veřejnosti již v létě 2022. Zdůrazňuje, že bere vážně zodpovědnost a chce postupovat opatrně. Na druhou stranu ale dodává: „Pochopitelně už tu máme nějakou dobu Photoshop a víme tedy, že s obrázky se dá manipulovat, ať už v dobrém, nebo špatném smyslu.“

V čem zůstane lidská tvorba výjimečná?

Co bude následovat dále? Vodítko nám může poskytnout nedávná historie jiné neuronové sítě, kterou společnost OpenAI vyvinula. Jejich generátor textu GPT-3 byl poprvé představen v létě 2020. O rok později už byl systém využit k vytvoření dalšího produktu (Codex pro programování dle zadání) nyní je generování textu pomocí betaverze GPT-3 dostupné prakticky komukoli na základě ceníkové sazby. Zároveň se objevila celá řada konkurenčních textových modelů, které se u GPT-3 inspirovaly, ale využily při trénování své sítě jiná data. Ten asi zatím největší model zveřejnil Facebook počátkem května 2022: „Sdílením OPT-175B chceme přispět k rozvoji výzkumu v oblasti odpovědného vývoje velkých jazykových modelů a být příkladem hodnot transparentnosti a otevřenosti v tomto oboru.“

Je tedy velmi pravděpodobné, že dříve či později se budeme ve veřejném prostoru setkávat s obrazy, které „namaloval“ počítač. Ať už to bude DALL-E 2, Nvidia GauGAN, nebo nějaká dosud neznámá konkurenční síť, kreativní počítač už je zkrátka realita.

„Myslím, že brzy bude nemožné poznat, co dělal člověk a co umělá inteligence,“ obává se Vladimír Strejček. „Snažím se zoufale věřit, že člověk je božsky unikátní, že vždy najde cestu, jak se dostat nějak dál než umělá inteligence. Toužím, aby to tak bylo.“

Foto: samaltman.com

„Robot kreslí ruku,“ kresba vytvořená „robotem“ DALL-E 2.

„Člověk v sobě má jedinečnou osobnost, ale to je také zároveň naším omezením,“ uvědomuje si Strejček. Počítač se neunaví, může generovat miliony a miliony obrázků přesně dle přání zadavatele a výsledek bude opět neúnavně a bez prodlení upravovat. Co se týče produktivity, nebude se s ním moci žádný umělec měřit.

Počítač se za svoje dílo nemůže postavit. Člověk tvoří na základě svých zkušeností.
Matěj Forman, umělec

Jistě se najdou lidé, kteří budou právě v této záplavě strojově generovaných obrazů požadovat lidské dílo. Podobně, jako jsme ochotni připlatit za večeři od slavného šéfkuchaře nebo si ceníme ručně ušitý oblek, budou možná bohatí lidé vyhledávat obrazy doplněné důkazem o tom, že je namaloval člověk.

Jak funguje neuronová síť

Strojové učení funguje na principu analýzy velkého množství dat a umožňuje tak nový přístup k řešení problému. Počítačové programy jsou sadou instrukcí a podle těchto instrukcí zpracovávají předložená data. Strojové učení sice také běží pomocí následování instrukcí, tvorba těchto instrukcí ale probíhá úplně jinak. Než aby programátor počítači napsal veškeré pokyny pro všechny eventuality jednotlivě, tak naprogramuje způsob, kterým se počítač sám učí na „trénovacích“ datech. Trénování probíhá pomocí sítí samostatných programů, tzv. umělých neuronů, proto se systému říká neuronová síť.

Obecně fungují umělé neuronové sítě dlouhým opakováním procesu učení a neustálým laděním ohromného množství parametrů. Ty neurony, které napovídaly správnou možnost, budou posíleny a příště budou hrát v rozhodování větší roli. Čím rozsáhlejší a kvalitnější jsou vstupní data, tím lepší může být výsledek.

Poptávka po „hand-made“ umění sice uživí několik desítek tisíc umělců-celebrit, ale moc to nepomůže těm dalším milionům malířů, grafiků, designérů a ilustrátorů. Těm neuronové sítě radikálně promění živobytí.

A hlavně to neodpovídá na tu filosofickou otázku: Mohou lidé v umění nadále nabídnout něco, co počítač nabídnout nemůže?

Smrt hraje v náš prospěch

Klíčem k lidské jedinečnosti zjevně není fantazie. Ta počítačová „představivost“ je totiž, jak se zdá, přinejmenším v některých ohledech plně srovnatelná s tou lidskou. Navíc se počítač neunaví, nebude zadavatelům odmlouvat, vygeneruje vše, co si budou přát.

Možná právě v této lidské omezenosti můžeme hledat nějaké ryze lidské výhody. „Počítač nemá vlastní prožitky. Když neuronová síť píše, tak vychází z věcí, které už někdo napsal. Pro mne je dost podstatné, že spisovatel píše na základě svých zkušeností,“ nabízí svůj pohled Matěj Forman. „Píše to konkrétní autor, používá reálné zkušenosti a vjemy. Umělá inteligence v tomto směru nemůže nic nabídnout. Nic neprožila, jen kombinuje prožitky jiných.“

„Počítač se za to svoje dílo nemůže postavit. Člověk se za svoje dílo musí postavit, pokud to myslí vážně,“ zdůrazňuje Forman. Člověk věnoval tvorbě nezpochybnitelný kus svého života.

Když jsem nechal neuronovou síť GPT-3 vygenerovat článek na téma „počítač generuje umění, co na to umělci“, trvalo jí to necelých pět sekund. Výsledek byl překvapivě dobrý. Dokonce byli v článku citováni tři čeští umělci. „Říkali“ naprosto rozumné věci. Problém je, že ani jeden z nich neexistoval. Zato já, redaktor z masa a kostí, musel volat umělcům z masa a kostí a obtěžovat je otázkami, na které oni na základě svých reálných zkušeností odpověděli. Kdybych je citoval špatně, vědí, na koho si mají stěžovat. Pak jsem to musel přepsat, pročíst, srovnat s tím, co o službě říkají vývojáři a zahraniční odborníci. Dva týdny jsem o tématu přemýšlel a diskutoval jsem o něm s kýmkoli, kdo na to měl náladu. Protože mne téma fascinuje, rozhodl jsem se mu věnovat kus života. Pod takový článek se rád podepíšu.

Podobné je to s výtvarným uměním. Když se umělec rozhodne věnovat čas nějakému tématu, samo o sobě to zvyšuje můj zájem o to téma. Právě tím časem, který tvorbě intenzivně věnuje, dává sdělení hlubší naléhavost. „Tohle je důležité, tomuto jsem věnoval svou soustředěnou pozornost, kus svého pozemského života, a tak si to zaslouží i váš pohled,“ jakoby říkal rukou namalovaný obraz. Část „aury“ díla je právě v úsilí, které mu konkrétní člověk věnoval.

Měli bychom začít využívat toho, v čem máme jako lidé výhodu, a ne se snažit porazit počítač v jeho silných stránkách. Ostatně nikdo neříká, že ke své autorské tvorbě lidé nebudou v budoucnu využívat nějaké nové nástroje. Třeba i neuronové sítě. Důležité ale bude jejich poslední slovo. A lidský podpis.

Neuronová síť může vygenerovat neomezené množství obrázků a textů. Lidé ne. Náš život není nekonečný. Jsme svázáni materiálním světem. Smrt nám znemožňuje vyzkoušet si nezávazně miliardu různých možností. A to dává těm možnostem, které ve svém životě zvolíme, skutečnou váhu.

Doporučované