Článek
Po celá tisíciletí platilo, že krásný obraz byl výsledkem talentu a píle. Umělec pečlivě nanášel namíchané barvy na papír či plátno. Za několik hodin nebo dní byl na světě obraz. Pak přišel fotoaparát a významně rozšířil počet lidí, kteří dokázali něco vytvořit. V době všudypřítomných mobilních telefonů pak může obrázek „cvaknout“ prakticky kdokoli.
Dnešní děti ale vyrůstají do světa, kde obraz nemusí mít nic společného ani s umělcem, ani s realitou.
Generátory obrázků, které jsou založené na neuronových sítích, umí na základě pokynů sestavit neuvěřitelně detailní a „promyšlené“ výtvory.
Co umí generátory obrázků?
Neuronové sítě pro generování obrázků jsou natrénované na miliardách popsaných obrázků. Síť si díky tomu vytvoří „představu“ o tom, jak vypadají obrázky, které odpovídají jednotlivým slovům i jejich kombinaci.
Nové verze těchto nástrojů už jsou schopné vytvářet komplexní a velmi realisticky vypadající snímky, které jsou prakticky k nerozeznání od skutečných fotografií. V tomto článku jsme podrobně popsali, jak používat oblíbenou službu Midjourney:
V našem prázdninovém seriálu Hrajeme si s AI už jsme na generátory jednou narazili. Ukázali jsme si, jak neuronové sítě mohou použít vaši fotku jako základ a předělat ji v něco jiného (tzv. img2img ). Dnes si ukážeme, jak využít nástroje generativní AI pro tvorbu všemožných obrázků, které napodobují různé styly. A můžeme tak třeba opatřit ilustracemi naši pohádku vygenerovanou pomocí ChatGPT.
Co bude na obrázku?
Abychom pochopili, co od generátorů můžeme čekat, podíváme se na to, jak fungují. Napřed trocha nudné teorie pro vás dospělé. A pak si to vyzkoušíme v praxi, čímž nejlépe odhalíme, zda jsme správně pochopili silné a slabé stránky těchto kreativních neuronových sítí.
Jak funguje generátor obrázků?
Jak vlastně počítačová síť obrázek vytváří? Úplně jinak než malíř. Ten totiž štětcem postupně nanáší barvy na místa, kde je chce mít, a nejspíše má v hlavě nějakou představu toho, co na obrázku bude.
Generátor postupuje jinak. Jsou v něm, zjednodušeně řečeno, dvě neuronové sítě: Tvůrce a Kritik. Tvůrce začíná s hromadou šumu. Mnohokrát tento šum poupraví a pošle Kritikovi. Kritik posoudí, jestli se aspoň podobá tomu, co má nakreslit.
Takže generátory svoje znalosti světa získaly studiem velkého množství existujících obrazů a fotek. Můžeme si to hned vyzkoušet. Dáme napřed generátoru nějaký nesmírně jednoduchý úkol. Něco, co měl v trénovacích datech třeba milionkrát:
Vidíme, že když má neuronová síť hodně dat, snadno dosahuje přesvědčivých výsledků. Zkuste naopak s dětmi vygenerovat něco, co v databázi téměř určitě nebylo. Nechte si nakreslit třeba dům ve vaší ulici. Nebo nějakého vašeho příbuzného (pokud to tedy není známý herec či politička). Uvidíte, že to nejspíše nevyjde. A pokaždé, když najdeme něco, co nefunguje, naučíme se více o schopnostech daného modelu a k čemu jej lze použít.
Generátor si obvykle celkem dobře poradí s kombinacemi více objektů a prostředí. Schválně zkuste, jaké zajímavé, vtipné a překvapivé nesmysly s dětmi vymyslíte. Mě nevím proč napadl „stan ze salátu uprostřed pouště“.
Když vám dojdou nápady, zeptejte se třeba nějakého chatbotu, aby vám nějaké vtipné kombinace navrhl…
A konečně můžete zkusit generátor zmást nějakými opravdu komplikovanými kombinacemi. Něco, co nikdy nemohl vidět a v čem se úplně ztratí. Potíže mívá třeba s tím, když má udržet přesný počet lidí nebo když má více atributů rozdělit mezi více objektů.
Nepřeberné množství stylů
Kromě toho, že si můžete nadiktovat, co nakreslit, máte také možnost požádat o konkrétní prostředí, barvy, materiály, malířské techniky nebo vizuální styly.
Klasické počítačové programy, na které jsme byli zvyklí, měli nějaké předem dané funkce. Mohli jste si koupit knížku nebo postupně proklikat celou nabídku nástrojů a s těmito funkcemi se obeznámit. Ale nové nástroje využívající AI jsou jiné. Mají svým způsobem „neomezené množství funkcí“. Jinak řečeno: Nikdo, ani jejich tvůrci, pořádně neví, co všechno pomocí nich jde udělat.
Který generátor použít?
Bing Chat má v sobě zabudovaný generátor DALL-E. Je to asi nejjednodušší cesta k poměrně kvalitním výsledkům, navíc si poradí s českými instrukcemi. Nemůžete ale nastavit žádné parametry. (Je potřeba registrace a prohlížeč Edge.)
Midjourney platí za nejlepší generátor současnosti pro většinu potřeb. Ovládání jsme popsali v tomto článku. Je potřeba zaplatit předplatné.
DreamStudio je další placená služba, využívá službu Stable Diffusion. Zdarma můžete generátor Stable Diffusion vyzkoušet na HuggingFace (verze SDXL 1.0 zde).
Adobe Firefly nabízí kromě samostatného webu i generování přímo ve Photoshopu (vyžaduje předplatné).
Pomocí vhodně zvolených textových instrukcí z nich dostanete neuvěřitelně různorodé obrázky na stejné téma. V našem případě to je „veselá optimistická veverka, veverka na trampolíně“.
Pomocí Midjourney jsem ji postupně vygeneroval ve dvanácti různých stylech:
Důležité je, že jsem nevybíral z nějakých předem naprogramovaných stylů. Styly jsem si někdy vymyslel, jindy odkoukal u ostatních nebo odhadl. Můžete také kombinovat existující styly. Jak by si třeba poradil Alfons Mucha s tvorbou ve stylu počítačových her?
Právě kombinace stylů vás mohou zabavit na opravdu dlouhou dobu. Navíc to pro vás a vaše děti může být skvělá záminka k prostudování různých uměleckých technik a směrů.
Pochlubte se v diskuzi, jaké výtvory se vám podařilo s dětmi vygenerovat. A co jste se při tom naučili o minulosti a budoucnosti vizuálního umění…
Jak dětem vysvětlit umělou inteligenci?
- Zobrazit všechny články seriálu: Hrajeme si s AI
Co je to umělá inteligence? Zní to složitě, ale uvidíte, že to může být užitečné, a dokonce je to i zábava. Umělá inteligence funguje na počítači, ale chová se jinak, než jsme u počítačů zvyklí…
Obvykle počítače jen přesně a poslušně plní nějaké pokyny. Asi jako když ráno vstanete a děláte to, co vždycky. Je sedm hodin – vstávat. Je sedm hodin a pět minut – čistit zuby. Je sedm hodin a deset minut – oblékat. Není žádné místo pro nejistotu. Ale umělá inteligence funguje jinak. Říkáme, že je chytrá, ale přesnější by bylo říct, že je naučená.