Článek
Neuronové sítě umí „kouzlit“ s obrázky. Za poslední rok urazily ohromný kus cesty a generování obrázků pomocí nástrojů jako Midjourney nebo Stable Diffusion je dnes pro řadu lidí nejen podivným koníčkem, ale i součástí běžné práce.
Co umí generátory obrázků
Neuronové sítě pro generování obrázků – například Midjourney, DALL-E nebo Stable Diffusion – jsou natrénované na miliardách popsaných obrázků. Síť si díky tomu vytvoří „představu“ o tom, jak vypadají obrázky, které odpovídají jednotlivým slovům i jejich kombinaci.
Nové verze těchto nástrojů už jsou schopné vytvářet komplexní a velmi realisticky vypadající snímky, které jsou prakticky k nerozeznání od skutečných fotografií. V tomto článku jsme podrobně popsali, jak používat oblíbenou službu Midjourney:
Na vlnu generativní umělé inteligence naskočil i populární profesionální grafický nástroj Photoshop. Jeho nejnovější betaverze umožňuje rychlé a kreativní úpravy fotek, kdy za pár sekund můžete nechat počítač, aby „domyslel“ nové detaily fotky nebo celé nové části fotky. Ukázky najdete v našem článku:
Ukázat dětem takové generátory může být zábavné, ale také matoucí. Není totiž na první pohled jasné, jak se tyto „na míru vytvořené snímky“ liší řekněme od rychlého vyhledávání obrázků na internetu.
Nabízíme proto jednoduchý nápad na společnou hru, která pomůže lépe osvětlit, jak vlastně tyto generátory fungují.
Potřebovat k tomu budete fotoaparát (stačí ten v mobilu), počítač nebo chytrý telefon a nějaké rekvizity a hračky. V podstatě cokoli, co doma najdete, třeba populární stavebnice Lego, Merkur nebo jakékoli jiné „franšízy“, které jsou zrovna u vás doma populární.
Z fotky do fantazie
První krok je jednoduchý a velmi flexibilní. Pořiďte s dětmi nějakou fotku. V této fázi je na vás, abyste výběr trochu usměrnili a pomohli tak dětem pochopit, o co jde. Chceme takový snímek, který lze „předělat“ do něčeho jiného.
Například můžete vyfotit hračky na koberci nebo něco ze stavebnice:
Druhý krok spočívá v nahrání tohoto snímku do nějaké služby, která umí generovat obrázky na základě slovních pokynů. Musíte vybrat takovou, která umí funkci img2img.
Z obrázku do obrázku
Funkce img2img (image to image, z obrázku do obrázku) vám umožní vnutit generátoru obrázků výchozí snímek. Obvykle totiž generování fotek začíná v náhodném šumu. Generátor se snaží v tomto šumu najít ty věci, které po něm chcete, a postupnými úpravami sestavuje výsledný snímek. Pokud nahrajete snímek vlastní, vezme jej generátor jako základ, ze kterého bude při tvorbě vycházet.
Funkci img2img nabízejí například tyto nástroje: Dream Studio, ClipDrop, NightCafe, Fotor a celá řada dalších.
Pro bezplatné vyzkoušení funkce img2img využijeme volně dostupný model Stable Diffusion na platformě Replicate.
Třetím krokem je nastavení parametrů. Obvykle můžete určit, jak moc se má neuronová síť řídit vaší fotkou. Když nastavíte instrukcím prioritu .01, nedáte generátoru prakticky žádný prostor pro vlastní tvorbu. Když nastavíte .99, bude váš snímek téměř úplně ignorovat.
Z našeho autíčka uděláme vozítko putující po pusté krajině planety Mars. Použil jsem následující nastavení:
Parametr | Vysvětlení | Příklad |
prompt | Anglické instrukce, co má počítač nakreslit. | car on mars, photo |
negative_prompt | Čemu se má při generování počítač vyhnout. | weird |
image | Obrázek, ze kterého při img2img vychází. | nahrajte obrázek |
prompt_strength | Jak velkou prioritu mají instrukce (0 až 1, desetinné číslo). | 0.6 |
num_outputs | Kolik obrázků má systém vygenerovat. | 4 |
num_inference_steps | Kolik mezikroků má při generování použít. | 50 |
guidance_scale | Jak silně má trvat na dodržení instrukcí. | 6 |
scheduler | Výběr algoritmu pro „zašumění“ při mezikroku. | DDIM |
Generování trvá několik sekund až minut, podle toho, jak složitý úkol jste zadali. V bezplatném nástroji obvykle nedosáhnete tak dobrých výsledků jako v těch placených, ale na úvodní seznámení je to použitelné.
Tenhle vygenerovaný obrázek rozhodně není nic, co byste si doma pověsili za zeď. Ale je to obvykle dobrý první krok k dalším experimentům.
Pokud vás tyto hrátky chytnou, doporučuji zaplatit si kredity třeba pro již zmíněné Dream Studio, které používá novější verzi modelu Stable Diffusion a výsledky jsou o dost lepší. Dají se tak vytvořit opravdu zajímavé variace. Hrát si můžete s různými styly (octane render, oil painting, comic book, minecraft…) i různými popisy toho, jaké auto má být (fast, futuristic, sci-fi, funny, modern…)
Tady je pár ukázek pro inspiraci:
Co zkusíte vytvořit vy?
Pomáhá, když už při pořizování snímku myslíte na to, že budete později tento snímek používat jako podklad pro generování.
Představte si výsledný snímek a dejte generátoru dostatečné množství podkladových materiálů. Nejvíce záleží na barvách. Můžete tedy třeba přidat oblohu pomocí barevného šátku nebo figurky umístit na koberec, kterým nasimulujete sníh.
Při popisování jsem pak zvolil instrukci „brown monkey and blue cat, in snow, oil painting“, hlavně proto, aby se generátor alespoň trochu trefil do zobrazení postaviček. Do negativního promptu obvykle dávám „weird“ (divné), někdy to pomáhá, jindy ne…
Výhodou Dream Studia je také možnost nastavit poměr stran nebo další podrobné parametry.
Když jednou začnete vnímat svět kolem sebe jako zdroj podkladů pro generování snímků, otevřou se vám úplně nové možnosti. Aktivita tak snadno přesáhne jedno víkendové odpoledne a může se proměnit v dlouhodobý lov zajímavých vizuálních podkladů a jejich následné „neuronové přetváření“ dle zadaných instrukcí (promptů).
Další inspirace pro vaši tvorbu:
Na této aktivitě si také můžete vyzkoušet, co počítačovému „kreativci“ jde a co naopak nezvládá. Velmi dobře umí pracovat s koncepty, ke kterým má dostatek trénovacích dat: olejové malby, fotky, auta apod. Naopak kdybyste chtěli nějaké opravdu konkrétní snímky řekněme českých měst, nejspíše dostanete neuspokojivé výsledky.
O umělé inteligenci se často mluví v kontextu „stroje berou lidem práci“. Toto kreativní cvičení však dětem i dospělým připomíná, že nejzajímavější výsledky vznikají právě sloučením strojové neúnavné a natrénované kreativity s cílevědomou, bláznivou a inspirovanou lidskou fantazií.
Jak dětem vysvětlit umělou inteligenci?
- Zobrazit všechny články seriálu: Hrajeme si s AI
Co je to umělá inteligence? Zní to složitě, ale uvidíte, že to může být užitečné, a dokonce je to i zábava. Umělá inteligence funguje na počítači, ale chová se jinak, než jsme u počítačů zvyklí…
Obvykle počítače jen přesně a poslušně plní nějaké pokyny. Asi jako když ráno vstanete a děláte to, co vždycky. Je sedm hodin – vstávat. Je sedm hodin a pět minut – čistit zuby. Je sedm hodin a deset minut – oblékat. Není žádné místo pro nejistotu. Ale umělá inteligence funguje jinak. Říkáme, že je chytrá, ale přesnější by bylo říct, že je naučená.