Hlavní obsah

Spojte dětskou fantazii s AI. Z kostek udělá umělá inteligence úžasné fotky

Foto: foto: Pavel Kasík, Seznam Zprávy, koláž, AI vizualizace

Neuronové sítě umí „kouzlit“ s obrázky. Využijte je k tvorbě snímků toho, s čím přijde dětská fantazie.

Ukažte dětem, co všechno dokáže strojové učení „vymyslet“. Vyzkoušíme, jak můžeme umělé inteligenci dávat povely nejen pomocí slov, ale také skrze fotky stavebnice nebo mraků. Čím ztřeštěnější nápad, tím zajímavější jsou výsledky.

Článek

Neuronové sítě umí „kouzlit“ s obrázky. Za poslední rok urazily ohromný kus cesty a generování obrázků pomocí nástrojů jako Midjourney nebo Stable Diffusion je dnes pro řadu lidí nejen podivným koníčkem, ale i součástí běžné práce.

Co umí generátory obrázků

Neuronové sítě pro generování obrázků – například Midjourney, DALL-E nebo Stable Diffusion – jsou natrénované na miliardách popsaných obrázků. Síť si díky tomu vytvoří „představu“ o tom, jak vypadají obrázky, které odpovídají jednotlivým slovům i jejich kombinaci.

Nové verze těchto nástrojů už jsou schopné vytvářet komplexní a velmi realisticky vypadající snímky, které jsou prakticky k nerozeznání od skutečných fotografií. V tomto článku jsme podrobně popsali, jak používat oblíbenou službu Midjourney:

Na vlnu generativní umělé inteligence naskočil i populární profesionální grafický nástroj Photoshop. Jeho nejnovější betaverze umožňuje rychlé a kreativní úpravy fotek, kdy za pár sekund můžete nechat počítač, aby „domyslel“ nové detaily fotky nebo celé nové části fotky. Ukázky najdete v našem článku:

Ukázat dětem takové generátory může být zábavné, ale také matoucí. Není totiž na první pohled jasné, jak se tyto „na míru vytvořené snímky“ liší řekněme od rychlého vyhledávání obrázků na internetu.

Nabízíme proto jednoduchý nápad na společnou hru, která pomůže lépe osvětlit, jak vlastně tyto generátory fungují.

Foto: Pavel Kasík, Seznam Zprávy

Vlevo fotka, ze které vycházíme. Vpravo je pak snímek vygenerovaný neuronovou sítí Stable Diffusion na základě našeho obrazového a textového zadání.

Potřebovat k tomu budete fotoaparát (stačí ten v mobilu), počítač nebo chytrý telefon a nějaké rekvizity a hračky. V podstatě cokoli, co doma najdete, třeba populární stavebnice Lego, Merkur nebo jakékoli jiné „franšízy“, které jsou zrovna u vás doma populární.

Z fotky do fantazie

První krok je jednoduchý a velmi flexibilní. Pořiďte s dětmi nějakou fotku. V této fázi je na vás, abyste výběr trochu usměrnili a pomohli tak dětem pochopit, o co jde. Chceme takový snímek, který lze „předělat“ do něčeho jiného.

Například můžete vyfotit hračky na koberci nebo něco ze stavebnice:

Foto: Pavel Kasík, Seznam Zprávy

Autíčko sestavené z kostiček lega

Druhý krok spočívá v nahrání tohoto snímku do nějaké služby, která umí generovat obrázky na základě slovních pokynů. Musíte vybrat takovou, která umí funkci img2img.

Z obrázku do obrázku

Funkce img2img (image to image, z obrázku do obrázku) vám umožní vnutit generátoru obrázků výchozí snímek. Obvykle totiž generování fotek začíná v náhodném šumu. Generátor se snaží v tomto šumu najít ty věci, které po něm chcete, a postupnými úpravami sestavuje výsledný snímek. Pokud nahrajete snímek vlastní, vezme jej generátor jako základ, ze kterého bude při tvorbě vycházet.

Funkci img2img nabízejí například tyto nástroje: Dream Studio, ClipDrop, NightCafe, Fotorcelá řada dalších.

Pro bezplatné vyzkoušení funkce img2img využijeme volně dostupný model Stable Diffusion na platformě Replicate.

Třetím krokem je nastavení parametrů. Obvykle můžete určit, jak moc se má neuronová síť řídit vaší fotkou. Když nastavíte instrukcím prioritu .01, nedáte generátoru prakticky žádný prostor pro vlastní tvorbu. Když nastavíte .99, bude váš snímek téměř úplně ignorovat.

Z našeho autíčka uděláme vozítko putující po pusté krajině planety Mars. Použil jsem následující nastavení:

ParametrVysvětleníPříklad
promptAnglické instrukce, co má počítač nakreslit.car on mars, photo
negative_promptČemu se má při generování počítač vyhnout.weird
imageObrázek, ze kterého při img2img vychází.nahrajte obrázek
prompt_strengthJak velkou prioritu mají instrukce (0 až 1, desetinné číslo).0.6
num_outputsKolik obrázků má systém vygenerovat.4
num_inference_stepsKolik mezikroků má při generování použít.50
guidance_scaleJak silně má trvat na dodržení instrukcí.6
schedulerVýběr algoritmu pro „zašumění“ při mezikroku.DDIM

Generování trvá několik sekund až minut, podle toho, jak složitý úkol jste zadali. V bezplatném nástroji obvykle nedosáhnete tak dobrých výsledků jako v těch placených, ale na úvodní seznámení je to použitelné.

Foto: Pavel Kasík, Seznam Zprávy

Můžete experimentovat s různými nastaveními. Výsledky bývají často vtipné a dobře ukazují sílu i omezení systémů pro generování obrázků.

Tenhle vygenerovaný obrázek rozhodně není nic, co byste si doma pověsili za zeď. Ale je to obvykle dobrý první krok k dalším experimentům.

Pokud vás tyto hrátky chytnou, doporučuji zaplatit si kredity třeba pro již zmíněné Dream Studio, které používá novější verzi modelu Stable Diffusion a výsledky jsou o dost lepší. Dají se tak vytvořit opravdu zajímavé variace. Hrát si můžete s různými styly (octane render, oil painting, comic book, minecraft…) i různými popisy toho, jaké auto má být (fast, futuristic, sci-fi, funny, modern…)

Tady je pár ukázek pro inspiraci:

Co zkusíte vytvořit vy?

Pomáhá, když už při pořizování snímku myslíte na to, že budete později tento snímek používat jako podklad pro generování.

Představte si výsledný snímek a dejte generátoru dostatečné množství podkladových materiálů. Nejvíce záleží na barvách. Můžete tedy třeba přidat oblohu pomocí barevného šátku nebo figurky umístit na koberec, kterým nasimulujete sníh.

Foto: Pavel Kasík, Seznam Zprávy

Dvě figurky, které jsme doma měli po ruce, usazené do vyššího koberce a vyfocené mobilem. Fotku někdy budete muset zmenšit, aby bylo možné ji nahrát ke zpracování.

Při popisování jsem pak zvolil instrukci „brown monkey and blue cat, in snow, oil painting“, hlavně proto, aby se generátor alespoň trochu trefil do zobrazení postaviček. Do negativního promptu obvykle dávám „weird“ (divné), někdy to pomáhá, jindy ne…

Foto: Pavel Kasík, Seznam Zprávy

Dream Studio od firmy Stability AI.

Výhodou Dream Studia je také možnost nastavit poměr stran nebo další podrobné parametry.

Foto: Pavel Kasík, Seznam Zprávy

Je potřeba dát velký důraz podkladovému obrázku (zde 77 %).

Když jednou začnete vnímat svět kolem sebe jako zdroj podkladů pro generování snímků, otevřou se vám úplně nové možnosti. Aktivita tak snadno přesáhne jedno víkendové odpoledne a může se proměnit v dlouhodobý lov zajímavých vizuálních podkladů a jejich následné „neuronové přetváření“ dle zadaných instrukcí (promptů).

Další inspirace pro vaši tvorbu:

Na této aktivitě si také můžete vyzkoušet, co počítačovému „kreativci“ jde a co naopak nezvládá. Velmi dobře umí pracovat s koncepty, ke kterým má dostatek trénovacích dat: olejové malby, fotky, auta apod. Naopak kdybyste chtěli nějaké opravdu konkrétní snímky řekněme českých měst, nejspíše dostanete neuspokojivé výsledky.

O umělé inteligenci se často mluví v kontextu „stroje berou lidem práci“. Toto kreativní cvičení však dětem i dospělým připomíná, že nejzajímavější výsledky vznikají právě sloučením strojové neúnavné a natrénované kreativity s cílevědomou, bláznivou a  inspirovanou lidskou fantazií.

Jak dětem vysvětlit umělou inteligenci?

Co je to umělá inteligence? Zní to složitě, ale uvidíte, že to může být užitečné, a dokonce je to i zábava. Umělá inteligence funguje na počítači, ale chová se jinak, než jsme u počítačů zvyklí…

Co je to umělá inteligence? Vysvětlení pro děti.Video: Pavel Kasík, Seznam Zprávy

Obvykle počítače jen přesně a poslušně plní nějaké pokyny. Asi jako když ráno vstanete a děláte to, co vždycky. Je sedm hodin – vstávat. Je sedm hodin a pět minut – čistit zuby. Je sedm hodin a deset minut – oblékat. Není žádné místo pro nejistotu. Ale umělá inteligence funguje jinak. Říkáme, že je chytrá, ale přesnější by bylo říct, že je naučená.

Doporučované