Hlavní obsah

Už nepoznáte, co vytvořila umělá fantazie. Naučte se generovat úplně cokoli

Foto: koláž: Pavel Kasík, Seznam Zprávy

Pátá verze Midjourney (vpravo) dává realističtější výsledky a je méně náchylná vyrábět šílené ruce než verze čtvrtá (vlevo).

aktualizováno •

Obrázky vygenerované pomocí služby Midjourney uchvacují svět. Na první pohled opravdové fotky jsou totiž s příchodem páté generace systému ještě kvalitnější. Naučíme vás, jak si takový obrázek vytvořit.

Článek

Obrázky generované umělou inteligencí zaplavují internet. Nová verze služby Midjourney se dostala do popředí virálními „falešnými snímky“ papeže Františka a zatýkaného prezidenta Trumpa. Řada lidí byla zaskočena tím, jak realistické tyto fotomontáže byly.

Ještě překvapivější ale může být, jak snadné je takové snímky vytvořit. Není k tomu už totiž potřeba tolik trpělivosti a experimentování, jako tomu bylo dříve. Třeba na replikaci fotky „papeže v bílé prošívané bundě“ nám stačila jedna minuta a velmi stručná instrukce.

Foto: koláž: Pavel Kasík, Seznam Zprávy

Vlevo virální snímek „papeže v prošívané bundě“, vpravo náš vygenerovaný snímek. Stačila stručná instrukce „pope francis wearing a white puffer coat –v 5 –ar 9:16“ (o parametrech budeme psát dále v článku).

Pojďme se tedy podívat na to, co všechno můžete v nové Midjourney vytvořit.

Realistické fotografie a ruce s pěti prsty

Kdo někdy pracoval na pile nebo generoval obrázky v Midjourney, umí si vážit lidských rukou, na kterých je pět nepokroucených prstů. Předchozí čtvrtá verze totiž často vyprodukovala otřesně vypadající – i když někdy docela vtipné – dlaně a prsty.

Foto: Pavel Kasík, Seznam Zprávy

Midjourney ve verzi 4. Instrukce zněly: „Detail of hand, photo of a young woman, beautiful indie girl, glasses, waving, open hand, open palm…“

Pokud dáme stejné zadání páté verzi, vidíme jednoznačný pokrok v realistickém zobrazení nejen prstů, ale celé fotografie. U dlaní je to ale nejnápadnější. Pořád sice občas dojde k nějakým defektům (viz šest prstů na levé ruce u snímku níže), ale pokrok je nepopiratelný.

Foto: Pavel Kasík, Seznam Zprávy

Midjourney verze 5 dostala stejné instrukce: „Detail of hand, photo of a young woman, beautiful indie girl, glasses, waving, open hand, open palm…“

Už čtvrtá verze (o které jsme psali minulý rok) uměla generovat nádherné snímky. Její nástupkyně, uvedená v polovině letošního března, ale překonala i mnohá optimistická očekávání. „Tento model má velmi vysokou koherenci, vyniká v interpretaci výzev v přirozeném jazyce, má vyšší rozlišení a podporuje pokročilé funkce,“ píše k tomu provozovatel služby.

Podívejte se na další výtvory, které jsme vygenerovali pomocí Midjourney verze 5. U každého snímku najdete i instrukce, které jsme použili.

+12

Jak vidíte, pestrost výsledků je ohromná a fantazii se meze nekladou. Rozlišení je navíc obvykle dostatečné pro většinu digitálních použití.

Jak využít verzi číslo pět

Méně příjemné je, že Midjourney (údajně pouze dočasně) zrušil možnost bezplatného používání: „Vzhledem ke kombinaci mimořádné poptávky a zneužívání zkušebních verzí dočasně vypínáme bezplatné verze, dokud nebudou nasazena další vylepšení systému,“ uvedl David Holz, šéf Midjourney.

Midjourney a Discord

Podrobný návod, jak začít používat Midjourney, najdete v našem předchozím návodu:

Stále platí, že musíte s Midjourney komunikovat prostřednictvím diskuzní platformy Discord. Pokud nechcete pracovat ve veřejné místnosti, můžete si snadno založit svůj vlastní Discord server a robota Midjourney Bot tam pozvat.

Za generování tedy nyní zaplatíte minimálně 10 dolarů měsíčně (základní plán), zatímco profesionální plán s možností rychlejšího generování stojí tři- až šestkrát tolik.

Jak aktivovat pátou verzi Midjourney

Při psaní instrukce (promptu) postupujte stejně jako nyní. Příkazem /imagine uveďte instrukce pro robota Midjourney Bot.

Pro aktivaci verze pět doplňte frázi –v 5 (spojovník, spojovník, písmeno v, mezera, číslo pět).

Případně můžete verzi pět napevno nastavit jako svou výchozí pomocí příkazu /settings.

Foto: Anna Unčovská

Můžete kromě verze zaškrtnout také další nastavení, třeba rychlost, kvalitu nebo další kreativní režimy.

Jde to i jednoduše

Kdo chce, může si hrát s různými dlouhými instrukcemi. Dokonce můžete požádat nástroje založené na velkých jazykových modelech, aby vám poradily s instrukcemi.

Foto: Pavel Kasík, Seznam Zprávy

Instrukce vygenerované přes ChatGPT.

Nezapomeňte dodat parametry dle svých požadavků, třeba –v 5 pro použití nové verze a –ar 3:2 pro klasický formát fotky. Když takovými instrukcemi nakrmíte Midjourney, můžete se dočkat zajímavých výsledků s minimálním vynaloženým úsilím.

Foto: Pavel Kasík, Seznam Zprávy

Midjourney vygenerovala tento snímek na základě promptu sestaveného skrze ChatGPT.

Stojí za to poznamenat, že ChatGPT nemá žádný „tajný“ klíč na to, jak z Midjourney dostat dobré výsledky. Jen umí používat deskriptivní jazyk a neunaví se při detailním popisování scény, což je pro lidi často vyčerpávající.

Na druhou stranu, kdo říká, že jsou potřeba desítky řádků? Někdy nejsou k zajímavému výsledku vůbec potřeba slova… Stačí emotikon.

Foto: Anna Unčovská

Jako instrukce pro tuto „fotku“ posloužil emotikon reprezentující vlka: 🐺

Jako instrukci můžete dát i obrázek

Novou funkcí Midjourney je příkaz /describe. Je to vlastně generování obrázků naruby. Můžete službě poslat libovolný obrázek a systém vygeneruje až směšně podrobné instrukce.

Foto: Pavel Kasík, Seznam Zprávy

Midjourney napsal instrukce na základě vloženého obrázku.

Tyto instrukce pak můžete rovnou použít pro tvorbu vlastních obrázků a jejich variant, případně je využít jako inspiraci pro vlastní instrukce a prompty.

Foto: Pavel Kasík, Seznam Zprávy

Vidíte, že výsledek není úplně stejný, ale může posloužit jako inspirace při hledání konkrétního stylu.

Připomeňme, že můžete také použít obrázek přímo jako součást instrukcí. Nebo dokonce zkombinovat více obrázků do jednoho pomocí příkazu /blend (nebo skrze vložení URL jednoho či více obrázků). Je to docela alchymie, výsledky jsou často neintuitivní a divné. A občas nečekaně nádherné.

Zvláště pokud si chcete vyzkoušet různé styly a jejich kombinace, mohou být právě „obrázkové prompty“ tou nejjednodušší cestou.

Foto: Midjourney

Ukázka kombinace dvou obrázků pomocí funkce „míchání“ obrázků.

Na druhou stranu, pokud čekáte, že obrázkový prompt zachová třeba původní obličej, tak budete zklamaní.

Foto: Pavel Kasík, Seznam Zprávy

Vlevo zadání pomocí obrázku a instrukcí: „usmívající se muž, středověký písař, dívá se do fotoaparátu, ve staré rozlehlé knihovně, drží brk na psaní, realistická olejomalba, styl Édouarda Maneta, styl Da Vinciho“. Je vidět, že podoba obličeje je zachována jen přibližně.

Systém si z fotky „něco“ vezme, ale třeba zrovna u obličejů to bude maximálně vzdálená podoba. Pokud chcete generovat fotky sebe sama, nebo jiného konkrétního člověka, můžete zkusit vytrénovat vlastní model či vyzkoušet nějakou k tomu určenou službu. V Midjourney také můžete experimentovat s různým nastavením „váhy“ a laděním variant.

Přehled parametrů Midjourney

ParametrPopisPříklad
--version, --vZvolit verzi Midjourney--v 5
--aspect, --arPožadovaný poměr stran--ar 16:9
--noCo na obrázku být nemá--no clouds
--stylize, --sJak moc stylizovat?--stylize 750
--chaos, --cJak „divoký" chcete výsledek--chaos 50
--tileObrázek vhodný jako textura--tile
::Oddělení konceptůhot :: dog
::2Váha předchozí části promptuhot::2 dog::1
--iwVáha obrázkového promptu--iw 2

Midjourney verze 5 má k dokonalosti rozhodně daleko. Chybí možnost konzistentní práce s více subjekty na snímku a není vůbec jednoduché se skrze instrukce dostat třeba k fotografii celé postavy. Konkurenční nástroje experimentují například s technikou ControlNet, která umožňuje přesnější ovlivnění výsledku. Celkově vzato ale výsledky z Midjourney pořád platí za nejlepší.

Už nyní je jasné, že tento návod celkem rychle zastará. V dalších verzích zřejmě budou možné věci, které dnes Midjourney nezvládá. Třeba náhradu konkrétní části obrázku (to umí DALL-E a starší verze Dream Studia), rozšíření obrázku nebo vkládání textu do obrazu.

Kdo má na vygenerovaný snímek autorská práva?

Provozovatelé Midjourney dávají platícím uživatelům všechna práva k jejich snímkům: „Vlastníte veškerý obsah, který vytvoříte pomocí služby, v rozsahu, v jakém je to možné podle platných právních předpisů.“ Z pohledu provozovatele tedy můžete použít vygenerované snímky, jak uznáte za vhodné, a jste držitelem autorských práv.

V současnosti se nicméně vedou právní spory ohledně toho, zda používání Midjourney neporušuje práva autorů snímků, na kterých se tato síť trénovala. Tvůrci Midjourney a Stable Diffusion v současnosti čelí žalobě. Odborníci na autorské právo upozorňují, že jde o zatím nedořešený problém.

Každopádně všechny loňské poučky o tom, jak na internetu rozpoznat vygenerované snímky, s nástupem Midjourney verze pět dostávají značnou trhlinu. Musíme si zvyknout, že takovéto „fotografie“ ve skutečnosti nejsou fotografiemi. Bude zajímavé sledovat, co to udělá s naší (už tako narušenou) důvěrou ve fotografie obecně.

Foto: Anna Unčovská

Instrukce: photography stunning girl in colorful swimsuit, portrait, commercial photography, best photographers, award winning photography, extremely detailed, insanely sharp details, highly retouch, cinematic lighting, 8k, 4k, happy, feels good, positive –upbeta –v 5 –q 2 –s 750

Anketa

Poznali byste, že tento snímek je vygenerovaný počítačem?
rozhodně to poznám
5,3 %
spíše to poznám
13,8 %
spíše to nepoznám
24,5 %
rozhodně to nepoznám
56,4 %
Celkem hlasovalo 1374 čtenářů.

Aktualizace a oprava: V článku jsme opravili překlep u příkazu /describe. Doplnili jsme informace o autorských právech.

Doporučované