Článek
Obrázky generované umělou inteligencí zaplavují internet. Nová verze služby Midjourney se dostala do popředí virálními „falešnými snímky“ papeže Františka a zatýkaného prezidenta Trumpa. Řada lidí byla zaskočena tím, jak realistické tyto fotomontáže byly.
Ještě překvapivější ale může být, jak snadné je takové snímky vytvořit. Není k tomu už totiž potřeba tolik trpělivosti a experimentování, jako tomu bylo dříve. Třeba na replikaci fotky „papeže v bílé prošívané bundě“ nám stačila jedna minuta a velmi stručná instrukce.

Vlevo virální snímek „papeže v prošívané bundě“, vpravo náš vygenerovaný snímek. Stačila stručná instrukce „pope francis wearing a white puffer coat –v 5 –ar 9:16“ (o parametrech budeme psát dále v článku).
Pojďme se tedy podívat na to, co všechno můžete v nové Midjourney vytvořit.
Realistické fotografie a ruce s pěti prsty
Kdo někdy pracoval na pile nebo generoval obrázky v Midjourney, umí si vážit lidských rukou, na kterých je pět nepokroucených prstů. Předchozí čtvrtá verze totiž často vyprodukovala otřesně vypadající – i když někdy docela vtipné – dlaně a prsty.

Midjourney ve verzi 4. Instrukce zněly: „Detail of hand, photo of a young woman, beautiful indie girl, glasses, waving, open hand, open palm…“
Pokud dáme stejné zadání páté verzi, vidíme jednoznačný pokrok v realistickém zobrazení nejen prstů, ale celé fotografie. U dlaní je to ale nejnápadnější. Pořád sice občas dojde k nějakým defektům (viz šest prstů na levé ruce u snímku níže), ale pokrok je nepopiratelný.

Midjourney verze 5 dostala stejné instrukce: „Detail of hand, photo of a young woman, beautiful indie girl, glasses, waving, open hand, open palm…“
Už čtvrtá verze (o které jsme psali minulý rok) uměla generovat nádherné snímky. Její nástupkyně, uvedená v polovině letošního března, ale překonala i mnohá optimistická očekávání. „Tento model má velmi vysokou koherenci, vyniká v interpretaci výzev v přirozeném jazyce, má vyšší rozlišení a podporuje pokročilé funkce,“ píše k tomu provozovatel služby.
Podívejte se na další výtvory, které jsme vygenerovali pomocí Midjourney verze 5. U každého snímku najdete i instrukce, které jsme použili.
Jak vidíte, pestrost výsledků je ohromná a fantazii se meze nekladou. Rozlišení je navíc obvykle dostatečné pro většinu digitálních použití.
Jak využít verzi číslo pět
Méně příjemné je, že Midjourney (údajně pouze dočasně) zrušil možnost bezplatného používání: „Vzhledem ke kombinaci mimořádné poptávky a zneužívání zkušebních verzí dočasně vypínáme bezplatné verze, dokud nebudou nasazena další vylepšení systému,“ uvedl David Holz, šéf Midjourney.
Midjourney a Discord
Podrobný návod, jak začít používat Midjourney, najdete v našem předchozím návodu:
Stále platí, že musíte s Midjourney komunikovat prostřednictvím diskuzní platformy Discord. Pokud nechcete pracovat ve veřejné místnosti, můžete si snadno založit svůj vlastní Discord server a robota Midjourney Bot tam pozvat.
Za generování tedy nyní zaplatíte minimálně 10 dolarů měsíčně (základní plán), zatímco profesionální plán s možností rychlejšího generování stojí tři- až šestkrát tolik.
Jak aktivovat pátou verzi Midjourney
Při psaní instrukce (promptu) postupujte stejně jako nyní. Příkazem /imagine uveďte instrukce pro robota Midjourney Bot.
Pro aktivaci verze pět doplňte frázi –v 5 (spojovník, spojovník, písmeno v, mezera, číslo pět).
Případně můžete verzi pět napevno nastavit jako svou výchozí pomocí příkazu /settings.

Můžete kromě verze zaškrtnout také další nastavení, třeba rychlost, kvalitu nebo další kreativní režimy.
Jde to i jednoduše
Kdo chce, může si hrát s různými dlouhými instrukcemi. Dokonce můžete požádat nástroje založené na velkých jazykových modelech, aby vám poradily s instrukcemi.

Instrukce vygenerované přes ChatGPT.
Nezapomeňte dodat parametry dle svých požadavků, třeba –v 5 pro použití nové verze a –ar 3:2 pro klasický formát fotky. Když takovými instrukcemi nakrmíte Midjourney, můžete se dočkat zajímavých výsledků s minimálním vynaloženým úsilím.

Midjourney vygenerovala tento snímek na základě promptu sestaveného skrze ChatGPT.
Stojí za to poznamenat, že ChatGPT nemá žádný „tajný“ klíč na to, jak z Midjourney dostat dobré výsledky. Jen umí používat deskriptivní jazyk a neunaví se při detailním popisování scény, což je pro lidi často vyčerpávající.
Na druhou stranu, kdo říká, že jsou potřeba desítky řádků? Někdy nejsou k zajímavému výsledku vůbec potřeba slova… Stačí emotikon.

Jako instrukce pro tuto „fotku“ posloužil emotikon reprezentující vlka: 🐺
Jako instrukci můžete dát i obrázek
Novou funkcí Midjourney je příkaz /describe. Je to vlastně generování obrázků naruby. Můžete službě poslat libovolný obrázek a systém vygeneruje až směšně podrobné instrukce.

Midjourney napsal instrukce na základě vloženého obrázku.
Tyto instrukce pak můžete rovnou použít pro tvorbu vlastních obrázků a jejich variant, případně je využít jako inspiraci pro vlastní instrukce a prompty.

Vidíte, že výsledek není úplně stejný, ale může posloužit jako inspirace při hledání konkrétního stylu.
Připomeňme, že můžete také použít obrázek přímo jako součást instrukcí. Nebo dokonce zkombinovat více obrázků do jednoho pomocí příkazu /blend (nebo skrze vložení URL jednoho či více obrázků). Je to docela alchymie, výsledky jsou často neintuitivní a divné. A občas nečekaně nádherné.
Zvláště pokud si chcete vyzkoušet různé styly a jejich kombinace, mohou být právě „obrázkové prompty“ tou nejjednodušší cestou.

Ukázka kombinace dvou obrázků pomocí funkce „míchání“ obrázků.
Na druhou stranu, pokud čekáte, že obrázkový prompt zachová třeba původní obličej, tak budete zklamaní.

Vlevo zadání pomocí obrázku a instrukcí: „usmívající se muž, středověký písař, dívá se do fotoaparátu, ve staré rozlehlé knihovně, drží brk na psaní, realistická olejomalba, styl Édouarda Maneta, styl Da Vinciho“. Je vidět, že podoba obličeje je zachována jen přibližně.
Systém si z fotky „něco“ vezme, ale třeba zrovna u obličejů to bude maximálně vzdálená podoba. Pokud chcete generovat fotky sebe sama, nebo jiného konkrétního člověka, můžete zkusit vytrénovat vlastní model či vyzkoušet nějakou k tomu určenou službu. V Midjourney také můžete experimentovat s různým nastavením „váhy“ a laděním variant.
Přehled parametrů Midjourney
Parametr | Popis | Příklad |
---|---|---|
--version, --v | Zvolit verzi Midjourney | --v 5 |
--aspect, --ar | Požadovaný poměr stran | --ar 16:9 |
--no | Co na obrázku být nemá | --no clouds |
--stylize, --s | Jak moc stylizovat? | --stylize 750 |
--chaos, --c | Jak „divoký" chcete výsledek | --chaos 50 |
--tile | Obrázek vhodný jako textura | --tile |
:: | Oddělení konceptů | hot :: dog |
::2 | Váha předchozí části promptu | hot::2 dog::1 |
--iw | Váha obrázkového promptu | --iw 2 |
Midjourney verze 5 má k dokonalosti rozhodně daleko. Chybí možnost konzistentní práce s více subjekty na snímku a není vůbec jednoduché se skrze instrukce dostat třeba k fotografii celé postavy. Konkurenční nástroje experimentují například s technikou ControlNet, která umožňuje přesnější ovlivnění výsledku. Celkově vzato ale výsledky z Midjourney pořád platí za nejlepší.
Už nyní je jasné, že tento návod celkem rychle zastará. V dalších verzích zřejmě budou možné věci, které dnes Midjourney nezvládá. Třeba náhradu konkrétní části obrázku (to umí DALL-E a starší verze Dream Studia), rozšíření obrázku nebo vkládání textu do obrazu.
Kdo má na vygenerovaný snímek autorská práva?
Provozovatelé Midjourney dávají platícím uživatelům všechna práva k jejich snímkům: „Vlastníte veškerý obsah, který vytvoříte pomocí služby, v rozsahu, v jakém je to možné podle platných právních předpisů.“ Z pohledu provozovatele tedy můžete použít vygenerované snímky, jak uznáte za vhodné, a jste držitelem autorských práv.
V současnosti se nicméně vedou právní spory ohledně toho, zda používání Midjourney neporušuje práva autorů snímků, na kterých se tato síť trénovala. Tvůrci Midjourney a Stable Diffusion v současnosti čelí žalobě. Odborníci na autorské právo upozorňují, že jde o zatím nedořešený problém.
Každopádně všechny loňské poučky o tom, jak na internetu rozpoznat vygenerované snímky, s nástupem Midjourney verze pět dostávají značnou trhlinu. Musíme si zvyknout, že takovéto „fotografie“ ve skutečnosti nejsou fotografiemi. Bude zajímavé sledovat, co to udělá s naší (už tako narušenou) důvěrou ve fotografie obecně.

Instrukce: photography stunning girl in colorful swimsuit, portrait, commercial photography, best photographers, award winning photography, extremely detailed, insanely sharp details, highly retouch, cinematic lighting, 8k, 4k, happy, feels good, positive –upbeta –v 5 –q 2 –s 750
Anketa
Aktualizace a oprava: V článku jsme opravili překlep u příkazu /describe. Doplnili jsme informace o autorských právech.