Článek
Obrázky generované umělou inteligencí zaplavují internet. Nová verze služby Midjourney se dostala do popředí virálními „falešnými snímky“ papeže Františka a zatýkaného prezidenta Trumpa. Řada lidí byla zaskočena tím, jak realistické tyto fotomontáže byly.
Ještě překvapivější ale může být, jak snadné je takové snímky vytvořit. Není k tomu už totiž potřeba tolik trpělivosti a experimentování, jako tomu bylo dříve. Třeba na replikaci fotky „papeže v bílé prošívané bundě“ nám stačila jedna minuta a velmi stručná instrukce.
Pojďme se tedy podívat na to, co všechno můžete v nové Midjourney vytvořit.
Realistické fotografie a ruce s pěti prsty
Kdo někdy pracoval na pile nebo generoval obrázky v Midjourney, umí si vážit lidských rukou, na kterých je pět nepokroucených prstů. Předchozí čtvrtá verze totiž často vyprodukovala otřesně vypadající – i když někdy docela vtipné – dlaně a prsty.
Pokud dáme stejné zadání páté verzi, vidíme jednoznačný pokrok v realistickém zobrazení nejen prstů, ale celé fotografie. U dlaní je to ale nejnápadnější. Pořád sice občas dojde k nějakým defektům (viz šest prstů na levé ruce u snímku níže), ale pokrok je nepopiratelný.
Už čtvrtá verze (o které jsme psali minulý rok) uměla generovat nádherné snímky. Její nástupkyně, uvedená v polovině letošního března, ale překonala i mnohá optimistická očekávání. „Tento model má velmi vysokou koherenci, vyniká v interpretaci výzev v přirozeném jazyce, má vyšší rozlišení a podporuje pokročilé funkce,“ píše k tomu provozovatel služby.
Podívejte se na další výtvory, které jsme vygenerovali pomocí Midjourney verze 5. U každého snímku najdete i instrukce, které jsme použili.
Jak vidíte, pestrost výsledků je ohromná a fantazii se meze nekladou. Rozlišení je navíc obvykle dostatečné pro většinu digitálních použití.
Jak využít verzi číslo pět
Méně příjemné je, že Midjourney (údajně pouze dočasně) zrušil možnost bezplatného používání: „Vzhledem ke kombinaci mimořádné poptávky a zneužívání zkušebních verzí dočasně vypínáme bezplatné verze, dokud nebudou nasazena další vylepšení systému,“ uvedl David Holz, šéf Midjourney.
Midjourney a Discord
Podrobný návod, jak začít používat Midjourney, najdete v našem předchozím návodu:
Stále platí, že musíte s Midjourney komunikovat prostřednictvím diskuzní platformy Discord. Pokud nechcete pracovat ve veřejné místnosti, můžete si snadno založit svůj vlastní Discord server a robota Midjourney Bot tam pozvat.
Za generování tedy nyní zaplatíte minimálně 10 dolarů měsíčně (základní plán), zatímco profesionální plán s možností rychlejšího generování stojí tři- až šestkrát tolik.
Jak aktivovat pátou verzi Midjourney
Při psaní instrukce (promptu) postupujte stejně jako nyní. Příkazem /imagine uveďte instrukce pro robota Midjourney Bot.
Pro aktivaci verze pět doplňte frázi –v 5 (spojovník, spojovník, písmeno v, mezera, číslo pět).
Případně můžete verzi pět napevno nastavit jako svou výchozí pomocí příkazu /settings.
Jde to i jednoduše
Kdo chce, může si hrát s různými dlouhými instrukcemi. Dokonce můžete požádat nástroje založené na velkých jazykových modelech, aby vám poradily s instrukcemi.
Nezapomeňte dodat parametry dle svých požadavků, třeba –v 5 pro použití nové verze a –ar 3:2 pro klasický formát fotky. Když takovými instrukcemi nakrmíte Midjourney, můžete se dočkat zajímavých výsledků s minimálním vynaloženým úsilím.
Stojí za to poznamenat, že ChatGPT nemá žádný „tajný“ klíč na to, jak z Midjourney dostat dobré výsledky. Jen umí používat deskriptivní jazyk a neunaví se při detailním popisování scény, což je pro lidi často vyčerpávající.
Na druhou stranu, kdo říká, že jsou potřeba desítky řádků? Někdy nejsou k zajímavému výsledku vůbec potřeba slova… Stačí emotikon.
Jako instrukci můžete dát i obrázek
Novou funkcí Midjourney je příkaz /describe. Je to vlastně generování obrázků naruby. Můžete službě poslat libovolný obrázek a systém vygeneruje až směšně podrobné instrukce.
Tyto instrukce pak můžete rovnou použít pro tvorbu vlastních obrázků a jejich variant, případně je využít jako inspiraci pro vlastní instrukce a prompty.
Připomeňme, že můžete také použít obrázek přímo jako součást instrukcí. Nebo dokonce zkombinovat více obrázků do jednoho pomocí příkazu /blend (nebo skrze vložení URL jednoho či více obrázků). Je to docela alchymie, výsledky jsou často neintuitivní a divné. A občas nečekaně nádherné.
Zvláště pokud si chcete vyzkoušet různé styly a jejich kombinace, mohou být právě „obrázkové prompty“ tou nejjednodušší cestou.
Na druhou stranu, pokud čekáte, že obrázkový prompt zachová třeba původní obličej, tak budete zklamaní.
Systém si z fotky „něco“ vezme, ale třeba zrovna u obličejů to bude maximálně vzdálená podoba. Pokud chcete generovat fotky sebe sama, nebo jiného konkrétního člověka, můžete zkusit vytrénovat vlastní model či vyzkoušet nějakou k tomu určenou službu. V Midjourney také můžete experimentovat s různým nastavením „váhy“ a laděním variant.
Přehled parametrů Midjourney
Parametr | Popis | Příklad |
---|---|---|
--version, --v | Zvolit verzi Midjourney | --v 5 |
--aspect, --ar | Požadovaný poměr stran | --ar 16:9 |
--no | Co na obrázku být nemá | --no clouds |
--stylize, --s | Jak moc stylizovat? | --stylize 750 |
--chaos, --c | Jak „divoký" chcete výsledek | --chaos 50 |
--tile | Obrázek vhodný jako textura | --tile |
:: | Oddělení konceptů | hot :: dog |
::2 | Váha předchozí části promptu | hot::2 dog::1 |
--iw | Váha obrázkového promptu | --iw 2 |
Midjourney verze 5 má k dokonalosti rozhodně daleko. Chybí možnost konzistentní práce s více subjekty na snímku a není vůbec jednoduché se skrze instrukce dostat třeba k fotografii celé postavy. Konkurenční nástroje experimentují například s technikou ControlNet, která umožňuje přesnější ovlivnění výsledku. Celkově vzato ale výsledky z Midjourney pořád platí za nejlepší.
Už nyní je jasné, že tento návod celkem rychle zastará. V dalších verzích zřejmě budou možné věci, které dnes Midjourney nezvládá. Třeba náhradu konkrétní části obrázku (to umí DALL-E a starší verze Dream Studia), rozšíření obrázku nebo vkládání textu do obrazu.
Kdo má na vygenerovaný snímek autorská práva?
Provozovatelé Midjourney dávají platícím uživatelům všechna práva k jejich snímkům: „Vlastníte veškerý obsah, který vytvoříte pomocí služby, v rozsahu, v jakém je to možné podle platných právních předpisů.“ Z pohledu provozovatele tedy můžete použít vygenerované snímky, jak uznáte za vhodné, a jste držitelem autorských práv.
V současnosti se nicméně vedou právní spory ohledně toho, zda používání Midjourney neporušuje práva autorů snímků, na kterých se tato síť trénovala. Tvůrci Midjourney a Stable Diffusion v současnosti čelí žalobě. Odborníci na autorské právo upozorňují, že jde o zatím nedořešený problém.
Každopádně všechny loňské poučky o tom, jak na internetu rozpoznat vygenerované snímky, s nástupem Midjourney verze pět dostávají značnou trhlinu. Musíme si zvyknout, že takovéto „fotografie“ ve skutečnosti nejsou fotografiemi. Bude zajímavé sledovat, co to udělá s naší (už tako narušenou) důvěrou ve fotografie obecně.
Anketa
Aktualizace a oprava: V článku jsme opravili překlep u příkazu /describe. Doplnili jsme informace o autorských právech.