Hlavní obsah

Generátor vyrábí videoklipy na přání. Vytoužená novinka zatím nesmí do EU

Videogenerátor Sora od OpenAI - ukázkyVideo: Pavel Kasík, Seznam Zprávy

Po deseti měsících čekání je generátor videí Sora dostupný široké veřejnosti. Vedle běžných funkcí nabízí nástroje pro kreativní zásahy a mixování. Předplatitelé ChatGPT mají Soru v rámci paušálu. Pokud nebydlí v EU nebo Číně.

Článek

Článek si také můžete poslechnout v audioverzi.

„Video je pro nás důležité z mnoha důvodů. Chceme tvořit nástroje pro kreativce, protože je do důležité pro kulturu a pro lidstvo,“ uvedl Sam Altman, šéf firmy OpenAI, třetí den vánoční nadílky novinek. „Nechceme, aby byl svět jen plný textu. Zatím spolu AI systémy komunikují hlavně skrze text, a tím bychom myslím o něco důležitého přišli. A za třetí je to důležitý krok na cestě k obecné umělé inteligenci, která rozumí skutečnému světu.“

Firma poprvé ukázala svůj generátor Sora v únoru 2024. Byl ale dostupný jen několika vybraným umělcům, firma OpenAI chtěla napřed otestovat, že nebude možné jej snadno zneužít například k falšování videa skutečných lidí nebo k neetickým manipulacím.

Zatímco letos v únoru byl generátor Sora šokující novinkou, od té doby přišlo na trh několik konkurenčních nástrojů, které umí na základě instrukcí také generovat: Runway ML, Kling nebo Hunyan (viz naše ukázka na začátku epizody Mozaika). Sora tedy už není jediná svého druhu, což zvýšilo požadavky uživatelů na funkce i kvalitu výstupu.

Skoro přesně dle instrukcí

Hlavní funkcí – kterou mají prakticky všechny generátory – je možnost generovat krátké (5 až 20 sekund trvající) videoklipy na základě textového zadání. Nový generátor videa Sora není součástí ChatGPT, jako třeba generátor obrázků Dall-e 3. Místo toho dostal svůj vlastní web sora.com, který se vzhledem trochu podobá generátoru obrázků Midjourney.

Na webu mohou návštěvníci sledovat pravidelně aktualizované ukázky výtvorů od ostatních uživatelů: „Můžete tato videa procházet, můžete se podívat, jak přesně byla vytvořena. Můžete také něčí video použít jako inspiraci pro vlastní tvorbu,“ uvedl Rohan Sahai, vývojář OpenAI, který na nástroji pracuje.

Ukázky na webu samozřejmě nejsou úplně reprezentativní – jsou jednotlivě vybrané, aby ukázaly šíři schopností nového generátoru. V Evropě zatím Sora není přístupná (o tom dále), požádal jsem proto někoho s přístupem, aby mi vygeneroval video s instrukcemi: „Sam Altman solving a Rubic cube, focused, 360 action shot“ (Sam Altman řešící Rubikovu kostku, soustředěný, 360° akční záběr).

Desetisekundový videoklip vygenerovaný dle našich instrukcí.Video: Pavel Kasík, Seznam Zprávy

Vidíme hned několik chyb: kostka nemá správný počet dílků, tablet se ke konci promění v klávesnici. Zajímavé je, jak si generátor poradil s obličejem. Není to Sam Altman, což by bylo proti pravidlům služby, ale je to mladý muž přibližně odpovídající Altmanově profilu. A celková kontinuita složitého záběru je překvapivě dobrá, i když zdaleka ne dokonalá.

Jindy jsou ale výsledky zcela nepoužitelné. Je jasné, proč OpenAI zatím drží maximální délku klipu relativně krátkou: čím delší video je, tím více příležitostí pro nerealistické pohyby nebo chyby v kontinuitě záběru.

Funkce pro přesnost i kreativitu

OpenAI ale kromě samotného videogenerátoru představila i několik poměrně inovativních funkcí, které mohou uživatelé využít k tomu, aby lépe ovlivnili výsledek. Pokud se vám třeba nějaká instrukce osvědčí, můžete si ji uložit do „presetu“ a příště ji už nemusíte psát, stačí tuto „zkratku“ vybrat z menu.

Foto: OpenAI

Presets

Pokud přesně víte, co na záběru chcete, oceníte funkci „Storyboard“. Na časovou osu můžete vložit textové nebo obrázkové instrukce a generátor se pokusí je vzít při „vypěstování“ klipu v potaz. Během živé demonstrace tým OpenAI na vlastní kůži zakusil, že výsledky nejsou stoprocentní.

Foto: OpenAI

Funkce Storyboard umožňuje umístit na časovou osu (dole) textové instrukce i obrázky.

K tomu ale slouží další dva nástroje v rámci Sory. Tím prvním je Remix. V podstatě můžete vzít vygenerované video a napsat instrukce, jak jej změnit. Třeba „místo mamutů dej roboty“ či „místo ve dne by to mělo být v noci“.

Foto: OpenAI

Funkce Remix na Sora.com

Druhý nástroj pro úpravu výsledků – Recut – je vhodný právě tam, kdy se část generovaného videa povedla, ale v nějaké chvíli se objevila chyba nebo nesmysl. Můžete na časové ose přesně určit, který úsek zachovat a co vygenerovat znovu. Podobá se to nástroji „generativní výplň“ u obrázků nebo možnosti rozšířit video, kterou nedávno ukázala firma Adobe.

Foto: OpenAI

Funkce Recut na Sora.com

Spíše takovou hračkou pro poměrně specifické účely – třeba tvorba rozpohybovaného pozadí  – je nástroj Loop. Z vygenerovaného videa udělá klip, který navazuje sám na sebe a lze je tak pouštět v nekonečné smyčce.

Foto: OpenAI

Funkce Loop na Sora.com

Možná nejzajímavější, a také asi těžko předvídatelná, je funkce Blend, kde dostane generátor pokyn zkombinovat dva videoklipy. Uživatel může nastavit parametry takového „míchání“, na první pohled je to ale celkem neintuitivní pokyn.

Foto: OpenAI

Funkce Blend na Sora.com

„Sora je nástroj. Je to rozšíření vašich možností se vyjádřit,“ povzbuzuje tvůrce Altman. „Zkuste vytvořit něco, co bylo dřív nemožné.“

Zároveň je nástroj Sora další motivace k tomu, aby si někdo předplatil prémiovou verzi ChatGPT Pro za 200 dolarů měsíčně (cca pět tisíc korun). Nástroj Sora je totiž přístupný uživatelům ChatGPT Plus i ChatGPT Pro. Uživatelé levnějšího tarifu mají možnost generovat přibližně 50 klipů měsíčně, zatímco ti, co si budou platit dražší tarif, mají neomezené možnosti generování. Přibližně 500 klipů se jim vygeneruje ve zrychleném režimu, další pak v tzv. „klidném“ režimu (tedy zařadí se do fronty za ostatní přednostní úlohy).

Evropa má zatím smůlu

Sora je hned od prvního dne přístupná z „téměř celého světa“, tedy z více než 150 zemí. Ale uživatele v Česku – a  v celé Evropské unii – zatím přivítá strohá hláška o nedostupnosti.

Foto: OpenAI

„Sora zatím není dostupná v Česku.“

„Uděláme vše pro to, abychom mohli zahájit (provoz nástroje Sora v Evropě), ale v tuto chvíli nemáme žádné konkrétní termíny, které bychom mohli sdílet,“ uvedl Sam Altman během živého vysílání. „Existují také další země, ve kterých nemůžeme působit.“ Patří mezi ně třeba Čína nebo Rusko.

Později Altman na síti X dodal, že „u nových produktů lze v Evropě obecně očekávat opožděný přístup na trh a některé funkce tam nebudeme moci vůbec uvést.“

Související témata:

Doporučované