Článek
Věříte si, že byste poznali pravou fotku od snímku vygenerovaného umělou inteligencí? Statisticky vzato byste si věřit neměli. Anonymní data od 105 tisíců čtenářů, kteří si vyzkoušeli náš velký test, ukazují, že vygenerované obrázky jsou už prakticky k nerozeznání od reálných fotografií.
Zkuste si kvíz „fotka, nebo AI“
Náš kvíz si zkusilo už přes sto tisíc čtenářů. Pokud si chcete otestovat své instinkty ještě před tím, než uvidíte ukázky v tomto článku, interaktivní kvíz se 30 otázkami najdete zde:
Proklikat se testem trvalo průměrně dvě minuty a 11 sekund. Dosáhnete na lepší skóre než průměrných 54 %?
V kvízu respondenti vybírali, zda je snímek fotka, nebo „dílo umělé inteligence“. A už v diskuzi pod článkem lidé psali, že to byla především „tipovačka“. Výsledky to potvrdily: průměrně dosáhli lidé 54% úspěšnosti. Což je jen o kousek lepší, než kdyby si tipovali nějaký zcela náhodný jev, třeba výsledek hodu mincí. Tam by byl průměr 50 %, což si můžete porovnat v následujícím grafu.
Ale tento globální pohled skrývá to nejzajímavější. Mezi jednotlivými snímky byly velké rozdíly, a protože každý uživatel dostal jinou kombinaci 30 snímků, můžeme se podívat i na mnohem detailnější výsledky.
U některých snímků totiž lidé neváhali a naprostá většina je označila za fotografie. A je zajímavé, že mezi čtveřici „nejreálnějších“ se probojoval výtvor neuronové sítě.
Reálnější než realita?
Tato konkrétní „fotografie“ zmátla více než čtyři pětiny lidí. Zřejmě proto, že zcela vybočuje z obvyklé šablonovitosti, na kterou jsme si u vygenerovaných snímků zvykli. Ale služba Midjourney – kterou jsme k tvorbě použili – v poslední verzi udělala znatelný pokrok právě při tvorbě realistických snímků lidí.
Jak jsme generovali „falešné fotky“
Kvíz vybral 30 náhodných snímků ze 120. Šedesát z toho byly fotky zveřejněné před rokem 2019 v archivech pod licencí public domain nebo Creative Commons. K nim jsme pak pomocí nástroje Midjourney vytvořili šedesát žánrově podobných falešných snímků.
Jaké další vygenerované snímky vypadaly reálněji než skutečné fotky? Celkem jsme zaznamenali přes tři miliony anonymních tipů, jejich následná analýza nám ukázala celkem 12 fotek, které pro lidi vypadají reálněji než fotky.
Snímky vygenerované AI, které zmátly nejvíce lidí:
Zajímavé je, že ve všech případech jde o snímky lidí. Zdá se, že právě u lidí již generátory překlenuly tzv. „strašidelné údolí“ (anglicky uncanny valley), což je název pro situaci, kdy jsou podobizny příliš podobné lidem, ale není to úplně ono.
Výzkum z prosince 2023, kterým jsme se částečně inspirovali, zjistil, že některé tváře vygenerované AI nástroji vnímají lidé jako reálnější než ty lidské. Pro tento jev navrhují termín „hyperrealismus“. Z pohledu psychologů je zajímavé zkoumat, co vlastně dělá v našich očích člověka člověkem.
V našem testu většina fotek vygenerovaných AI dosáhla skóre nad 50 %. To znamená, že lidé častěji tipovali, že jde o realitu.
Na opačném spektru pak byly portréty, které jsou sice reálné, ale lidé je často označovali za výtvor umělé inteligence:
Celkově náš test poměrně přesvědčivě ukázal, že obrázkům už se nedá věřit. V mnoha případech jsou zkrátka AI výtvory tak realistické, že většina lidí je neumí spolehlivě poznat od skutečné fotografie. A to jsme se v našem kvízu omezili jen na „od základu generované snímky“. Kdybychom do toho ještě přimíchali různé montáže, kde je vygenerovaná jen část snímku, zmatek by mohl být ještě větší.
Potenciál pro využití je ohromný. A pro zneužití možná ještě větší. Pokud nemůžete věřit zdroji, ze kterého fotografie pochází, musíte už nyní předpokládat, že nemusí jít o skutečnou fotografii, která vznikla působením světla odraženého od reálných lidí a věcí. Místo toho to může být „promptografie“, snímek vypěstovaný v generátoru na základě pokynů uživatele. A 99 % lidí nepozná rozdíl.