Hlavní obsah

Umělá inteligence je náš odraz. „Hákovým křížům se nevyhneme“

Foto: Seznam Zprávy

Obrázek vygenerovala umělá inteligence na základě příkazu „Jan Kordovský a Pavel Kasík natáčí podcast“.

Článek

Tématem dnešního podcastu Stopáž jsou generátory obrázků na základě textového příkazu. Jak tyto systémy využívají umělou inteligenci, k čemu vůbec jsou a jaká je jejich budoucnost? Odpovídá technologický redaktor Pavel Kasík.

Tenhle týden u nás na Seznam Zprávách vyšel tvůj článek o generátorech obrázků, které využívají neuronové sítě a umělé inteligence. Co tě na tomto tématu tak fascinuje?

Mně to přijde trošku jako setkání úplně s novým druhem komunikace, s novou formou života. Když to nadnesu, tak je to jako setkat se s mimozemšťanem, který nás dlouho studuje, něco o nás ví překvapivě dobře, něčemu zase vůbec nerozumí a je neuvěřitelně mocný. Dokáže toho spoustu a zároveň některým věcem roztomile nerozumí. Nechápe například, že když pes do něčeho kousne, tak kouše pusou. Nebo například nechápe, jak vypadá zasněžená Praha, a zkouší to nějakým způsobem odhadovat. Je hodně blízko tomu, jaké chyby dělá člověk, a přitom je to od něj na míle daleko.

Přijde mi, že se o tom fenoménu málo mluví. Tohle téma na pomezí technologie a umění také předznamenává určitou změnu v tom, jak můžeme v budoucnosti vnímat člověka a techniku.

Foto: koláž: Pavel Kasík, Seznam Zprávy

Příklad ilustrace vygenerované neuronovou sítí.

Jaký je rozdíl mezi slovy „model“, „robot“, „umělá inteligence“ nebo „neuronová síť“? Co vlastně budeme v tomto rozhovoru používat jako označení generátoru, který vyrobí z příkazu obrázek?

Neuronová síť je určitý typ počítačového programu, který přistupuje k analýze dat specifickým způsobem. Není to jeden program, ale je to několik maličkých prográmků. Každý z nich má nějakou velmi jednoduše popsanou funkci a tím, že dáme dohromady ty neurony, tak ta funkce najednou začne být mnohem složitější a komplexnější. Můžeme udělat třeba neuronovou síť, která dokáže rozpoznat, co uživatel napsal nebo co vyslovil, pozná, co je na obrázku, naučí se, jestli je na obrázku obličej nebo kolik je tomu vyobrazenému člověku let.

Neuronová síť se často zaměňuje za spojení umělá inteligence. Umělá inteligence je trošku nadnesený název. Někteří experti ho nemají rádi, protože je zavádějící. Když člověku řekneme inteligence, tak si vybaví nějakou konkrétní schopnost. Vybaví si to, co lidé mají jako inteligenci. A to, co má počítač, nebo to, co my označujeme jako umělá inteligence, tak to není nutně to samé, a tím pak dochází ke spoustě omylů nebo nedorozumění. Protože my máme pocit, že když počítač umí něco, co my jsme uměli ve třetí třídě, tak máme pocit, že umí všechno, co jsme se do té doby naučili. A není nám úplně jasné, proč si počítač neumí zavázat tkaničky, ale zase umí řešit diferenciální rovnice.

Model je vlastně výsledek natrénování neuronové sítě na nějakých datech. Po natrénování je relativně rychle schopná dávat nějaké výsledky. Řekněme, že bych chtěl například udělat neuronovou síť, která dokáže poznat želvy. Želv je ale spousta různých druhů. Také je mohu mít vyfocené zblízka, zdálky, zespoda, seshora, ze strany… Je to strašně moc různých věcí a faktorů. Napsat na tohle nějaký klasický program by prostě nefungovalo.

Jediným elegantním řešením je vytvořit si neuronovou síť. Vezme se hromada obrázků, čím víc, tím líp, a čím různorodějších, tím líp. Některé obrázky budou mít želvu a bude u nich napsáno: „Tady je želva“. Další obrázky nebudou mít želvu a u nich bude napsáno: „Tady není želva“. Na těchto datech se pak model vytrénuje a pokusí se najít, co je „želvovitost“ obrázku. Následně modelu dáme hromadu jiných obrázků, které nikdy neviděl, a otestujeme, jestli ten model dává nějaké reálné výsledky.

Foto: koláž: Pavel Kasík, Seznam Zprávy

Ilustrace vygenerovaná neuronovou sítí Stable Diffusion.

Neumím si představit, že takhle komplexní systém můžeme udržet v nějakých mantinelech. Jak zařídit, aby najednou nezačal všude kreslit hákové kříže?

V podstatě jednoduchá odpověď je, že se tomu nevyhneme. Například organizace OpenAI, která přišla s prvním významným modelem Dall-e 2, se snažila opravdu pečlivě. Fotografie pro svůj model filtrovala předtím, než se je neuronová síť vůbec začala učit. Cílem bylo, aby se tam nedostaly fotografie nebo popisky s násilím či dětskou pornografií nebo další závadný obsah. Ale existují samozřejmě i další modely, které jsou zcela bez pravidel, zcela otevřené. Čímž chci říct, že tomu se vlastně nedá vyhnout. Protože základní principy vytváření těchto modelů jsou známé. Větší nebo zodpovědnější firmy do vývoje mohou na začátku dát víc peněz a času. Mají tak výsledky víc pod kontrolou. Ale v zásadě si takový model, respektive vlastní neuronovou síť, může udělat úplně kdokoliv u sebe na počítači.

Pokračování rozhovoru, který se věnuje například budoucnosti nebo praktickému využití těchto technologií, si můžete poslechnout v přehrávači v úvodu článku nebo ve své oblíbené podcastové aplikaci.

Stopáž

Týdenní podcast o technologiích, společnosti a všem mezi tím. Uvádí Jan Kordovský (@korda).

Souhrn nejdůležitějšího dění, analýza s redaktory Seznam Zpráv, rozhovory s hosty, glosy. Každý pátek na Podcasty.cz, na Seznam Zprávách a ve všech podcastových aplikacích.

Archiv všech dílů Stopáže najdete tady, další podcasty Seznam Zpráv tady. Co máme zlepšit? Který díl vás bavil nejvíc? Své postřehy, podněty a tipy nám můžete posílat na audio@sz.cz.

Doporučované