Hlavní obsah

TechMIX: Hovoří spolu neuronové sítě tajnou řečí? Spíš si jen šetří práci

Foto: Pixabay.com

Našli jsme „tajnou řeč, kterou si neuronová síť sama vyvinula“? Vysvětlení je zřejmě mnohem prozaičtější (ilustrační foto).

Tentokrát vás TechMIX zavede do oblasti neuropsychologie, kriminality i ekonomiky. Začnu ale tím údajně nejhorším způsobem, jakým se dá otevřít konverzace. Řeknu vám, co se mi tenhle týden zdálo.

Článek

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Možná to znáte také. Snažíte se něco přečíst, ale nejde vám to. Oči vám odmítají zaostřit na stránku. Nebo tam vidíte slova, která nedávají smysl, případně se slova mění, kdykoli se na stránku podíváte znova.

V takové chvíli je dobré se zeptat: Sním, či bdím? S velkou pravděpodobností totiž platí ta první možnost. Zdá se vám živý sen, ale ani v živém snu obvykle nemůžeme dělat některé věci. Čtení je jednou z nich.

Sny se nám nejčastěji zdají během REM fáze spánku a náš mozek v tu chvíli prochází očistnou a osvěžovací kúrou, během které nejsou všechny části mozku plně aktivní. Podle profesorky psychologie Deirdre Barrettové je naše neschopnost ve snech číst (a psát) způsobena neaktivními oblastmi mozku spojenými s produkcí mluvené a psané řeči. Proto ve snu dokonce nemůžeme ani mluvit, i když si to neuvědomujeme.

„Zdá se, že to většinou souvisí s tím, že celá naše jazyková oblast je mnohem méně aktivní,“ říká Barrettová. „I když lidé popisují věci, kdy jsou ve snu se skupinou přátel a o něčem se baví, když se jich opravdu zeptáte, zda slyšeli hlasy a konkrétní slovní spojení nebo věty, naprostá většina lidí řekne, že ne.“

Tajný jazyk? Spíš ne

Když už se ve snu přece jen pokusíte na nějaký text zaostřit, uvidíte něco, co z dálky vypadá jako písmena. Respektive jako kdyby se je popaměti pokoušel nakreslit někdo, kdo sice viděl písmena, ale neznal jejich význam. Pěkně to zachycuje třeba scénakresleného Batmana (1992, pamatujete?).

Zajímavé je, že velmi podobného efektu se dobereme, pokud zadáme neuronové síti DALL-E 2 (psal jsem o ní poslední dobou hned třikrát) úkol generovat hřbety knih. Uprostřed obrázku je patnáct knih skutečných, poznáte je podle toho, že je na nich smysluplný nápis. Ostatní nápisy jsou zdálky věrohodné, ale zblízka jsou to nesmyslné klikyháky. Skoro přesně jako ve snu…

Foto: Kevin Parry, Seznam Zprávy

Fotka doplněná neuronovou sítí DALL-E 2.

Mimochodem, pokud máte čas, vlákno s obrázky výřezu fotek „doplněných“ strojovým učením si rozhodně projděte. Velmi dobře ukazují na první pohled až magické schopnosti tohoto obrazového generátoru.

S texty má DALL-E 2 vůbec problém. Když mu zadáte, aby do obrázku vložil bubliny s textem, tak vás poslechne, ale ten text nebude dávat smysl. Takto třeba vypadá obrázek vygenerovaný instrukcí „Dvě velryby se baví o jídle, s titulky.“

Foto: Giannis Daras a Alexandros Dimakis, Seznam Zprávy

Snímek generovaný neuronovou sítí DALL-E 2.

A tady to začíná být zajímavé. Když výzkumníci Giannis Daras a Alexandros Dimakis tento text „Wa ch zod ahaakes rea“ vzali a dali jej neuronové síti DALL-E 2 jako instrukci, neuhodnete, co se stalo:

Foto: Giannis Daras a Alexandros Dimakis, Seznam Zprávy

Snímek generovaný neuronovou sítí DALL-E 2.

Přesně tak: Ze zdánlivě nesmyslného textového řetězce vyrobila neuronová síť realisticky vypadající fotografie, které zcela evidentně zobrazují plody moře. Tedy něco, co odpovídá zadání.

Našli jsme „tajnou řeč, kterou si neuronová síť sama vyvinula“? Přesně k takovému závěru se přiklonilo hned několik médií. A těžko se jim divit. Strojové učení je plné tajemna a tohle nezní o nic víc sci-fi než jiné věci, které o „umělé inteligenci“ čteme dnes a denně.

Jak ale v rozsáhlé analýze upozorňuje programátor Dušan Janovský, zřejmě je vysvětlení mnohem prozaičtější. A obtížněji pochopitelné. Zjednodušeně řečeno je vygenerovaný text výsledkem „tvorby z šumu“ a neuronová síť se soustředí maximálně na dvojice písmen. Což ale stačí k tomu, aby se tyto dvojice písmen následně „přeložily“ zpátky na původně „zamýšlený význam“ (omluvte hromadu uvozovek).

Já se to pokusil zjednodušit metaforou: Mám v hlavě melodii a nemůžu si vzpomenout, jak se jmenuje ta písnička. Zanotuju tedy tu melodii manželce, jak nejlépe dovedu, a ta z mojí zkreslené melodie zázrakem pozná, o kterou skladbu jde.

Kdyby ale někdo to moje zanotování převedl na notový papír, nebude vůbec odpovídat skutečné skladbě. Některé noty budou navíc, některé budou chybět, rytmus je mimo. Ve „sdíleném prostoru všech populárních písní“ se zkrátka nejblíže nachází tato.

K tématu doporučuji i rozhovor s Tomášem Mikolovem, který je autorem nástroje word2vec a který mi asi nejvíce pomohl pochopit koncept toho „vektorového prostoru“, o němž píše Dušan Janovský.

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Doporučované