Hlavní obsah

TechMIX: Umělá inteligence ve vyhledávačích změní hnijící web k nepoznání

Foto: Pixabay.com/ Sujins

Když odpadne potřeba kamkoli klikat, odpadne i část příjmů milionů webů a jejich tvůrců. (ilustrační foto)

Tento týden se odehrává přetahovaná softwarových velikánů, kteří se snaží jeden druhého předběhnout s tím, kdo jako první oznámí zapojení konverzačního nástroje do vyhledávání.

Článek

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Napřed plánoval Google tiskovou konferenci na středu, kde v Paříži představí své novinky týkající se AI a vyhledávání. Microsoft svolal překvapivou tiskovku na stejné téma na úterý. A šéf Googlu tedy pro jistotu vydal své prohlášení o nové funkci vyhledávání už v pondělí.

Co Google a Microsoft oznámili?

Google v pondělí ukázal svůj projekt Bard, svou vlastní neuronovou síť postavenou na projektu LaMDA. Bard si s vámi bude umět povídat na libovolné téma a bude dávat pozor, aby se neodchýlil od reality. K dispozici je zatím vybraným testovačům.

Microsoft pak v úterý ukázal zapojení konverzačního bota Bing Chat, postavné zřejmě na nové neuronové síti GPT-4 od OpenAI. Umí odpovídat na otázky, citovat své zdroje a generovat delší texty. Přístup mají zatím pouze vybraní uživatelé.

Pokud bychom dopad obou oznámení hodnotili dle pohybu akcií, vítězem prvního kola by byl Microsoft, jehož akcie po tiskové konferenci poskočily o tři až šest procent vzhůru, zatímco akcie Alphabet se propadly o osm procent. To ale reflektuje jen první dojmy, na hodnocení je příliš brzy.

Možná si pamatujete, že Google a Microsoft si jeden čas šly docela po krku: Microsoft natáčel o Googlu posměšná videa, Google zase blokoval pokusy Microsoftu proniknout na mobilní trh. V roce 2015 spolu ale tyto firmy uzavřely šestileté příměří, aby neplýtvaly silami na vzájemné útoky, které by nakonec mohly poškodit obě společnosti.

Pakt o neútočení vypršel předminulý rok a toto může být první příležitost sundat rukavice. Microsoft se totiž zcela nepokrytě pouští na pole, kde panuje Google. Vyhledávač Google podle statistik globálnímu vyhledávání naprosto dominuje. Microsoft je sice druhý, ale jeho vyhledávač Bing obsluhuje jen něco málo přes tři procenta vyhledávání. Ani na domácí půdě to není o moc lepší, v USA Bing dosáhne jen tak tak na sedm procent.

Řada webů funguje jen díky tomu, že na ně vyhledávače posílají čtenáře. Tento zdroj návštěv může s nástupem konverzačního vyhledávání vyschnout.

To znamená, že Microsoft může jedině získat, zatímco Google může jedině ztratit. A zatímco pro Microsoft není vyhledávání hlavním zdrojem příjmů, pro Google (respektive mateřskou firmu Alphabet) tvoří kliky na reklamy ve vyhledávání přes 56 % příjmů (vycházím z údajů za třetí kvartál 2022).

Microsoft může zkusit přetáhnout Googlu návštěvníky i za cenu toho, že na nich nevydělá tolik, kolik by na nich vydělal Google. Což je právě implementace chatovacího nástroje do vyhledávání. Provoz takového chatbota nebude levný, ale Microsoftu by se to nejspíše dlouhodobě vyplatilo. Tak doufejme, že z toho budeme těžit my, uživatelé.

Obloukem se zatím Microsoft vyhnul otázce, jaké dopady bude mít nová technologie AI vyhledávání na web jako takový. Google neurčitě řekl, že bude na weby posílat uživatele „tam, kde to dává smysl“.

V současnosti řada webů existuje jen díky tomu, že jim vyhledávače přivádějí návštěvnost. Tu pak web může zužitkovat: Zobrazí reklamu, nabídne předplatné, získá sledující fanoušky…

Jenže když odpadne potřeba kamkoli klikat, odpadne i část příjmů milionů webů a jejich tvůrců. A tím i část zdrojů informací, na kterých se neuronové sítě trénují a ze kterých čerpají. Podrobněji se nad tím zamýšlím v tomto článku, nad dopady AI pak v lednovém shrnutí.

Internet postupně hnije a nejde to zastavit

V posledním měsíci jsem několikrát potřeboval najít na webu nějaké archivní materiály. Třeba české články z roku 2017 nebo informace o amerických volbách 2012. Vlastně nedávné věci. A šokovalo mě, kolik z těch stránek už není dostupných na svých původních adresách.

Odborníci mají pro tento jev přiléhavý název: link rot, tedy zahnívající odkazy: „Link rot (též link death, link breaking nebo reference rot) je jev, kdy hypertextové odkazy časem přestanou odkazovat na svůj původní cílový soubor, webovou stránku nebo server, protože tento zdroj je přemístěn na novou adresu, nebo se stane trvale nedostupným.“

A to je problém. Každá informace na webu je jen tak silná, jako je její zdroj. Povzbuzuji vždy všechny – především začínající novináře –, aby pečlivě odkazovali všechny zdroje, které při psaní článku použili. Čtenář tak může posoudit, zda jde o informace relevantní, a snadno může v případě zájmu dohledat podrobnosti. Jenže když se původní weby stanou nedostupnými, rozpadá se i možnost informace ověřit.

Výzkum z roku 2021 ukázal, že tato křehkost webu není jen teoretický problém. Ve velké analýze odkazů se ukázalo, že po třech letech je už 6 % odkazů nedostupných. Po třinácti letech to bylo 43 % odkazů a po 23 letech více než 70 % odkazů. Většina všech článků New York Times, která hypertextové odkazy na cizí web obsahuje, má alespoň jeden nefunkční odkaz.

Foto: imdb.com

Chyba 404: stránka nenalezena. Některé weby zobrazují u této příležitosti nějakou vtipnou hlášku (zde IMDB.com). Pravdou ale je, že jde o významný problém bez jednoduchého řešení.

Co s tím? Pokud jste správcem webu, postarejte se o to, aby při redesignu fungovaly i staré adresy (bude se vám to hodit i pro pozici ve vyhledávačích). Pokud jste výzkumníci nebo vědci, zálohujte si weby, se kterými pracujete. Použít můžete třeba Web Archive nebo archive.today.

Možná ještě horší je to u softwaru (tzv. software rot). Zkoušeli jste někdy rozchodit desítky let staré programy? Občas se to povede, ale čím je program složitější, tím větší je šance, že bude chybět nějaká knihovna, ovladač, nebo třeba internetová funkcionalita. A je jedno, že jste si program nebo hardware koupili. Pokud nejste programátor se sklony k reverznímu inženýrství, prostě to nerozchodíte.

A bojím se, že se to bude zhoršovat. Schválně se rozhlédněte po zařízeních, která nyní používáte. Jste si jisti, že budou fungovat za dvacet let?

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Doporučované