Hlavní obsah

OpenAI slibuje „chytrý vyhledávač“. Má chránit práva autorů i zájmy čtenářů

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Budeme se ptát robota, místo abychom sami hledali? OpenAI experimentuje se SearchGPT.

aktualizováno •

Populární umělá inteligence ChatGPT se má dočkat zásadního posunu směrem k prohledávání webu. Firma OpenAI si tentokrát dává pozor, aby měla na své straně i některé vydavatele. Už první ukázka ale ukazuje na klasické problémy.

Článek

Článek si také můžete poslechnout v audioverzi.

„Testujeme prototyp nového vyhledávače jménem SearchGPT,“ oznámila na blogu firma OpenAI, známá především svým chatbotem ChatGPT. Ten zatím měl pouze omezené možnosti vyhledávání. Pomocí integrace nástroje Bing od Microsoftu mohl načíst informace z webu a zahrnout je do svých textových odpovědí.

Nyní ale OpenAI chystá vlastní vyhledávač, který by mohl – jak to vypadá ze zveřejněných ukázek – konkurovat zavedeným značkám jako Google nebo Bing.

Ukázky z nového SearchGPT prototypu:

Mezi hlavní funkce patří možnost rychle shrnout data z mnoha různých webů na základě otázky uživatele. „Věříme, že konverzační schopnosti našich modelů obohatíme o aktuální informace z webových stránek, a tak najdou uživatelé snáze a rychleji to, co hledají,“ píše OpenAI. Uživatel by tak mohl položit i velmi specifické nebo kombinované otázky a dostane na ně odpovědi, které jsou přizpůsobené přímo pro daný kontext. Navíc bude moci pokládat doplňující otázky.

Nové je také rozhraní, které více než víceméně strohé textové konverzace připomíná multimediální prostředí Wikipedie nebo klasických vyhledávačů.

Spolupráce s vydavateli už od začátku

Firma OpenAI byla v minulosti opakovaně obviněna z toho, že nerespektuje autorská práva. Asi nejslavnější je spor s americkým deníkem The New York Times. Ten v žalobě ukázal celou řadu případů, kdy chatbot ChatGPT ochotně pomáhá uživatelům obejít tzv. paywall a dostat se zdarma k obsahu, za který by jinak museli platit.

Foto: New York Times

„Nemůžu se dostat k článku v New York Times!“ „Ale jistě,“ zašvitořil ChatGPT a vypsal článek.

Také provozovatelé webů, které nabízejí obsah zdarma, ale mohou být poškozeni službou nabízející podrobné shrnutí jejich textů. Uživatelé totiž nebudou muset kliknout na článek, aby v něm něco našli. To za ně udělá – tak alespoň zní hlavní příslib všech těchto AI vyhledávačů – přímo samotný chatbot. Uživatel tak neuvidí reklamu. Přitom právě na zobrazování reklamy dnes velká část webů vydělává.

Proto provozovatel ChatGPT chce už od začátku těmto obávám předejít: „SearchGPT je navržen tak, aby pomohl uživatelům spojit se s vydavateli. A to tím, že je výrazně cituje a odkazuje na ně ve výsledcích vyhledávání,“ uvádí OpenAI na svém webu. Odkazy si uživatel může také přehledně zobrazit ve zvláštní záložce.

I tak je ale značně nejisté, zda uživatelé budou mít zájem na původní zdroje klikat. Pokud totiž dostanou hledané informace přehledně shrnuté přímo od chatbota, může se ukázat, že čtení celého původního článku či dokumentu bude pro řadu lidí nadbytečné.

Přehled AI vyhledávačů

SearchGPT od OpenAI není zdaleka prvním pokusem o konverzační vyhledávání zapojující tzv. umělou inteligenci, respektive velké jazykové modely. Od roku 2023 se objevilo hned několik služeb s podobnými funkcemi.

Perplexity – nejznámnější z konverzačních vyhledávačů, začal už v roce 2022. Umí generovat odpovědi na míru a uživateli ukazuje odkazy v rámci na míru sepsaného textu. Perplexity využívá velké jazykové modely OpenAI, Meta, Anthropic i Mistral.

Foto: Perplexity, snímek: Pavel Kasík, Seznam Zprávy

Perplexity prezentuje informace formou připomínající styl výpisků nebo encyklopedii Wikipedia. Kromě bezplatné verze má i prémiovou za 20 dolarů měsíčně.

Microsoft Copilot – přišel s konverzačním vyhledávačem Microsoft v rámci svého nástroje Bing Chat, později se přejmenoval na Copilot. Využívá modely od OpenAI, s touto firmou ostatně Microsoft úzce spolupracuje.

„Vyhledávání s umělou inteligencí se stane jedním z klíčových způsobů, jak se lidé orientují na internetu,“ cituje OpenAI Nicholase Thompsona, šéfa významného amerického magazínu The Atlantic. „V této počáteční fázi je zásadní, aby byla technologie utvářena způsobem, který oceňuje, respektuje a chrání novináře a vydavatele.“

V rozhovoru pro The Verge Thompson nedávno vysvětlil, proč do spolupráce s OpenAI jeho vydavatelství vůbec jde: „Umělá inteligence přichází, a to rychle. Chceme být součástí této transformace. Může to dopadnout špatně, může to dopadnout dobře.“ Dodal, že šance, že se to povede udělat tak, aby byly zachovány dobré podmínky pro kvalitní žurnalistiku, jsou vyšší, pokud se procesu novináři zúčastní.

Podobný přístup zvolil i Robert Thomson, šéf vydavatelství News Corp: „Aby došlo k zachování rovnováhy, je potřeba, aby vztah mezi technologií a poskytovateli obsahu byl symbiotický, a původ informací musí být ochráněn.“ Tímto citátem se rovněž pochlubila OpenAI na svém blogu.

Jak bude spolupráce nakonec vypadat, to nyní jasné není. Ochota lidí klikat na zdroje informací bude možná nepřímo úměrná tomu, nakolik budou AI souhrnům věřit. A zatím jsou tu indicie naznačující, že jim úplně věřit nemohou.

Zase ty halucinace…

Snad žádná demonstrace vyhledávání s umělou inteligencí by nebyla úplná bez nějaké naprosto zásadní chyby ve výsledcích. Google třeba nedávno uživatelům radil, aby jedli alespoň jeden kámen denně, a přímo v ukázce navrhl, aby uživatel otevřel zadní dvířka fotoaparátu, což by vedlo ke znehodnocení exponovaného filmu.

Také video od OpenAI zjevně nikdo pořádně nezkonroloval. V ukázce SearchGPT byly nepřesnosti ohledně hledaných festivalů. Uživatel v ukázce zadal dotaz: hudební festivaly ve městě Boone v Severní Karolíně v srpnu.

Foto: OpenAI

Podrobnější pohled na výsledky odhalí několik problémů.

Na videu je pět na míru sestavených výsledků. Jak vzápětí upozornil všímavý reportér CNBC Kif Leswing: „První odkázaný festival končí 27. července. Druhý je ve městě Swannanoa, od města Boone vzdáleném přes dvě hodiny cesty autem. Třetí výsledek je koncert, nikoli festival, ale budiž. Čtvrtý výsledek je jen stránka místního kulturního střediska a pátý výsledek je festival, který se koná v červnu.“

Jde samozřejmě jen o ukázku na videu. Ale o to spíše by si mohla firma pohlídat, že do éteru nepustí takovou chybu. Nejspíš je to ale podobné jako u prezentace zařízení Humane AI Pin: při přípravě záleželo na tom, že to vypadá užitečně. Faktickou správnost nikdo netestoval, důležitý byl vizuální dojem.

Vyhledávání na internetu ale patří k činnostem, u kterých na výsledcích záleží. To, že si chatboti vymýšlí (tzv. halucinují, nebo též kecají), je už nyní pro běžné uživatele těžko pochopitelné. Pokud ale bude kecat i vyhledávač, byl by to pořádný kámen úrazu.

Proč umělá inteligence „kecá“

Nástroje jako ChatGPT, Gemini nebo Copilot jsou založené na neuronových sítích a využívají tzv. velké jazykové modely (large language models, LLM). Tyto modely jsou natrénované na velkém množství textu a umí za sebe skládat slova a části slov tak, aby výsledek působil důvěryhodně. To ale neznamená, že jsou výsledky pravdivé.

Těmto nepravdám se obvykle říká „halucinace“ a jde o jednu z hlavních nevýhod, které brání nasazení velkých jazykových modelů do obchodní praxe.

Zatím se ale jedná pouze o prototypy. Lidé se mohou přihlásit na čekací listinu a SearchGPT vyzkoušet v následujících týdnech či měsících. OpenAI ale od začátku říká, že jde o pokus, ze kterého by chtěla případně nějaké funkce přesunout do ChatGPT. I tak ale někteří mluví o tom, že se OpenAI vydává „do války“ s vyhledávačem Google.

Google nyní dominuje světovému vyhledávání s více než 91% podílem. Vyhledávač Bing pak má necelá 4 procenta. Pokud by se ale OpenAI podařilo vyladit SearchGPT tak, aby lidem reálně pomohl najít, co potřebují, mohl by do zasáhnout zejména do mobilního vyhledávání. Tam by totiž lidé nejvíce ocenili, že nemusejí jednotlivé stránky rozklikávat. Až reálné zkušenosti ale ukážou, jak moc se na tyto souhrny budou moci spolehnout.

Doplnění: Do článku jsme doplnili přehled AI vyhledávačů.

Doporučované