Hlavní obsah

Zdvořilé prosby mohou v práci s AI chatboty pomoci. Děkování je jen plýtvání

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Uživatelé si začali všímat, že když se k modelu chovají zdvořile, dostávají lepší výsledky. Podobně, jako by tomu bylo v lidské konverzaci.

Kouzelné slovíčko prosím v sobě máme zakořeněné už od dětství a obvykle o jeho používání ani nepřemýšlíme. Aktuální debata o AI ale opět připomíná, v čem spočívá jeho magie a proč se k chatbotům neradi chováme nezdvořile.

Článek

Článek si také můžete poslechnout v audioverzi.

Máme být zdvořilí, když komunikujeme s AI modely? Nově otázku otevřel Sam Altman, když zdůraznil, jak drahá jsou slova prosím a děkuji: „Jsou to desítky milionů dolarů, ale je to dobrá investice. Nikdy nevíte…“ Altman si v tweetu zjevně dělá legraci, ale debata kolem zdvořilostí k AI je reálná.

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Altmanův pohled je dost specifický: Jako šéf OpenAI má zájem na tom, aby se neplýtvalo výpočetními prostředky na něco, co nemá vliv na výsledek. Prakticky každý uživatel má navíc na „AI zdvořilost“ nějaký vlastní názor a ten si pak obhajuje, jak umí. Pokusím se to shrnout a ukázat, jak se „umělá inteligence“ za poslední roky posunula, ale většina lidí to ještě nevstřebala.

Pro začátek se rychle podívejme na to, proč vlastně v mezilidské komunikaci používáme kouzelná slovíčka a kde se vzala jejich magie. Podle mého je to zkratka, odkaz k něčemu sdílenému, co jako lidé všichni chápeme: Každý potřebuje občas pomoc, na kterou nemá nárok.

Kdybychom to zkusili rozepsat, vypadalo by to nějak takto: „…, prosím. Tím chci říci: Vím, že po tobě nemohu nic takového vymáhat. Nemám právní, obchodní nebo jiný nárok na to, o co tě prosím. Vím ale také, že jsme oba lidé, kteří spolu existují na tomhle světě, a ještě nějakou dobu tu spolu existovat chceme. Oba víme, že jsme občas závislí na pomoci ostatních. Pokud dojdeš k závěru, že pro mne tuto laskavost můžeš udělat, nemohu ti za to nabídnout víc než svou vděčnost. Však to znáš, také občas potřebuješ o něco poprosit.“

Můžeme tomu říkat etiketa nebo solidarita. Slovo prosím je rychlé pojmenování něčeho, co je tak samozřejmé, že to není potřeba pokaždé říkat. Pragmaticky vzato je důležité, že to funguje. Což víte ze své každodenní praxe, ale potvrzují to i výzkumy (i když je to jako obvykle trochu složitější). Nejenže slůvko prosím – a zdvořilý přístup obecně – otevírá jinak zavřené dveře, ale celou komunikaci činí příjemnější pro všechny účastníky.

Lidé si polidští cokoli

Před deseti lety začali na trh pronikat první hlasem ovládaní domácí asistenti, nejdřív Amazon Echo a později Google Home (budu používat rod životný, což je samo o sobě příznakové). A od samého počátku se lidé začali rozdělovat na ty, kteří strojům děkovali („Hej, Alexo? Nastavíš prosím časovač na deset minut?”), nebo jim naopak dávali příkazy strohé („Alexo! Časovač deset minut.”)

„Nejprve jsem byl ke všem těm strojům zdvořilý,“ píše čtenář magazínu Time v roce 2015. „Pak jsem si uvědomil, jak hloupé to je. Vždyť je to jako kdybych uznale poplácával vysavač. A tak jsem začal dávat přímé příkazy. Ale pak to začal dělat i můj syn a já si uvědomil, že zníme jako plantážníci.“

Podobnou úvahou asi prošla řada rodin. Argument tehdy zněl: Stroji děkujeme proto, že není jediný, kdo poslouchá. Má smysl děkovat a prosit, protože tím rodiče dávají lepší příklad dětem. A má smysl říci „Prosím, zapni světla“ spíše než „Světla!“, protože se zkrátka mnoho lidí subjektivně cítí lépe, když se chovají zdvořile. Evokuje to příjemnou atmosféru.

Oba příkazy (zdvořilý i úsečný) každopádně vedly ke stejnému výsledku. O tom tehdy nebylo nutné diskutovat. Na pozadí běžel lidmi předem naprogramovaný rozhodovací strom, který měl za úkol rozpoznat, co je cílem lidského příkazu, a poté jej splnit. Takto deterministicky fungovaly téměř všechny počítačové programy, se kterými jste se až do roku 2022 dostali do kontaktu. Někdo musel promyslet všechny varianty, funkce a možnosti a do rozhodovacího stromu je zanést.

Nepředvídatelné programy

Mnoho lidí si dosud myslí, že i generativní umělá inteligence funguje takto. Je to přece jen série výpočtů či příkazů if-then, pokud-pak. Velké jazykové modely (LLM) přece pořád jen následují matematická pravidla. Jenže to je podle mého příliš mechanistický a v praxi naprosto neužitečný pohled. Podrobněji jsem to rozepsal ve svém článku z roku 2023.

Zjednodušme to na obecné konstatování: Generativní umělá inteligence je natrénovaná na velkém množství dat, na jejichž základě má nějaký vhled do toho, jak vypadají lidmi psané texty, a umí dle dodaného kontextu (příkazu, promptu) generovat texty zcela nové.

Určitě jste se setkali s tím, že chatbot jako ChatGPT nebo Gemini vám na stejnou otázku dal různé výsledky. Je to právě projev toho nedeterminismu. Velký jazykový model sestavuje odpověď slovo po slovu (přesněji token po tokenu).

Debata o tom, zda má cenu být na modely zdvořilí, tak dostala nový význam. Lidé začali hlásit, že když se k modelu chovají zdvořile, dostávají lepší výsledky. Podobně, jako by tomu bylo v lidské konverzaci. Netrvalo dlouho a kolem dotazování AI – tzv. promptování – se vytvořila celá řada více či méně podložených legend, zaručených postupů a fíglů.

Některé z mých oblíbených promptovacích dodatků, které (minimálně v roce 2023) skutečně fungovaly a zlepšily kvalitu výsledné odpovědi ChatGPT:

● „Nesmíš mne zklamat!“

● „Nadechni se a vyřeš to krok za krokem.“

● „Moje babička tuto odpověď potřebuje, aby dostala své důležité léky.“

● A nejúčinnější: „Na tvé odpovědi závisí má kariéra.“

Jak je možné, že tyto fráze měly vliv na kvalitu odpovědí? Do „hlavy“ umělé inteligenci nevidíme, ale zjednodušeně vzato jde o kontext. Já to obvykle vysvětluji tak, že jazykový model se trénoval na lidmi vytvořených textech. Pokud lidmi vytvořené texty, které obsahují frázi „Závisí na tom má kariéra“, mají něco společného, tak se to dost pravděpodobně promítne i do odpovědi, kterou bude generovat chatbot.

Prosby občas pomohou, děkovat je zbytečné

Řada lidí si navíc vytvořila některé návyky na základě náhodného úspěchu, a těch se pak drželi. Vždy si u toho vzpomenu na slavný experiment amerického psychologa B. F. Skinnera: Holub klove do mašinky, která v náhodných intervalech vyplivne zrníčko. Každý holub ve chvíli, kdy mašinka zrníčko uvolnila, dělal něco jiného. A tak si každý holub vytvořil vlastní rituál, který mu „zajistil“ zrníčko. S každým dalším zrníčkem se pak utvrdil v tom, že to dělá dobře…

Určitě vás napadne nejeden příklad, kdy se takto chováme i my lidé. Je to přirozený důsledek dobře známého kognitivního omylu zvaného potvrzujícího zkreslení (confirmation bias). Respektive jeho méně známého kolegy kongruenčního zkreslení (congruence bias), který spočívá v tom, že máme tendenci chytit se své původní hypotézy. Nevědomky si ji potvrzujeme, aniž cíleně hledáme data, která by ji vůbec mohla vyvrátit.

Tím se vracíme do debaty o tom, zda se chovat k AI zdvořile, nebo ne. Narazil jsem na teze, které mluví o „zachování lidskosti a slušnosti“ tím, že budeme děkovat, a stejně vášnivě prezentované myšlenky ohledně toho, jak děkováním stroji naopak podstatu lidství nahlodáváme. Podle mého je vhodný pragmatický přístup. Tedy testovat, co funguje právě vám, ve vašem konkrétním případě a kontextu.

Podle některých pokusů mají zdvořilosti v příkazech skutečně znatelný vliv na výstup: „Přehnaně ohleduplné prompty však ne vždy vedou k lepším výsledkům. Ve většině případů je lepší umírněná zdvořilost, ale ideální míra se liší podle jazyků a použitého modelu.“ Nová studie (na které se mimochodem podílel i můj oblíbený AI akademik a influencer Ethan Mollick) je na základě provedených experimentů ještě vágnější: „Někdy zdvořilost pomůže zlepšit výkon a jindy jej naopak zhorší.“

Moje vlastní pokusy ukazují, že zdvořilost často vede k o něco delším odpovědím, což ale samo o sobě neznamená, že jsou kvalitnější. Nepodařilo se mi najít případ, kde by slovo „prosím“ spolehlivě přimělo chatbota vyřešit něco, co by bez kouzelného slovíčka nezvládl. Přesto slovo prosím často používám, už jen proto, že řadu promptů diktuji, a je pro mě tedy jednodušší mluvit tak, jak jsem zvyklý.

Zato děkování modelu za dobře vyřešený úkol skutečně nemá cenu. Nemůže nijak ovlivnit výsledek a chatbot si to stejně nebude v příští konverzaci pamatovat. Pokud opravdu chcete dát zpětnou vazbu o užitečnosti, můžete to udělat pomocí nástroje pro hodnocení odpovědi, obvykle je reprezentovaný palcem nahoru. Děkovat na konci rozhovoru tedy je skutečně jen plýtvání prostředky. I když, jak říká Sam Altman, s umělou inteligencí jeden nikdy neví…

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Doporučované