Hlavní obsah

Pod čarou: Jen z čísel pravdu nepoznáme. Posedlost daty nám omezuje obzory

Foto: Barbora Tögelová, Seznam Zprávy

Stále častěji se debatuje o posedlosti daty, a v poslední době vyšlo hned několik zajímavých článků i knih, které tento problém popisují ve velmi zajímavém světle.

Někdy se zdá, že to s důrazem na měření a data trochu přeháníme – třeba jako teď, když děti napjatě čekají, jakou životní cestu jim předurčí percentil získaný v přijímačkách od Cermatu.

Článek

V newsletteru Pod čarou popisuje každou sobotu Matouš Hrdina společenské trendy, které sice vídáme všude kolem sebe, ale v přílivu každodenního zpravodajství trochu zanikají mezi řádky. Pokud vás ukázka zaujme, přihlaste se k odběru plné verze newsletteru.

Občas se mi zdá, jako bychom převod reality na fakta, čísla a data brali jako naprosto samozřejmou a tím i téměř nepostřehnutelnou záležitost. Každý argument musí být „podpořen fakty“. Politici, byznysmeni i aktivisté všeho druhu své návrhy zdůvodňují s poukazem na „čísla“. Naše plány a budoucnost si musíme „spočítat“. A když budeme mít o všem dost čísel a údajů, státním rozpočet počínaje a osobním spánkovým režimem konče, budeme vše také moci lépe zanalyzovat a optimalizovat k většímu výkonu a efektivitě.

O posedlosti daty byly už od nástupu osvícenství a průmyslové revoluce napsány stohy knih. Spolu s rozvojem výpočetní techniky ale tento jev dostal novou dynamiku a „datafikace“ společnosti postupuje v přímé úměře k tomu, jak se z dříve obtížně zachytitelných souvislostí mezi hromadami údajů stává jeden z ústředních statků současné ekonomiky. Potíž pak není jen v tom, že vše v touze po zisku převádíme na data, ale především ve způsobu náhledu na svět, který je kvůli optice dat a čísel stále omezenější a pokřivenější.

Konec mystiky a začátek čísel

Shrnout rozsáhlou globální debatu o posedlosti daty do krátkého newsletteru je trochu sisyfovský úkol, ale dobrým startovacím bodem může být povedená esej, kterou nedávno publikovala reportérka New Yorkeru Jill Leporeová. Vysvětluje v ní, že všechny naše představy a poznatky o světě můžeme formálně rozdělit do čtyř základních kategorií – záhady, fakta, čísla a data.

Záhady jsou nepoznatelné věci mezi nebem a zemí, které také většinou spadají do sféry náboženství. Fakta můžeme přímo odpozorovat nebo dovodit. Čísly můžeme popsat vše, co lze změřit a spočítat, a data jsou v tomto kontextu informace, které nemůžeme poznat přímo, ale dospějeme k nim pomocí počítačové analýzy, která odhalí vzájemné souvislosti.

Počátek okouzlení daty spadá již do doby prvních mechanických počítačů, ale Leporeová upozorňuje, že zásadním impulzem pro datový boom byla až studená válka, ve které se znesvářené strany pokoušely odhadnout budoucí chování protivníka právě prostřednictvím datové analýzy.

Předpovídací a vyhledávací algoritmy Netflixu, Amazonu či Googlu jsou tak přímým dědictvím této éry (Leporeová glosuje, že byznys ve 21. století spočívá v aplikaci špionážních metod za účelem zisku), což ale zároveň ukazuje na limity těchto technologií – filmy, reklamy či vyhledávací výsledky jsou nám dnes servírovány se stejně pochybnou přesností, s jakou analytici CIA zkoušeli skrze čísla věštit záměry lídrů v Kremlu.

Přínos moderních metod datové analýzy nejde obecně zpochybňovat, v řadě oblastí vedly k zásadnímu pozitivnímu pokroku a nikdo nejspíš netouží po návratu k tužce a papíru. Na šikmou plochu se ovšem dostaneme ve chvíli, kdy je začneme vnímat jako primární a nejdůležitější metodu poznání a jiné z výše uvedených přístupů začneme upozaďovat.

Možná nejpříměji se to projevuje v sociálních vědách, kde je na data a kvantitativní metody kladen stále větší důraz a jen důkazy získané z rozsáhlých datových analýz působí před veřejností, politiky, novináři i grantovými komisemi tím pravým dojmem solidnosti a efektivity.

Pamatuji si, jak jsem při studiích poprvé přičichl k automatizovaným analýzám sociálních sítí a fascinovaně hleděl, jak se z nicneříkajících tabulek a čísel najednou vytvářejí okouzlující spletité grafy ilustrující uzly a informační kanály, a až později mi došlo, že pokud se také s uživateli příslušných sítí nezačnu normálně bavit, dozvím se stejně kulové (na tento problém už jsem zabrousil v jednom z nedávných vydání Pod čarou).

Pošetilé úšklebky „datových“ sociologů či ekonomů na adresu zdánlivě neefektivních filozofů, historiků či antropologů jsou ale jen nejviditelnějším příznakem problému, který se projevuje i v mnoha jiných oblastech života a společnosti.

Každý krok pod dohledem

Politikům a ekonomům datové „klapky na očích“ znemožňují vnímat věci, které nelze vykoukat ze statistik, a podobného omylu se někdy dopouští i v současnosti velmi populární datová žurnalistika, která bývá v méně povedených případech redukována na líbivé grafy a vizualizace bez nutného doplňujícího výkladu. Výstižně to ukázali kolegové Petr Juna a Jiří Vokřál, kteří nedávno trefně podotkli, že mladí Češi by se sice čistě podle strohých ekonomických statistik neměli mít zase tak špatně, ale když si s nimi promluvíte, zjistíte, že situace rozhodně tak růžová není a je potřeba brát ohled i na věci, které z grafů vykoukat nelze.

Společnost, ve které se vše redukuje na vyčíslitelné hodnoty a jejich souvislosti, lze nazvat metrickou společností, jak zní i český název nedávno vydané publikace německého sociologa Steffena Maua. Přehledně v ní popisuje všechny hlavní způsoby, kterými tato „číselná“ změna dopadá na stát i jeho obyvatele.

Posedlost kvantifikací vede i k posedlosti srovnáváním a následně i vypjatému individualismu, který zasahuje byznys, školství i vědu – žáci jsou už od útlého věku známkováni a rozřazováni, a běda vědci, jehož tvorba je natolik neměřitelná a neuchopitelná, že nevynese žádné body v hodnotícím systému.

Kvůli redukci na čísla najednou člověk dostává vyčíslitelnou hodnotu a status, „zbyteční“ penzisté či nezaměstnaní jsou méně důležití než „produktivní“ pracanti, hvězdičky začínají být přidělovány všemu od restaurací a taxikářů až po turistické atrakce a v neposlední řadě kvantifikujeme sebe sama – stačí si opatřit fitness náramky a příslušné aplikace a pak jen optimalizovat vlastní výkon.

Další ze zajímavých nových publikací navazuje tam, kde Mau končí. Politický ekonom Jathan Sadowski se v knize Too Smart zabývá fungováním současného digitálního kapitalismu, jehož chod je podmíněn právě existencí oné metrické společnosti, ve které lze vše snadno vyčíslit a převést na data. Ta jsou stále důležitější a výnosnější formou kapitálu, a neúprosná ekonomická logika diktuje, že je jich proto potřeba také stále více vytěžovat.

Cenná data o nákupním chování, ale i o pohybu či seznamování lze v aplikacích a na digitálních platformách získávat a zhodnocovat velmi snadno, a když už se vyčerpá i tento zdroj, je potřeba začít těžit jinde.

Příkladů, kde ke škodlivému získávání dat dochází, by se dala najít spousta (osobně mě třeba vytáčí zprostředkování stále většího množství aktivit skrze zbytečné mobilní aplikace), ale Sadowski brojí hlavně proti nejrůznějším „chytrým“ zařízením, která často bývají zbytečnostmi určenými jen k získávání dalších dat o našich životech. Není hlubší důvod, proč by musel neustále posílat data do cloudu chytrý termostat, žárovka či lednička, proč by pořád muselo být online i naše auto, a lákavou návnadou jsou ostatně i oblíbené slevové karty nákupních řetězců, které také jen generují profitabilní data výměnou za směšné benefity.

Sadowski podotýká, že zásadním privilegiem se dnes stává možnost uniknout datovému vykořisťování, a zatímco bohatí si mohou dovolit odpojení ze sociálních sítí, soukromí bez sledování a občasný „digitální detox“, námezdním kurýrům nezbývá než být neustále na příjmu a skladníci Amazonu tráví směny pod dohledem sledovací techniky.

Posedlost daty zásadně přetváří podobu společnosti – pro většinu lidí k horšímu – a Sadowski tak horuje pro „hloupější“ svět odmítající falešná lákadla „chytrých“ zařízení, a pro příslovečné házení písku do soukolí datových mašin. Odvolává se na luddity, kteří na úsvitu průmyslové revoluce v Británii bojovali proti necitlivé industrializaci, a podotýká, že tehdejší rozbíjení strojů nebylo vedeno nenávistí k pokroku a technologiím jako takovým, ale jen požadavkem, aby byly využívány ku prospěchu společnosti, nikoliv k jejímu štěpení.

Radikální řešení nemusí vonět každému, ale i pokud zůstaneme datovému byznysu otevření, je minimálně nutné mít na paměti, že se logika datové (a tedy „pravdivé“ a „efektivní“) vědy navíc začíná propisovat i do sektorů, kam by ji nejspíš vědomě netlačil ani ten největší datový fanatik – když si totiž navykneme rozkládat na čísla práci, studium i volný čas, dříve či později to zkusíme třeba i u malířství nebo poezie.

Když počítače píšou romány

Doslovně se to ukazuje při současném boomu AI generátorů textů a obrazů, které lze v tomto kontextu popsat jako stroje, které se pokoušejí kvantifikovat estetiku a kulturu a převést ji tak na strojově čitelná data. Je to pošetilá snaha sama o sobě, a někteří odborníci navíc varují, že algoritmické třídění a analýza kulturních statků velmi omezuje pestrost jejich nabídky, která se k nám dostává. Jinými slovy, je spousta možností, jak může obraz či film vypadat, ale neuronová síť nám „ušetří práci“ s rešeršemi a hledáním a rovnou vyplivne výsledek, který je dle záhadných datových kritérií ten nejvíc „optimální“.

Proces datafikace kultury ale probíhal už dávno před rozmachem AI. Dobře to popsala blogerka Eleanor Sternová, která příznaky datové a číselné posedlosti mimo jiné popisuje na poli literatury – ceněn je úsporný a stručný styl, dlouhá souvětí s repeticemi a košatým jazykovým stylem jsou takřka smrtelným hříchem, a ti největší milovníci efektivity a stručnosti rovnou přecházejí od beletrie k literatuře faktu.

Jistě za to mohou i jiné vlivy (za stručnost a odpor ke košatému stylu může třeba i styl konzumace digitálních médií), ale i tak je tohle osekávání vyjadřovacích možností neblahým jevem. Literatura a umění obecně jsou jedním z typických příkladů pohledu na život a svět, který se vymyká faktografické logice, a odhaluje díky tomu souvislosti, které lze „datovým“ přístupem jen těžko postihnout. K tomu pak patří i specifické metody práce, třeba právě budování atmosféry a emocí prostřednictvím specifického stylu vyjadřování, a nic z toho nelze analyticky vyčíslit.

Datovou logiku pak nakonec začínáme používat i v oblastech, kde se řada věcí prostě jasně popsat nedá (typicky třeba „vědecké“ návody na to, jak v deseti snadných krocích sbalit vysněného partnera) a nakonec se z analýzy dat a jejich souvislostí paradoxně stává projev magického a okultního myšlení, proti kterému přitom proponenti datafikace tak často brojí.

Když je něco „postaveno na datech“, působí to dojmem solidní a uklidňující pravdivosti, i když může jít o naprostý blud nebo neúplný náhled na věc, a myšlení prostřednictvím emocí (nebo dokonce jen prostého konstatování faktů bez strojového hledání souvislostí) může vypadat jako tmářství, jakkoliv je to ve skutečnosti neméně relevantní přístup.

V komentářích k výše zmíněné eseji od Sternové kdosi výstižně podotkl, že nejlepší formou debaty není navršení hromady čísel a dat, která podpoří náš argument, ale zapojení všech možných typů náhledu na svět, které nakonec obsáhnou i argumenty protistrany a vytvoří ucelený příběh a výklad reality.

Zjednodušeně řečeno, rozum a cit nemusí být v rozporu, jak už ostatně podotýkali i antičtí filozofové, a pokud budeme ke světu přistupovat skrze toto falešné dilema, nebudeme mít jen mizerné výsledky ve vědě, novinařině, politice či umělecké práci, ale nakonec tím uškodíme i vlastní osobnosti.

Jedním z nejzákeřnějších dopadů posedlosti daty je totiž skutečnost, že jejich prostřednictvím sice zdánlivě vysvětlíme všechny zákonitosti fungování světa i vlastní mysli, ale připravíme se tak o skutečnou introspekci – na otázku, proč skutečně dělám to či ono, natož proč tu vlastně jsem, totiž čáry v grafech odpoví jen velmi těžko.

Související témata:

Doporučované