Hlavní obsah

Komentář: Jak číst americké předvolební průzkumy

Matěj Jungwirth
spolupracovník
Foto: Shutterstock.com

Bude to Donald Trump, nebo Kamala Harris? Podle průzkumů jsou šance obou vzácně vyrovnané.

Díky moderním metodám dotazování a pokrokům ve statistické analýze dat z průzkumů veřejného mínění jsou současné odhady výrazně lepší než věštění z čajových lístků, ale stále jde o odhady výsledku, který je z definice nejistý.

Článek

V posledních frenetických dnech prezidentské předvolební kampaně v USA americká média publikují výsledky desítek průzkumů veřejného mínění každý den. Běžní čtenáři, akademičtí experti i stratégové obou hlavních politických stran pak tráví nespočet hodin nad časovými řadami (Má popularita Harris vzestupný trend, nebo spíše stagnuje?), výsledky pro specifické podskupiny voličů (Nakolik si Trump polepšil mezi afroamerickými muži?) či nad širšími postoji americké veřejnosti (Do jaké míry zvýší potratové referendum v Arizoně účast v prezidentských volbách jako takových?) v sibylovské snaze odhadnout budoucnost.

Vzhledem k počtu a frekvenci, se kterou jsou americké průzkumy veřejného mínění nyní publikovány, nepřekvapí, že výzvu – především pro běžného pozorovatele mimo USA – znamená už jen zorientovat se v nich. Nabízím proto návod pro české pozorovatele amerického prezidentského klání. Píšu ho z pozice obyvatele státu Wisconsin, tedy jednoho ze sedmi amerických swing states, které mají tu zvláštní čest, že v zásadě rozhodnou o tom, zda Bílý dům na příští čtyři roky ovládne Donald Trump, nebo Kamala Harris. Píšu zároveň z pozice doktoranda politologie na Northwestern University a s několika lety pracovní zkušenosti z ústavu pro výzkum veřejného mínění STEM.

Pro začátek: Víte, který průzkum veřejného mínění je vždy nejpřesnější? Vlastní výsledek volebního klání. Může to sice znít jako opakování stokrát omílané pravdy, ale přesto stojí za to mít na paměti, že všechny průzkumy veřejného mínění a na ně navázané volební modely zkouší co nejpřesněji odhadnout jeden singulární budoucí výsledek – v tomto případě, kdo vyhraje americké prezidentské volby příští týden.

Díky moderním metodám dotazování a pokrokům ve statistické analýze dat z průzkumů veřejného mínění jsou současné odhady výrazně lepší než věštění z čajových lístků či (poslední dobou v USA čím dál častěji skloňované) házení mincí, ale stále jde o odhady – byť poměrně erudované – výsledku, který je z definice nejistý.

Lekce první: Nesměšujte volební průzkumy s predikcemi šance na vítězství

Téměř každý volební průzkum z posledních měsíců má nějakou verzi otázky na to, koho by daný respondent volil v prezidentském klání. V agregované podobě desítek či stovek takových průzkumů pak zjistíme, že na celoamerické úrovni má Harris na Trumpa náskok jednoho až dvou procentních bodů (byť tento náskok se v posledních týdnech snižuje) – viz třeba tracker projektu 538. Oproti tomu odhady šance na vítězství, tak jak je třeba simuluje The Economist, pracují s velkými statistickými modely, které opakovaně simulují volby na základě vstupních dat a posléze skončí u tvrzení typu „Harris zvítězí v 50 případech ze 100“.

Zdroj zmatení mezi těmito dvěma základními odhady amerických voleb je podle mě v tom, že numericky se obě tyto hodnoty pohybují v téměř stejné rovině. Že jde ale o diametrálně odlišné koncepty, je vidět třeba na „komerčním“ sázkovém trhu, který nyní Trumpovi přisuzuje více než 60procentní šanci na vítězství. Zde je ale potřeba zvláštní opatrnosti, protože se mluví o možném vlivu velkých hráčů z oblasti kryptoměn, kteří se snaží o manipulaci se sázkovými kurzy v Trumpův prospěch.

Lekce druhá: Sbor volitelů se nepodřizuje hlasu většiny

Navzdory zdánlivé jednoduchosti amerického systému dvou dominantních stran a s nimi spojených prezidentských kandidátů nejsou tamní prezidentské volby jednoduchým referendem, kde by zvítězila ta strana, která přesvědčí prostou většinu voličů.

Proto můžete mít nesmírně přesné volební odhady toho, jak budou hlasovat občané USA v celkovém agregátu napříč všemi 50 státy (tzv. popular vote), ale to vám stále neprozradí konečného vítěze. Viníkem je kuriózní a historicky podmíněný institut Sboru volitelů (Electoral college), tedy systém, kdy ve všech státech kromě Nebrasky a Maine všechny státní volitele (jejichž počet se odvozuje od populace státu) bere kandidát, který získá prostou většinu v daném státě. V praxi to znamená, že není žádný rozdíl v tom, zda kandidát v daném státě zvítězí o pár stovek hlasů, nebo tzv. o parník – volební zisk je v obou případech stejný. Od roku 2000 republikáni absolutní většinu hlasů pro svého kandidáta získali jen jednou (v roce 2004), ale i tak získali tři volební vítězství prostřednictvím Sboru volitelů.

Lekce třetí: Stačí sedm statečných houpaček

Pokud se chcete přes průzkumy veřejného mínění dopídit co možná nejfundovanějšího odhadu vítěze amerických voleb, stačí se zaměřit na kvalitní volební průzkumy v sedmero tzv. swing states (Arizona, Georgia, Michigan, Nevada, Severní Karolína, Pensylvánie a Wisconsin). Na rozdíl od ostatních 43 států u těchto sedmi není dopředu jasné, kterého kandidáta zvolí, a jejich celkem 93 hlasů Sboru volitelů je tak ve hře.

Volební průzkumy v jednotlivých swing states jsou stále velmi vyrovnané, většinou v rámci rozdílu do dvou procentních bodů, což je v rámci směrodatné odchylky. Jinak řečeno – rozdíl, který tyto průzkumy mezi kandidáty ukazují, může být jen odrazem statistického „šumu“, nikoliv skutečného rozdílu. To v kombinaci s výše popsaným systémem „vítěz bere vše“ paradoxně otevírá dveře možnosti, že jak Trump, tak i Harris zvítězí o výrazný počet delegátů Sboru volitelů.

Lekce čtvrtá: Ďábel se schovává v drobném fontu na konci reportu

Mnoho firem a agentur ve Spojených státech nyní měří volební postoje, ale ne všichni tak činí kvalitně a čestně. Kvalitní agregátní modely proto numericky hodnotí kvalitu jednotlivých agentur a přidávají či ubírají váhu jejich průzkumům (typicky tak činí projekt 538 nebo jeho zakladatel Nate Silver). Každý průzkum veřejného mínění by měl ve svých výstupech transparentně uvést základní informace o metodologii sběru dat včetně směrodatné odchylky – pokud tyto informace úplně chybí, jde o jasný varovný signál.

Americký politolog Josh Clinton však v nedávno publikovaném článku demonstruje, že výzkumné agentury stále musí udělat sérii úprav, které mohou mít zásadní vliv na konečný numerický výsledek volebního modelu. Podle Clintona bychom se při zkoumání kvality konkrétního volebního průzkumu v USA měli zaměřit na následující čtyři oblasti:

  1. Do jaké míry odpovídá výzkumný vzorek (tj. typicky tisícovka konkrétních respondentů) celkovému elektorátu USA / konkrétního státu z demografického hlediska?
  2. Do jaké míry odpovídá výzkumný vzorek širšímu elektorátu politicky, tj. z hlediska stranické identifikace?
  3. Víme, kteří respondenti budou skutečně volit? Tj. i kdybych měl sebelepší informaci o tom, koho by respondenti volili hypoteticky, tato informace má omezenou užitečnost, pokud není doplněná o to, kdo z mých respondentů skutečně volit půjde.
  4. Do jaké míry důvěřuji tomu, že respondenti mého průzkumu odpovídají širší populaci? Pokud například Trumpovi příznivci z řad nezávislých voličů ve výrazně nižší míře reagují na pozvání do průzkumů, pak mám slepou skvrnu, kterou nenahradí sebelepší úpravy průzkumných dat.

Rozhodnout může i počasí

Ačkoliv si sám neodhaduji tipnout vítěze amerických prezidentských voleb, jsem si naprosto jistý následujícím: Ve dnech a týdnech po volbách se to v americkém i českém prostředí bude jen hemžit „experty“, kteří budou hlásat, že Harris/Trump zvítězil/a, protože X, Y nebo Z.

Bez ohledu na to, jak jsou těsné volební průzkumy a predikce vítězství amerických voleb, ve dvoupartajním systému máte vždy šanci 50 na 50, že vítěze trefíte jen tak, nablind. Z hlediska průzkumů veřejného mínění proto bude například mnohem zajímavější hodnotit, které modely trefí výsledek ve všech sedmi swing states, kde je už jen šance 1 : 128, že správnou výslednou konstelaci trefíte náhodnou tipovačkou (za předpokladu nezávislosti mezi výsledky jednotlivých států, který nemusí, přiznávám, platit absolutně).

Poslední zmínku si zaslouží tzv. známé neznámé, které mohou tyto volby na ostří nože rozhodnout – počasí v klíčových státech ve volební den, stále nejasný důsledek devastujících hurikánů v Severní Karolíně a Georgii na volební účast či sportovní výsledky místních univerzitních sportovních týmů. Ve světle těchto v podstatě nepředvídatelných faktorů bych proto doporučoval zdravou dávku skepse vůči analytikům, kteří svá vysvětlení výsledku amerických voleb budou stavět pouze na jednom či dvou zdánlivě klíčových faktorech.

Doporučované