Hlavní obsah

Čeká nás ještě hodně práce, říkají autoři volebního experimentu

Foto: Seznam Zprávy, Shutterstock.com

Ilustrační foto.

Kromě klasických průzkumů se před letošními volbami konal i jeden netradiční experiment. Skupina vědců se pokoušela z nereprezentativního vzorku předpovědět výsledek jednotlivých stran. Jak jsou s experimentem spokojeni?

Článek

Předpověděli vítězství Spolu i neúčast komunistů a sociálních demokratů ve Sněmovně. Zároveň však výrazně podcenili ANO a přecenili Piráty. Skupina vědců z Katedry sociologie Filozofické fakulty Univerzity Karlovy a Sociologického ústavu Akademie věd ČR poprvé na větším vzorku lidí vyzkoušela experiment, který by mohl zlevnit průzkumy. A jak se povedl?

„S výsledkem, který jsme publikovali okamžitě po uzavření volebních místností, samozřejmě příliš spokojení nejsme. U dvou klíčových uskupení, hnutí ANO a koalice Pirátů a STAN, jsme se netrefili o přibližně šest procentních bodů. To je prostě velký problém,“ rekapituluje jeden z autorů Jaromír Mazák.

Autoři experimentu

Experiment připravili Jaromír Mazák, Ph.D., Mgr. Aleš Vomáčka a Mgr. Matouš Pilnáček.

Všichni autoři působí na Katedře sociologie Filozofické fakulty Univerzity Karlovy a na Sociologickém ústavu Akademie věd ČR. Akci oficiálně nezaštítila ani jedna z institucí, ředitelé obou s ní však souhlasili.

Sběr dat technicky zajistila agentura NMS.

Určitou útěchu by podle Mazáka mohli vidět v tom, že spolu s výzkumem Kantar CZ a DataCollect jediní předpověděli vítězství koalice Spolu. A když odhlédneme od tří největších kandidujících celků, experiment poměrně přesně předpověděl výsledky dalších subjektů. Například u SPD, ČSSD, Přísahy, KSČM, TSS ani Zelených se vědci nikde nemýlili o více než jeden procentní bod.

Úspěch byl jen částečný

Odhady od SPD dál Mazák považuje za pěkné, přehnaným optimismem však nehýří: „Celkové pocity jsou v tuto chvíli spíše takové, že nás čeká ještě hodně práce, abychom zjistili, jestli lze tu metodu vylepšit, aby v českém kontextu fungovala lépe.“

Jak ale autoři podotýkají, pokus měl i vysloveně kladné prvky. „V čem náš experiment naopak očekávání předčil, je množství dat, která se nám podařilo získat. To je pro nás velké bohatství, ze kterého se budeme dále učit,“ říká další z autorů Aleš Vomáčka.

Dat mají podle svých slov výzkumníci tolik, že nyní můžou porovnávat například odpovědi ze všedních dnů a víkendů, ale také na to, aby se pokusili o zpětné predikce na úrovni krajů či okresů.

Jak probíhal sběr dat

Data pro experiment pomáhaly získat redakce Seznam Zpráv, Deníku N a Novinek. Všechny tři servery publikovaly článek, ve kterém mohl kdokoliv dobrovolně vyplnit krátký dotazník, na základě kterého se pak výzkumníci snažili odhadnout výsledek voleb.

„Klady experimentu jsme znali od začátku: Reprezentativní výzkum není levná záležitost a v porovnání s ním by naše metoda mohla být poměrně levná,“ vypichuje pozitivum Matouš Pilnáček. Další výhodou je pak to, že nikoho neoslovují telefonicky nebo přímým oslovením, což může být pro lidi nepříjemné. Ankety se může zúčastnit, kdo chce.

Zápory sociolog vidí například v tom, že u nereprezentativního vzorku musí dělat předpoklady. Jedním z nich je, že lidé, kteří anketu vyplní, se budou chovat stejně jako ti, kteří ji nevyplnili.

„Konkrétně pokud jste například muž s vysokoškolským vzděláním ve věku 34 let, který bydlí v okrese Hradec Králové a volil v minulosti Piráty, tak nám nevadí, že se takových účastní ankety proporčně více, než kolik jich je v populaci,“ vysvětluje Pilnáček na příkladu. „Neumíme ale ošetřit, když ti, kdo anketu vyplní, s větší pravděpodobností zůstanou věrní Pirátům, než stejně definovaní muži, kteří ale tu anketu nevyplní,“ dodává.

Metoda také silně závisí na kvalitě veřejně dostupných dat o populaci. Bez jejich detailní znalosti je relevantní měření složité.

Výzkum nekončí

Zda se postup osvědčil, je podle autorů ještě brzo soudit. V porovnání se zeměmi, kde jsou většinové volební systémy, byl výsledek horší. Vědci si navíc předem stanovili kritéria, podle kterých budou úspěch posuzovat. Ta Seznam Zprávy popisovaly v tomto článku.

Ve zkratce: šlo o porovnání absolutní odchylky průměrných odhadů renomovaných agentur a výzkumníků. Agentury měly tuto hodnotu 1,6, experiment měl 3,2. „Vešli jsme se tedy do jeden a půl násobku té hodnoty, kterou jsme si dali jako referenční. To jsme původně chtěli hodnotit jako velmi dobrý výsledek vzhledem k tomu, že jde o experiment,“ vysvětluje Mazák.

Vědci však nakonec neslavili. „Vzhledem k tomu, že se naše odchylka tolik koncentrovala u dvou klíčových volebních uskupení, nakonec to hodnotíme méně pozitivně,“ přiznává sociolog.

Autoři přesto podle svých slov plánují metodu využívat i nadále. První fáze je práce s daty, která se povedlo před volbami nasbírat. „Model, se kterým pracujeme, má hodně parametrů. Budeme zkoumat, jestli jsme je nemohli pro český kontext nastavit nějak lépe, aby to vycházelo přesněji,“ popisuje další plány Aleš Vomáčka. „Několik nápadů už máme. Ten publikovaný odhad byl prostě první výkop, protože mezi ukončením sběru dat a publikováním modelu bylo dost málo času.“

Zlepšení si autoři slibují také od toho, že po zveřejnění výsledků budou mít k dispozici i aktuální data ze Sčítání lidu, domů a bytů 2021. Znalost přesného rozložení populace je totiž pro fungování modelu důležitá a oni museli vycházet do velké míry z neaktuálních informací.

Metoda může mít uplatnění i mimo volby

Pokud by se nakonec ukázalo, že metoda může být přesnější a může poskytovat užitečné výsledky, nebude další postup jen na výzkumnících. „S kolegy jsme hodně zastánci otevřené vědy. Nelíbí se nám, když někdo něco za veřejné peníze zkoumá a pak si třeba tu metodologii drží pro sebe a neposkytne ji dál,“ vysvětluje Mazák. „Plánujeme proto zveřejnit všechny naše pokusy včetně skriptů, které modely počítají, v odborném časopise.“

Metoda by mohla pomoci například s výzkumem subpopulací, kde je obtížné dělat reprezentativní výzkum. V případě voleb by zase mohla pomoci s modelací preferencí na úrovni krajů až okresů.

„Potenciál vidíme také v aplikaci metody na běžná reprezentativní data, která ale trpí tím, že řada lidí se odmítá výzkumu účastnit. Pomocí naší metody by šlo tento nedostatek kompenzovat a domníváme se, že snad lépe než pomocí běžného vážení,“ říká Pilnáček. „Možností je tedy hodně.“

Doporučované