Článek
Když ministr Jan Blatný (za ANO) minulý týden hájil před senátory postup vlády proti epidemii koronaviru, odvolával se i na veřejně dostupná data o pohybu obyvatel od společnosti Google. Zdůraznil, že mobilita lidí proti normálu klesla o více než 50 procent, k potlačení nákazy to ale nestačí.
Jeden ze senátorů pak Blatnému vytkl, že podle dat od Googlu nemůže spolehlivě hodnotit situaci. To ministr musel uznat. Správně ale také připomněl, že podrobnější informace o pohybu lidí vláda nemá kvůli ochraně osobních údajů k dispozici.
Jak jsou data, která shromažďují mobilní operační systémy, vlastně spolehlivá? Jak je správně hodnotit a co z nich můžeme vyvozovat?
Na tyto otázky odpověděli v rozhovoru pro Seznam Zprávy experti na geoinformatiku Vít Pászto a Jaroslav Burian z Přírodovědecké fakulty Univerzity Palackého v Olomouci. Ti se spolu s dalším kolegou Karlem Macků v posledním roce zabývali právě využitím dat ze služby Google Locations při sledování epidemie covidu-19.
Z jejich analýz kromě jiného vyplývá, že horská střediska nemusí hrát při šíření nákazy takovou roli, jakou jim přisuzuje ministr Blatný a vláda. Aktivita lidí podle dat od Googlu je nadprůměrná spíše v některých venkovských oblastech.
Právě data z posledních týdnů mají vysokou výpovědní hodnotu, protože Google bere jako srovnávací základnu údaje ze srovnatelného loňského období – od 3. ledna do 6. února 2020.
Když se podíváme na křivky mobility Googlu od druhé vlny epidemie, jak ten vývoj hodnotíte?
Vít Pászto: Zhruba od začátku října je docela dobře vidět, že nastal pokles všech zásadních aktivit, které jsou spojeny s restrikcemi. Nejdramatičtější dopad byl u nákupů mimo základní potřeby, tam byl pokles o 50 procent. Zhruba začátkem listopadu se objevily hluboké poklesy také u lékáren nebo drogerií. To souviselo se zákazem nedělních prodejů. S následným rozvolněním před Vánocemi se všechny aktivity dávaly do jakéhosi průměru, blížily se ose srovnávací základny. Vyrovnávaly se veškeré aktivity – nákupy, doprava, výskyt na pracovištích. Po Vánocích se restrikce opět zpřísnily a mobilita zůstala pod normálem.
Vláda se v posledních týdnech snaží omezit pohyb lidí. Podle dat se ale aktivita Čechů v lednu držela na stabilní úrovni.
Vít Pászto: Jde už o období, kdy můžeme lépe srovnávat, vzorec chování lidí je v zimních měsících podobný. Díky restrikcím se mobilita v obchodech mimo potraviny, drogerie a lékárny snížila více než o 50 procent, v dopravě byl pokles mezi 35 a 40 procenty. Podobně výskyt na pracovišti, který je v průměru pro celé Česko pod 25 procent. Naopak u bydlení je meziroční nárůst kolem 15 procent.
Co sleduje Google
Ve svých pravidelných zprávách o pohybu Google rozlišuje šest kategorií podle typu lokality:
1. Provozovny a volný čas – restaurace, kavárny, nákupní centra, zábavní parky, muzea, knihovny a kina.
2. Potraviny a lékárny – prodejny potravin, supermarkety, farmářské trhy, obchody s potravinovými specialitami, drogerie a lékárny.
3. Parky – národní parky, veřejné pláže, přístaviště, parky pro venčení psů, náměstí a veřejné zahrady.
4. Stanice veřejné dopravy – uzly veřejné dopravy, například stanice metra, autobusové zastávky či vlaková nádraží.
5. Pracoviště.
6. Bydliště.
Google v přehledu zdůrazňuje, že jeho data nemají sloužit přímo k boji s epidemií covidu-19.
Řeší se hlavně nájezdy turistů do hor. V příslušné kategorii „Parky“ jsou zřetelné výkyvy až nad úroveň minulého roku, a to o víkendech. Nejezdili Češi v lednu do hor dokonce více než loni?
Vít Pászto: Dá se říci, že hlavně třetí a čtvrtý lednový víkend byly nadprůměrné, a to v celém Česku. Jsou tam nárůsty o deset, dvacet procent.
Jaroslav Burian: Nemusí to ale primárně souviset jenom s restrikcemi nebo s covidem, velký vliv na to může mít počasí. Právě v tomhle období napadlo nejvíce sněhu. Loni byla také jiná situace v tom, že dominantní část populace, která jela na hory, jela na sjezdovky. V letošním roce bylo sjezdařů určitě méně, naopak běžkařské areály jsou vytížené mnohem více.
To mluvíme o víkendech. Jaká situace je na horách podle dat v pracovních dnech?
Vít Pászto: Je tam zjevný velký propad aktivity. Zaměřili jsme se na okres Trutnov, pod který patří největší střediska v Krkonoších. Oproti loňskému lednu byl pokles ve všedních dnech zhruba o 40 procent. Což se dá vysvětlit tím, že většinou tam v tomhle období jezdí lidé na dovolenou a jsou organizovány lyžařské kurzy. O víkendu je pak nárůst na plus 20–25 procent. Nárůst se přitom neprojevuje jen v kategorii Parky, ale také u dopravy. To nějakým způsobem dokazuje, že lidé tam jezdí jen o víkendu, protože se nemají kde ubytovat.
Má tedy podle vás význam omezovat výlety na hory?
Jaroslav Burian: Z většiny vědeckých článků, které jsem četl, vyplývá, že největší podíl lidí se nakazí v práci, doma a ve škole. Nejsou to horská střediska. Uzavřené kabinky, to je něco jiného, ale pokud se budeme bavit o typickém českém horském středisku, je tam malá šance nákazy – v případě, že lidé nebudou tvořit statické shluky. Omezit lidem cesty na hory v boji proti covidu nepomůže. To, co nám pomůže, je, aby lidé mnohem více pracovali z domova.
Jakou mají data od Googlu vypovídající hodnotu? Například senátor Lukáš Wagenknecht (za Piráty) minulý týden zdůrazňoval ministru zdravotnictví Blatnému, že by se jimi neměl řídit, protože dávají informaci pouze o některých uživatelích mobilních dat.
Vít Pászto: I když jsem velmi rád, že Google poskytuje tyto údaje, ve finále musím se senátorem souhlasit. Je tam spousta neznámých. Data pochází z Google Location History, což je služba na mobilech, kterou uživatel musí mít zapnutou. Při instalaci Google Maps se uživateli služba zapíná automaticky, takže ji musí aktivně vypnout. Otázka tedy je, kolik lidí v analýzách od Googlu opravdu je. Ještě musíme odečíst uživatele Applu, tedy operačního systému iOS, těch je asi kolem 20 procent a bydlí spíše ve městech.
Jde o to, že při sledování pohybu se spojují dva body – signál telefonu a místo, které mohou zařadit do jedné ze šesti kategorií. Celkem ošemetné je to přitom právě s kategorií Park. Když člověk vstoupí do lesa, nevíme, jakým způsobem ho Google zaregistruje. Jestli má u toho místa v podkladových datech přiřazenou nějakou entitu. Zkrátka nevíme přesně, odkud Google zaznamenává, že v tom lese jsme.
Jaroslav Burian: Určitou roli hraje i přesnost určení polohy telefonu. Nejpřesnější možnost je, jak už bylo řečeno, přes aktivaci polohovací systému GPS. Druhá úroveň možného zaměření je z mobilního GSM signálu ze základnových stanic (BTS). Případně se poloha dá určovat ještě z připojení na Bluetooth nebo WiFi. Záleží na uživateli. Někteří lidé mají GPS permanentně puštěnou a jejich data budou logicky velmi přesná, jiní ji zase mají trvale vypnutou. Ani signál z GPS přitom nemusí být přesný, obzvlášť ve městech. Může se stát, že je poloha zaměřena s odchylkou 50 i více metrů, a rázem jste přiřazen do jiné lokality. V některých městských budovách jsou v přízemí obchody a nad nimi kanceláře nebo byty a může být otázka, jak věrohodně se zobrazí místo výskytu. Další věc je věková skladba vzorku. Dá se předpokládat, že starší lidé nebudou mít tolik chytrých telefonů, které tyto služby umožňují.
Na druhou stranu ale platí, že data od Googlu jsou ta nejlepší dostupná data.
Vít Pászto: Pro veřejnost je Google asi nejlepší zdroj dat o aktuální mobilitě. Ale řídit podle nich vládní opatření, to bych byl velmi opatrný. Můj osobní názor je, že nejlepší data by byla přímo od mobilních operátorů. Pokud jsme v situaci, kdy je ohroženo lidské zdraví, měli bychom se trochu uskromnit v požadavcích na ochranu osobních údajů. Stát by si klidně mohl s operátory domluvit nákup dat. Ta se dají také anonymizovat. Na základě takových dat by se opravdu dala dělat opatření cílená na určité segmenty. Čím větší detail, tím lépe. Mohli bychom pak snáze odhalovat jednotlivá ohniska, například že je v určitém podniku nebo zařízení.
Jak kvalitní data máme na úrovni okresů?
Jaroslav Burian: Problém je trochu v tom, že z lokalit, ze kterých má Google málo údajů, data vůbec nepublikuje. Spousta okresů je vlastně prázdná, protože z nich nesehnal dostatek anonymních dat. Za celé Česko nebo za kraje se tedy můžeme jeho výstupy jakžtakž řídit, ale detail nemáme, a nemůžeme proto data zanalyzovat na místní úrovni. I proto by se vláda neměla řídit těmito údaji.
A u těch okresů, kde data jsou, existují nějaké odlišnosti?
Vít Pászto: Všimli jsme si, že velká města, která jsou jasně ohraničená v rámci okresu, například Ostrava-město nebo Brno-město, měla v kategorii „Parky“, tedy volnočasových aktivit, velmi podprůměrné hodnoty. Například u Ostravy byl pokles až 60 procent. Je tam přitom docela dost zelených a otevřených ploch, ale asi nejsou využívány.
Čím si to vysvětlit?
Vít Pászto: O tom se zatím můžeme spíš jen dohadovat. Jde také o vymezení administrativní jednotky. Zatímco u Ostravy je to opravdu jen městská zástavba, v okrese Olomouc jsou zahrnuty i okolní obce. Narazili jsme na jeden aspekt, který by to mohl vysvětlovat – studenti. Ti tvoří významnou část komunity. Pracujeme tedy s předpokladem, že mladší lidé aktivněji využívají volný čas.
Výrazný pokles aktivity zaznamenaly i Karlovy Vary nebo Český Krumlov, tam je to ale způsobené omezením cestovního ruchu. Naopak nadprůměrnou mobilitu ve volnočasových aktivitách bez ohledu na víkend nebo pracovní týden měly některé okresy na Vysočině a v jižních Čechách – Písecko, Českobudějovicko, Jindřichohradecko. Ve srovnání s minulým rokem mají v kategorii „Park“ vyšší aktivitu. V pracovních dnech pak vyniklo vyšší aktivitou Zlínsko. Většinou jsou ty aktivnější okresy spíše venkovského charakteru bez významných horských oblastí.