Vědci našli ve starých datech 132 tisíc nových virů a devět koronavirů

Lukáš Marek

Nová metoda hledání v genomových databázích může do konce dekády pomoct objevit přes 100 milionů dosud neznámých virů.

29. 1. 2022 20:33

Světem podle odhadů virologů poletují biliony dosud neznámých virů. Na to, jak málo o virech víme, upozornila zpráva o objevu téměř 132 tisíc nových RNA virů ve starých genomových databázích.

Článek

Nový způsob, jak co nejefektivněji hledat neznámé viry v genomových databázích, se začal rodit zkraje roku 2020. Bioinformatik Artem Babaian, nyní působící na Univerzitě Cambridge, tehdy dostal nápad.

Původně byl Babaian podle časopisu Science jen zvědavý, kolik koronavirů, kromě toho, který zrovna rozpoutal pandemii, se dá najít v již tehdy existujících genomových databázích. Ty shromažďují a archivují data pocházející z genetického monitoringu všech možných virů z různých prostředí od zemědělské půdy přes zvířata až po člověka. Sekvenace podle Science zachycuje genomy nebo alespoň části genomů mnoha různých virů schopných infikovat různé organismy, ale valné většiny si obyčejně nikdo nevšimne.

Spolu s nezávislým expertem na superpočítače Jeffem Taylorem se Babaian pustil do vymýšlení způsobu, jak co nejlépe pročesat data nahraná z celého světa a zpřístupněná americkým Národním institutem pro zdraví (NIH). Databáze má nyní podle časopisu Science 16 petabajtů, což je zhruba podobné množství, jaké by zabraly fotografie každého člověka žijícího ve Spojených státech.

Postupem času se dvojice dala dohromady s několika dalšími bioinformatiky, načež se podařilo vytvořit software, který udělal analýzu dat „jednodušší, než si kdokoliv myslel, že je vůbec možné“. Tým proto později významně rozšířil svůj cíl a místo pátrání pouze po neznámých koronavirech se rozhodl prohledat úplně celou databázi a najít co nejvíc dosud nepopsaných RNA virů. Tedy virů obsahujících ribonukleovou kyselinu RNA, mezi které patří například viry způsobující chřipku, obrnu, spalničky nebo hepatitidu.

Rozvolnění v březnu je reálné, omikron opadne, souhlasí s Válkem odborníci

27. 1. 2022 19:14

Nakonec se jim kromě devíti nových koronavirů a 300 virů souvisejících s virem hepatitidy D podařily odhalit části genomů téměř 132 tisíc dosud neznámých virů. Vědci o tom informovali ve zprávě, kterou tento týden publikoval časopis Nature.

Z toho vznikla nová databáze, jež ve většině případů neobsahuje kompletní genomové sekvence všech nových virů, ale jen genetickou informaci jádrového enzymu. I to nicméně podle Science stačí k tomu, aby se daly vytvářet rodokmeny daných virů a zkoumat jejich evoluce.

Babaianovu týmu se povedlo dosáhnout tempa jednoho milionu zpracovaných datasetů za jeden den. Podle odborníků, kteří na studii nepracovali, jde o velký pokrok, jenž navíc ukázal, jak málo toho o virech kolujících světem víme.

„Ukazuje se náš skandální nedostatek znalostí o této skupině organismů,“ řekl k tomu podle časopisu Science britský odborník na ekologii nemocí Peter Daszak, který stojí v čele organizace EcoHealth Alliance, jejímž cílem je mimo jiné podpora prevence před pandemií. Vědec dodal, že „kdykoliv se tím začneme do hloubky zabývat, objeví se nová překvapení“.

Nečekané byly kromě efektivity samotné metody především objevy dosud neznámých koronavirů, které pochází například z japonské ryby fugu a axotla, obojživelníka známého též pod názvem vodní dráček. Kromě toho výzkum přinesl i důkazy o víc jak 250 takzvaných obřích virech, které infikují bakterie a světová věda je zná teprve posledních asi 20 let.

Pod rukama mu oživl 30 tisíc let starý obří virus. Stejně ho víc děsí klima

27. 10. 2021 6:30

Babaianův tým zároveň zřídil veřejné uložiště, kde jsou dostupné veškeré nástroje, které vědcům v pročesávání databáze pomohly, i jejich výsledky.

Sám Babian řekl, že chce v hledání pokračovat. Už za rok by podobná analýza mohla objevit další stovky tisíc nových RNA virů. Do konce dekády jich chce vědec najít přes 100 milionů.