Článek
Nový způsob, jak co nejefektivněji hledat neznámé viry v genomových databázích, se začal rodit zkraje roku 2020. Bioinformatik Artem Babaian, nyní působící na Univerzitě Cambridge, tehdy dostal nápad.
Původně byl Babaian podle časopisu Science jen zvědavý, kolik koronavirů, kromě toho, který zrovna rozpoutal pandemii, se dá najít v již tehdy existujících genomových databázích. Ty shromažďují a archivují data pocházející z genetického monitoringu všech možných virů z různých prostředí od zemědělské půdy přes zvířata až po člověka. Sekvenace podle Science zachycuje genomy nebo alespoň části genomů mnoha různých virů schopných infikovat různé organismy, ale valné většiny si obyčejně nikdo nevšimne.
Spolu s nezávislým expertem na superpočítače Jeffem Taylorem se Babaian pustil do vymýšlení způsobu, jak co nejlépe pročesat data nahraná z celého světa a zpřístupněná americkým Národním institutem pro zdraví (NIH). Databáze má nyní podle časopisu Science 16 petabajtů, což je zhruba podobné množství, jaké by zabraly fotografie každého člověka žijícího ve Spojených státech.
Postupem času se dvojice dala dohromady s několika dalšími bioinformatiky, načež se podařilo vytvořit software, který udělal analýzu dat „jednodušší, než si kdokoliv myslel, že je vůbec možné“. Tým proto později významně rozšířil svůj cíl a místo pátrání pouze po neznámých koronavirech se rozhodl prohledat úplně celou databázi a najít co nejvíc dosud nepopsaných RNA virů. Tedy virů obsahujících ribonukleovou kyselinu RNA, mezi které patří například viry způsobující chřipku, obrnu, spalničky nebo hepatitidu.
Nakonec se jim kromě devíti nových koronavirů a 300 virů souvisejících s virem hepatitidy D podařily odhalit části genomů téměř 132 tisíc dosud neznámých virů. Vědci o tom informovali ve zprávě, kterou tento týden publikoval časopis Nature.
Z toho vznikla nová databáze, jež ve většině případů neobsahuje kompletní genomové sekvence všech nových virů, ale jen genetickou informaci jádrového enzymu. I to nicméně podle Science stačí k tomu, aby se daly vytvářet rodokmeny daných virů a zkoumat jejich evoluce.
Babaianovu týmu se povedlo dosáhnout tempa jednoho milionu zpracovaných datasetů za jeden den. Podle odborníků, kteří na studii nepracovali, jde o velký pokrok, jenž navíc ukázal, jak málo toho o virech kolujících světem víme.
„Ukazuje se náš skandální nedostatek znalostí o této skupině organismů,“ řekl k tomu podle časopisu Science britský odborník na ekologii nemocí Peter Daszak, který stojí v čele organizace EcoHealth Alliance, jejímž cílem je mimo jiné podpora prevence před pandemií. Vědec dodal, že „kdykoliv se tím začneme do hloubky zabývat, objeví se nová překvapení“.
Nečekané byly kromě efektivity samotné metody především objevy dosud neznámých koronavirů, které pochází například z japonské ryby fugu a axotla, obojživelníka známého též pod názvem vodní dráček. Kromě toho výzkum přinesl i důkazy o víc jak 250 takzvaných obřích virech, které infikují bakterie a světová věda je zná teprve posledních asi 20 let.
Babaianův tým zároveň zřídil veřejné uložiště, kde jsou dostupné veškeré nástroje, které vědcům v pročesávání databáze pomohly, i jejich výsledky.
Sám Babian řekl, že chce v hledání pokračovat. Už za rok by podobná analýza mohla objevit další stovky tisíc nových RNA virů. Do konce dekády jich chce vědec najít přes 100 milionů.