Hlavní obsah

Češi našli vzácné objekty v kosmu revoluční metodou

Foto: Profimedia.cz

Animace kolapsu Wolfovy-Rayetovy hvězdy, jednoho z typů vzácných vesmírných objektů, který se vědeckému týmu podařil najít.

Čeští vědci z Astronomického ústavu AV ČR a FIT ČVUT objevili téměř tisíc vzácných vesmírných objektů za použití umělé inteligence. „Říkali nám, že to nejde. My jsme to ale chtěli,“ říká v rozhovoru jeden z autorů Petr Škoda.

Článek

Čeští vědci použili vůbec poprvé v astronomii metodu umělé inteligence nazývanou aktivní hluboké čtení, která pomáhá za asistence člověka či dalšího softwaru vylepšit předpovědi mnohovrstvé neuronové sítě. Dokázali díky ní najít v kosmu téměř tisíc vzácných objektů, aniž by museli provést jediné pozorování oblohy. Vystačili si s archívy.

Co je to umělá neuronová síť?

Jde o výpočetní model inspirovaný lidským nervovým systémem. Umělé neurony v ní fungují podobně jako biologický neuron, jsou vzájemně propojeny a navzájem si předávají signály a umí je transformovat pomocí přenosových funkcí. Neurony mají libovolný počet vstupů a pouze jediný výstup. Neuronové sítě se proto používají pro pokročilou filtraci a zpracování velkého množství dat.

Tuto metodu český výzkumný tým úspěšně aplikoval na hledání vzácných vesmírných objektů ve čtyřech milionech spekter z největšího světového archivu pořízeného čínským dalekohledem LAMOST. Podařilo se tak objevit téměř tisíc dosud nepopsaných velmi vzácných objektů. Práci českých vědců publikoval prestižní astronomický časopis Astronomy and Astrophysics a jejich katalog nově objevených hvězd už je zveřejněný v celosvětové databázi Vizier.

Trnitou cestu za objevem i jeho samotný význam v rozhovoru pro Seznam Zprávy přiblížil člen týmu Petr Škoda ze stelárního oddělení Astronomického ústavu Akademie věd ČR, který působí také na Fakultě informačních technologií ČVUT.

Podařilo se vám najít téměř tisíc „vzácných vesmírných objektů“, můžete přiblížit, o které přesně jde?

Když to shrnu, tak se jedná o poměrně vzácně zastoupené objekty, které slibují hodně zajímavé fyzikální podmínky.

Foto: Astronomy & Astrophysics (A&A)

Obrázek znázorňující objevené objekty.

Konkrétně například takzvané Be hvězdy. To jsou hvězdy, které kolem sebe mají plynný disk, jenž velmi rychle rotuje. My si myslíme, že vznikl tím, že hvězda se rovněž otáčela velmi rychle a vyvrhla ho. Akorát když se to snažíme fyzikálně modelovat, tak nám na to ty modely stále nesedí, takže se říká, že stále nevíme, kde se ten disk vzal. Tyto hvězdy zároveň na Ondřejově sledujeme už 50 let, kolegové s tím začali už po uvedení dalekohledu do provozu v roce 1967 a snažili se přijít na to, co to je za objekty.

Pak jsou to hvězdy, které vznikají nově a ještě jsou zabaleny v obálkách. A v těch se mohou například formovat planety. Nebo to jsou hvězdy kataklyzmické, kde se vlastně míchají dvě dohromady, obíhají okolo sebe a jedna třeba krade hmotu té druhé, až se hmoty nahromadí moc, hvězda bouchne a vzniká nova.

Jako úplného „sólokapra“ můžu zmínit například objekt, kde my podle toho spektra vlastně nevíme, o co jde. Podobná spektra mívají supernovy, ale to je opravdu jen spekulace. Velmi zajímavým objevem, kde jsme si naopak jisti, o co přesně jde, je takzvaná dusíková Wolfova-Rayetova hvězda. Tyto hvězdy jsou extrémně hmotné a velmi rychle se vyvíjejí. Jde o vyhasínající hvězdu, která má obrovskou teplotu a každou chvílí bouchne jako supernova. Takových hvězd se za posledních 40 let podařilo najít asi jen 500. Našli jsme i jeden podivně symetrický objekt, o kterém se domníváme, že by mohlo jít o gravitační čočku.

Foto: Astronomický ústav AV ČR.

Detailní záběr podivně symetrického objektu pořízený Perkovým 2m dalekohledem.

Tohle všechno zjistíte z pouhého pohledu na zachycené spektrum světla daného objektu? Laikovi, který produkt spektrometru vidí jen jako vlnitou čáru, se to zdá až neuvěřitelné…

Spektrum nám o objektu může dát veškerou informaci, kterou potřebujeme. To znamená, že podle polohy té čáry (ukazuje Škoda na příklady spekter objevených objektů - pozn. red.) poznáte, o jaký jde chemický prvek. Takže já se prostě podívám a vidím, že tady je například čára vodíku o nějaké vlnové délce a tak dále. Potom, když se podívám detailněji, tak dokážu určit, i kolik je v tom objektu atomů na kubický centimetr, čili jaká je jeho hustota. Podle šířky té čáry zase zjistím, jaká je na povrchu objektu teplota.

Foto: Ondřej Podsztavek

Příklady jednotlivých spekter.

Dá se říct, že spektrum je prostě takový otisk prstu, který nám o té hvězdě řekne všechno, i o chemických a fyzikálních podmínkách. Dají se takhle hledat i planety. Že tam nějaká je, se vám projeví při velmi velkém detailu tak, že se vám ta čára malinko posouvá na jednu či druhou stranu.

Takže astronom zkrátka potřebuje spektrum, aby mohl o tom objektu něco říct. Problém je, že se ta spektra špatně pozorují. Na rozdíl od fotky, kde si uděláte jeden snímek a máte na něm miliony hvězd, tady musíte z každé té hvězdy zvlášť přivést světlo individuálně na optickou mřížku a udělat z ní spektrum. To se právě dělá na různých spektrografech, které jsou dnes už velmi mocné. Jedním z nich je právě LAMOST. Na jeho desku se dá promítnout velký kus oblohy, asi 10 měsíčních průměrů, čímž naráz uděláte 4000 spekter a tímto způsobem přibývá milion spekter ročně. Dnes už má katalog devět milionů spekter, my jsme vycházeli z nějaké starší veřejné databáze se čtyřmi miliony spekter.

A vy jste z těch čtyř milionů dokázali vyfiltrovat jen to, co jste potřebovali. Mohl byste tu metodu přiblížit a říct, v čem je jedinečná?

My jsme na začátku v podstatě neměli vůbec představu, co v těch milionech spekter z LAMOSTu je. Nevěděli jsme, jestli jsou tam nějaké objekty, co nás zajímají, protože z jejich zpracovací linky (pipeline), která ty objekty automaticky zařazuje do kategorií, nic nevyplývalo. Takže my jsme opravdu na začátku neměli vůbec nic. A já jsem už kdysi dávno pojal myšlenku použít archiv našeho ondřejovského dalekohledu, protože my už se tomu 50 let věnujeme a máme asi 13 000 spekter, které přesně ty zajímavé objekty zachycují. A my jsme potřebovali, aby se ta spektra tvářila, jako by je pořídil LAMOST.

Tady byl zase problém v tom, že LAMOST spektra pořizuje v mnohem nižším rozlišení než náš dalekohled, takže jsme museli snímky z Ondřejova uměle dalo by se říct rozmazat do stejných parametrů, jako má LAMOST. Pak jsme si ověřili, že tato metoda funguje. Našli jsme čtyři objekty, které jsme pozorovali už dřív v Ondřejově a zároveň jsou v LAMOSTu. Tak se nám povedlo ověřit, že jsme docílili toho, že jejich spektra byla skutečně velmi podobná a metoda skutečně funguje.

Foto: Petr Škoda

„Spektrometr LAMOST má v ohnisku desku s 8000 mikromotory, z nichž každé dva ovládají přesné umístění jednoho ze 4000 optických vláken na konkrétní hvězdu či galaxii. Na tuto desku se dá promítnout velký kus oblohy, asi 10 měsíčních průměrů, čímž naráz uděláte 4000 spekter. Tímto způsobem přibývá milion spekter ročně," řekl Škoda.

Takže jste měli kompatibilní vzorek 13 000 objektů a chtěli zjistit, jestli ve čtyřmilionovém archivu LAMOST jsou nějaké jim podobné. Tady už došla řada na neuronovou síť a aktivní učení?

V této fázi jsme měli za sebou jeden problém a před sebou druhý. Tím byla vlastní podstata neuronových sítí. Ony jsou velmi dobré a fungují, ale čím jsou hlubší a schopnější dělat složitější úkoly, tak potřebují mnohem víc dat, aby měly co nejvíc příkladů, které pak hledají. A tam nastal samozřejmě problém, že jestliže chcete hledat ve čtyřech milionech, tak 13 000 je stále málo. To nestačí.

A na to jsme si my právě naběhli, když jsme to kdysi takhle naivně zkoušeli a všichni se nám vysmáli a říkali: „To absolutně nemůžete, to je strašně málo dat, potřebujete víc.“ Když jsem jim pak řekl, že na začátku jsme neměli data vůbec žádná a ještě jsme je museli uměle nafingovat, tak to už se vůbec chytali za hlavu a říkali, že to prostě nemůžeme dělat. My jsme to ale chtěli. Moje touha a posedlost byla, aby neuronové sítě něco objevovaly, ne něco běžného, ale unikátního.

Foto: Petr Škoda

Pohled na LAMOST zvenčí.

A o tomhle právě je celý ten náš článek. My jsme použili metodu, která se jmenuje aktivní učení. Na začátku jsme tedy měli ta upravená data z Ondřejova. S těmi jsme ještě dělali další operace, abychom vyřešili problém neuronových sítí zvaný diskriminace minorit, kdy se síť lépe naučí standardní data než ta exotická, kterých je málo. Takže jsme museli ta minoritní data uměle „nafouknout“ a z mála exotických objektů jsme jich udělali spoustu virtuálních a teprve pak byla síť schopna fungovat. Pak se ta síť takzvaně naučí a označí nějaké kandidáty na objekty, které jste po ní chtěli. No a další problém byl v tom, že nám to vyhazovalo spoustu nesmyslů. Takže bylo jasné, že musíme zvolit jiný přístup.

Ten unikátní?

Ano, tady jsme právě použili aktivní učení. Ta unikátnost spočívá v tom, že v astronomii to ještě nikdo nikdy nezkusil dohromady s hlubokými neuronovými sítěmi. Aktivní učení samo o sobě ano, ale vědci to dávali dohromady jen s jednoduchými algoritmy. My jsme to spojili s velice mocnými a účinnými hlubokými sítěmi a byli jsme překvapeni, že to takhle dobře funguje. Podobně překvapení byli i recenzenti, kteří nám nejdřív vytýkali, že to není možné a musíme mít v té metodě chybu.

Ta finta spočívá v tom, že při standardním učení člověk v té síti na začátku označí velké množství vzorů a ta síť se na tom naučí. Ale když nemáte dost vzorů, tak máte problém, přesně jako my. Takže my jsme tu síť nechali zatřídit všechny čtyři miliony spekter, aby nám řekla, s jakou pravděpodobností podle ní ten či onen objekt patří do naší cílové skupiny. Pak jsme to setřídili podle toho, kde byla pravděpodobnost nejnižší a síť si byla nejméně jistá. Z tohoto vzorku těch úplně nejhorších vzorků jsme vybrali sto a na ně se podíval člověk. Mohl by to být i jiný program, ale v našem případě to byl expert, který si vzal těch sto nejhorších vzorků a té síti řekl, které vybrala dobře a které ne. Těch pár se pak přidalo k trénovacímu setu 13 000 vzorků a zase se to celé sjelo znovu. Nakonec jsme to takhle udělali šestnáctkrát a to bohatě stačilo na to, aby neuronová síť potom s 94% přesností vytřídila čtyři tisíce kandidátů, z nichž jsme pak my identifikovali těch 950 dosud nepopsaných objektů.

Znamená to, že teď, když už znáte postup, pro vás průzkum dalších milionů spekter nebude problém?

Samozřejmě, že dneska, kdybychom udělali to samé, tak máme místo čtyř devět milionů spekter a najdeme toho víc. Já už se těším na to, až to znovu celé projedu tím samým postupem a budu hledat, co nového nám přibylo. Už jsme na to vyvinuli i zvláštní softwarové nástroje i v rámci bakalářské práce na Fakultě informačních technologií ČVUT.

Myslíte si, že tuto metodu po vás převezmou i další astronomové? Co jste jim vaším objevem vlastně ukázali?

Já si myslím, že jsme ukázali, že je možné dát dohromady dvě aktuálně úplně top pokročilé technologie (hluboké neuronové sítě a aktivní učení - pozn. red.), které teprve pronikají do průmyslového odvětví - a velmi pokročilí jsou v tomto například experti na dálkový průzkum Země. Konkrétně v astronomii si myslím, že to je obecně řečeno cesta, jak objevit něco vzácného.

Co bylo vlastně pro váš objev a to prvenství rozhodující? V čem jste byli lepší než všichni ostatní?

Asi že nerozumíme jen astronomii, ale i informatice. Dneska totiž sice vědci samozřejmě umí s počítačem a umí programovat, ale to neznamená, že rozumí informatice. Informatika znamená rozumět moderním technologiím po hardwarové stránce i ovládat znalost toho takzvaného strojového učení. My jsme řadu fint horko těžko poznávali během let, kdy jsme zjišťovali, co jde a co ne. Na takovou práci prostě potřebujete experta, který té informatice rozumí, a u nás to byli mí spoluautoři, Ing. Ondřej Podsztavek, který na popisovaném problému začal pracovat už jako můj bakalář, a profesor Pavel Tvrdík, který vede v rámci velkého grantu MŠMT na FIT ČVUT pracovní superpočítačovou skupinu, v níž s Ondřejem a kolegou Karlem Adámkem působíme jako astroinformatici.

Dá se říct, že je vlastně potřeba vytvořit nový prototyp vědce, kterému se dnes už říká vědec datový, jenž kromě svého oboru rozumí i informatické stránce. Takový člověk musí být schopen překládat problémy do řeči superpočítače a zároveň musí umět komunikovat s největšími experty v daném oboru jejich jazykem.

Takže se povedla, jak vědci říkají, velmi ceněná a zároveň těžko dosažitelná interdisciplinarita, kterou jinak často komplikuje fakt, že vědci z různých oborů mají vlastní pojmy a vzájemně si vůbec nerozumí…

Přesně. Na to naráží ještě jeden problém, který teď ve vědě máme - a to že se vědci strašně úzce specializují. Například někdo celý život studuje stále jeden druh nějakého objektu nebo třeba brouka, a je v tom velmi dobrý. Ale co už se moc neděje, že vědec se dívá kolem sebe a přebírá nějaké know-how z jiných oborů. Přitom tam už může být ověřené řešení nějakého jeho problému, ale on to prostě neví, protože sleduje jen svůj úzký zájem a pak musí znovu „vymýšlet kolo“.

Já si nicméně myslím, že do budoucna bude informatika prostupovat úplně do všech vědních oborů, protože dnes jsou všechny zavaleny exponenciálně rostoucí lavinou dat a pouze s použitím strojového učení a tzv. umělé inteligence obecně jsme schopni se v té záplavě dat vyznat a najít tam něco nového, neznámého, co posune lidskou civilizaci dál.

Doporučované