Článek
Umělá inteligence radikálně změní řadu oborů, ale velké firmy nemohou, nebo nechtějí spoléhat na univerzální řešení třetích stran. Budou si zřejmě trénovat a pěstovat své vlastní neuronové sítě. A právě tam se rýsuje zajímavá příležitost pro speciální třídu rychlých a spolehlivých superpočítačů.
Na konferenci Common Europe v Praze věnované nejen specialistům na hardware jsme se setkali s hlavním architektem Power mikroprocesorů společnosti IBM. Zajímalo nás, jak se odvětví za posledních třicet let změnilo. A jaké změny se dají očekávat dále.
Čipy, které navrhujete, nejsou určené pro běžné mobily nebo notebooky. Na kterou cílovou skupinu Power10 cílí?
Existují velké počítače, kterým se říká mainframe. A pak jsou specializované servery, pro které vyvíjím procesory já. To je přibližně desetkrát větší segment. Spolupracuji samozřejmě s kolegy z mainframe, ale náš procesor Power10 je určený do jiných, velmi mocných systémů.
Procesor je mozkem každého počítače. Já a moji kolegové máme za úkol vyvíjet nesmírně bezpečné a spolehlivé procesory Power10, na kterých mohou firmy stavět své podnikání. Kdykoli máte co do činění s nějakou velkou entitou – třeba platíte kreditní kartou nebo dostáváte zásilku ze zahraničí –, tak je velká šance, že to na pozadí běží na našich počítačích.
V čem jsou požadavky na takový procesor jiné než třeba požadavky na můj procesor tady v mobilu?
V mobilech jsou dnes naprosto úžasné procesory. Třeba firma Apple si sama navrhuje svůj vlastní SoC (systém na čipu). Cílem těchto mobilních procesorů bývá maximální úspornost v jednom okamžiku a v jiný moment zase potřebujete co největší možný výkon.
V 70. letech jsme měli k dispozici velmi omezené množství takových pokročilých součástek. Dnes žijeme v mnohem pokročilejší éře a pro každý účel máme přizpůsobené procesory a architekturu přímo na míru pro daný účel.
Převládajícími procesory, alespoň ve stolních počítačích, je architektura x86. To jsou procesory vhodné na spoustu běžných věcí. Zvládnou i intenzivní úkoly, kde potřebujeme třeba nasadit více procesorů, zpracovávat grafiku, generovat video. To samozřejmě nebudete dělat na mobilu, ale nejspíše na stolním počítači.
Bill Starke
- Hlavní architekt a šéf vývoje procesorů POWER10.
- Ve firmě IBM pracuje od začátku 90. let.
- Vystřídal několik vedoucích pozic, všechny byly spojené s návrhem procesorů, pamětí a I/O řadičů.
- Je podepsaný pod stovkami patentů, které se převážně týkají architektury procesorů, vyrovnávací cache paměti, paralelního zpracování dat, sběrnic nebo zpracování instrukcí v procesorech.
Velmi podobné procesory se pak používají v serverech. To je vlastně několik počítačů spojených pohromadě, ale nejčastěji jsou postavené na x86 serverech. (Tyto procesory dnes vyrábí především Intel a AMD, pozn. red.)
Když se ale posuneme ještě výše, do oblasti, kde záleží na spolehlivosti a bezpečnosti, tak tam potřebují firmy něco jiného. Řada společností přešla na serverová řešení, ale jsou některé firmy, které zkrátka vyžadují jinou úroveň zabezpečení a spolehlivosti.
V čem je návrh takového procesoru jedinečný?
Je to výzva z pohledu fyziky a také z pohledu logiky. Fyzikálně musíme řešit, aby byla vzdálenost mezi procesorem a pamětí co nejkratší. A z pohledu logiky musíme zajistit, že data jsou zabezpečena a každý proces má přístup jen tam, kam má platné oprávnění. A ta oprávnění se neustále mění. Desítky tisíc procesů, miliarda čtecích operací za sekundu.
Naše největší operační paměť má 64 terabajtů. Obvykle, když se lidé baví o terabajtech, mluví o pevném disku. Ale já mluvím o operační paměti, do které má procesor rychlý a okamžitý přístup, operace probíhají skoro rychlostí světla.
Pro hodně lidí je třeba nanosekunda nesmírně krátký časový úsek. Je to jedna miliardtina sekundy. Pro mne je to dlouhá doba. Když nějaká informace putuje řekněme 100 nanosekund, tak je to bolestivě pomalé. Proto nechcete věci posílat z jedné části počítače do druhé, protože pokaždé po cestě ztratíte těch 100 nanosekund.
Bez ekologie to nepůjde
Návrhem procesorů se živíte už od začátku 90. let. Jak se za těch 30 let obor proměnil?
Lidé se mne někdy ptají, jak jsem mohl tak dlouho vydržet v jednom oboru. Ale pro mne je to práce snů, protože neustále můžu stavět na tom, co jsme udělali předtím. Pamatuju si doby, kdy jsme všechno počítali v megahertzech, nyní jsou to gigahertzy.
Ale kolem roku 2010 se to zrychlování zastavilo. Energeticky nedávalo smysl hnát se za vyšší a vyšší taktovací frekvencí procesorů. Místo abychom se snažili zrychlit malé množství procesorů, začali jsme lépe kombinovat velké množství jader. Dnes máme procesor s 96 jádry.
Moje práce je hledat, co je fyzikálně možné a co je pro klienty užitečné. Proto třeba firmám nabízíme, že to, co by normálně řešily na stovce serverů, to mohou vyřešit na našem jednom počítači. Znamená to, že na těch serverech třeba jely procesory na pět procent výkonu, zatímco u nás budou využité na 85 procent. Což podle mého dává smysl. Procesor je složený ze vzácných materiálů: proč bychom ten procesor neměli pořádně využít?
Jaké výzvy nyní se svým týmem řešíte?
Jednou z našich výhod je schopnost konsolidace. Klienti mají naše řešení rádi, protože to, co by jinak museli provozovat na stovce serverů, se vejde na jednu naši bednu. To jim šetří nejen náklady na pořízení, ale i na provoz a správu. Protože oni si prostě nemohou dovolit, aby byl systém mimo provoz byť jen na pár hodin.
Všiml jsem si, že u procesoru Power10 zdůrazňuje firma IBM jeho ekologičnost. Proč je to důležité?
Dříve se firmy skoro neohlížely na to, jaké jsou energetické nároky na provoz nebo jaký je dopad použitých materiálů na životní prostředí. V 90. letech to byla docela okrajová záležitost, řešilo to jen pár lidí.
Teď už si na to všichni dávají pozor, a to je dobře. Jako lidstvo si uvědomujeme, že nemůžeme plýtvat vzácnými zdroji. Musíme si uvědomovat, že nemůžeme spotřebovat všechny vzácné suroviny a nenechat nic příštím generacím.
Trénování AI není pro firmy to nejdůležitější
Další velké téma našeho rozhovoru určitě uhodnete sám…
Umělá inteligence. To je jasné, všechny konference, všechny akce, všude se teď mluví o umělé inteligenci. Přitom je to pojem, který se používá už minimálně od 70. let. Pak jsme tomu nějakou dobou říkali expertní systémy. Ty fungovaly na základě pečlivě sestavených pravidel. Dnes se umělou inteligencí obvykle myslí spíše systém, který se na základě dat naučil něco sám, bez toho, aby mu to programátor explicitně zadal.
Nyní jsou v popředí neuronové sítě, tzv. hluboké učení, vytrénované na ohromných datasetech. A v posledních letech si všímám toho, že firmy ze nezaměřují jen na to, jak ty sítě trénovat, ale jak je také efektivně provozovat.
Jaký je rozdíl mezi trénováním a provozem neuronové sítě?
Pro trénování se nyní nejčastěji používají grafické karty nebo specializované čipy určené k trénování AI. Ale trénování není potřeba tak často. Nechceme sítě trénovat, chceme je nasadit, aby za nás něco rozhodovaly a vyhodnocovaly. Z mého pohledu je to dospělejší využití AI: nejsou to jen hrátky a experimenty, je to reálné nasazení do praxe. Firma nebude trénovat svůj vlastní ChatGPT, ale bude na svých vlastních superpočítačích provozovat již vytrénované modely velmi rychle.
Umělá inteligence na vzestupu
Strojové učení není žádnou novinkou. Teprve v posledních letech se ale ke slovu dostaly tzv. velké jazykové modely. Nejznámější ukázkou je populární ChatGPT, jehož fungování podrobně popisujeme v tomto článku:
Důležitým faktorem aktuální popularity systému umělé inteligence je velké množství textů dostupných na internetu. A také rychlý hardware, který umožnil vytrénování řádově výkonnějších modelů. Takových, ve kterých se objevuje „emergentní chování“, jež se v některých ohledech vyrovná lidské inteligenci:
To samozřejmě vyvolává debatu o tom, zda nová vlna automatizace nahradí lidskou práci. V tomto článku shrnujeme současné poznatky a predikce ohledně toho, jak AI změní pracovní trh a kterých profesí se dotkne nejvíce:
Před asi deseti lety jsme spolupracovali s firmou Nvidia, která je známá právě díky svým grafickým kartám. Pracovali jsme s nimi na propojení procesorů a grafických karet. Vytvořili jsme tehdy jedny z nejrychlejších superpočítačů na planetě.
Teď se s novou verzí Power10 ale zaměřujeme na inference, tedy na nasazení již vytrénovaných modelů do praxe (zjednodušeně řečeno, inference je provádění rychlých výpočtů a odhadů pomocí již natrénované neuronové sítě, pozn. red.). Tuto funkci jsme zrychlili dvacetinásobně, protože jsme si vědomi toho, jak bude pro firmy důležitá. Firma bude moci velmi efektivně provozovat nějaký základní, již vytrénovaný model a ten pak doplnit o aktuální poznatky.
Máte nějaký příklad toho, jak firmy už nyní tyto technologie používají?
Řekněme, že firma zabývající se výrobou chemických látek provozuje velkou továrnu, a tam je ohromné množství různých senzorů. Každá trubka, každá nádrž má měřidlo tlaku, teploty nebo průtoku. Tečou tudy nebezpečné materiály a vy chcete, aby všechno běželo, jak má. Ale těch čísel je tolik, že není v možnostech lidí je všechny analyzovat v reálném čase.
To je příležitost pro specializovanou umělou inteligenci, která je vytrénovaná na základě expertních znalostí. Dokáže odhalit, že se schyluje k nějakému problému, ještě než k němu dojde. Odhalí třeba na základě neobvyklého poklesu tlaku částečnou korozi a pošle tam své lidské kolegy, aby to prověřili. A možná časem dokonce ani nebude muset posílat lidi a zvládne to vyřešit roboticky.
Umělá inteligence může nabídnout pochopení
Když přemýšlíte o tom, co se v procesoru děje, představujete si to v hlavě nějak? Máte nějakou svou vlastní vizuální metaforu?
Vlastně ano. Představuji si to obvykle jako takovou trojrozměrnou strukturu, bludiště, kterým protéká řeka s daty. Pomáhá mi to.
Většina lidí ani nerozumí tomu, co se děje uvnitř motoru jejich auta. Neztrácíme jako lidstvo schopnost chápat, jak fungují naše klíčové technologie? Není to nebezpečné?
Takže se bojíte dystopické budoucnosti, kde lidé nevědí, jak věci fungují, a spoléhají se na technologie, kterým nerozumí. To je legitimní obava. Myslím, že musíme zajistit, aby vždy existovali lidé, kteří dané oblasti dostatečně rozumí a vědí, co se děje.
Bez ohledu na to, jaká infrastruktura to je, pokud na ní závisí další věci, musíme vědět, jak funguje. A nejde tady jen o komplexní IT věci. I třeba kanalizační systém může být dost komplikovaný. Každopádně infrastruktura je důležitá.
Souvisí s tím i obava z dystopického světa, ve kterém všechno ovládá AI a lidé nebudou mít práci. Já to tak černě nevidím. Myslím, že lidé budou díky spolupráci s AI asistenty schopni dosahovat lepších výsledků. Ale neztratíme myslím to, co nás dělá lidmi. Věřím dokonce, že AI nám může pomoci překlenout některá ta neporozumění. Pomůže lidem vyznat se ve složitém světě.
Jaké schopnosti budou lidé potřebovat v tomto složitém světě budoucnosti?
Řeknu něco, co zní možná samozřejmě. Podle mého je důležité, aby se lidé naučili, jak být vděční a jak jednat s ostatními lidmi. To je to, co jsem se vždycky snažil naučit svoje děti. A taky by měl být člověk zvídavý, pěstovat si vášeň a nadšení.
Ale ne proto, abychom se do něčeho jen tak sobecky ponořili. Cílem by pak vždycky mělo být, jak můžu pomoci ostatním. Jak v tom můžu najít naplnění. To je to, co svět potřebuje. Aby byli lidé jedna rodina a chovali se k sobě podle toho.