V bulharskom Sofia Tech Parku uviedli tento rok v júni do prevádzky Discoverer, najvýkonnejší superpočítač vo východnej Európe, v Luxembursku v tom istom období ožila MeluXina. Tá sa tesne po svojom aktivovaní stala aj najzelenším superpočítačom v Európe. O superpočítačoch, plánoch Slovenska, ale nielen o nich sme sa rozprávali s Lukášom Demovičom, riaditeľom Centra spoločných činností SAV v Bratislave.
Predstava, že ide o obrovskú kalkulačku, do ktorej nalievame obrovské množstvo dát, a ona, ak sa správne spýtame, vie nájsť odpoveď, je v zásade správna. Ako pri každej práci na počítači, tak aj pri práci na superpočítači treba vedieť, čo robíte, čo má byť výstupom a aká je možná chyba.
Na čo sa využíva takýto počítač?
V oblasti vedy existujú tri najväčšie rámcové možnosti využitia. Prvou skupinou je spracovanie dát, druhou sú simulácie a treťou strojové učenie a umelá inteligencia.
Mgr. Lukáš Demovič, PhD., je riaditeľom Centra spoločných činností SAV v Bratislave. Absolvoval štúdium na Prírodovedeckej fakulte UK Bratislava, v doktorandskom štúdiu pokračoval v odbore chemická fyzika. Od roku 2010 bol pracovníkom Výpočtového strediska SAV ako vývojár aplikačných softvérov, neskôr sa stal jeho riaditeľom.
Čo všetko zahŕňa spracovanie dát?
To je to, čo sa deje napríklad v CERN-e. Urýchovač častíc produkuje obrovské terabajty dát a tie sa potom posielajú do menších superpočítačov po celej Európe, kde sa spracúvajú. Jeden takýto počítač je napríklad v Košiciach.
Ďalším príkladom je genomika. Keď sekvenujete DNA, máte k dispozícii obrovské množstvo dát, ktoré treba spracovať, napríklad nájsť nejaké vzorce či opakujúcu sa sekvenciu v číselnom rade. Alebo zisťujete fylogenetickú štruktúru, porovnávate DNA z viacerých vzoriek a hľadáte prienik. Výsledkom je, že zistíte, akého spoločného predka mali organizmy, z ktorých pochádzajú vzorky, a kedy to bolo.
Aké možnosti ponúkajú simulácie?
Tie sú potrebné v každom odvetví vedy. V astrofyzike sa využívajú napríklad na modelovanie galaxií, ich kolízií, čiernych dier alebo vzniku vesmíru. Pri takýchto simuláciách vedci potrebujú tie najvýkonnejšie počítače.
Simulácie sú však užitočné aj v bežnej fyzike alebo v materiálových vedách, keď pomocou nich môžete vymodelovať nové materiály, ich štruktúru aj zloženie a skúmate ich vlastnosti – akú majú vodivosť či odolnosť.
Ďalšou oblasťou je napríklad vývoj nových liekov, keď môžete na základe simulácií skúmať interakciu liečiva s proteínmi či enzýmami pomocou molekulovej dynamiky. Vstup je pri tejto metóde relatívne malý – poviete, akú by mal mať model štruktúru a necháte stroj, aby ho vyvinul. Robí to pomocou systému rovníc, ktoré hovoria, ako systém interaguje. Čím menší medzikrok medzi jednotlivými simuláciami potrebujete dosiahnuť, tým väčší je nakoniec celý systém, a tým viac narastá potreba výpočtovej kapacity počítača.
Výhodou je, že namiesto toho, aby ste v laboratóriu mesiace skúšali rôzne kombinácie látok, v počítači vyberiete také, ktoré by mohli mať potenciál a pomocou metód kvantovej chémie a molekulovej dynamiky viete veľmi presne povedať, ako sa molekuly budú správať a aké budú mať vlastnosti. Potom si vyselektujete napríklad sto najsľubnejších a skúmate ich ďalej.
Ako je to so strojovým učením?
Poslednou skupinou využitia superpočítačov je strojové učenie a umelá inteligencia. Môže ísť napríklad o spracovanie obrazu, pri ktorom vytvoríte model, ktorý nakŕmite obrovským množstvom dát a postupne ho učíte, čo chcete, aby vedel. V princípe ide vždy o to, že do počítača potrebujete dostať nejaký vstup. Musíte mu povedať, ako sa má správať. Ak ide napríklad o simuláciu fyzikálneho javu, musíte do vstupu dostať fyzikálne rovnice, ktorými sa má riadiť. Potom nastavíte podmienky. Počítač nevie odpovedať na všeobecné otázky, vždy musíte veľmi presne vedieť, čo od neho chcete. V závere je vždy potrebný ľudský faktor, aby vyhodnotil výsledok.
Ako sa zostavuje dobrý superpočítač?
Výrobu superpočítačov nezabezpečuje každá počítačová spoločnosť, ale výber je pomerne veľký. Existuje štyri či päť väčších a viacero menších firiem, ktoré sa tomu venujú. Ich výber závisí najmä od toho, čo potrebuje prevádzkovateľ. Superpočítač môžete nastaviť rôzne. Výsledok závisí od toho, aký je pomer medzi bežnými procesormi – takými, aké máte v notebooku alebo v desktope – a tzv. akcelerátormi. Tie si možno predstaviť ako špecializované grafické karty, ktoré slúžia na špeciálne výpočty, a taktiež napríklad na aplikácie umelej inteligencie alebo strojové učenie.
Od tohto potom závisí, čo dodávateľ nakombinuje a ako je schopný to technicky prepojiť. Výrobcov základných komponentov nie je až tak veľa, máme troch hlavných výrobcov procesorov a dvoch výrobcov akcelerátorov, takže tam až tak veľa možností nie je.
Existuje však veľa možností, ako tieto časti prepojiť a pridať ostatné, napríklad diskové polia, chladenie, ktoré je veľmi dôležité, alebo napájanie. Najdôležitejšou úlohou dodávateľa je zintegrovať systém tak, aby bol čo najlepšie nahustený a najefektívnejší.
Superpočítače sú však extrémne energeticky náročné…
Je to tak, okrem samotného výkonu počítača je extrémne energeticky náročné aj jeho chladenie. Všade na svete sa vedci snažia hľadať čo najúspornejšie riešenia. V Austrálii je dátové centrum, ktoré má veľkú časť pokrytú solárnymi panelmi. Nový fínsky superpočítač by mal mať všetku energiu z hydroelektrární. Odpadové teplo, ktoré počítač vyprodukuje, budú posielať do blízkeho mesta na vykurovanie. Vždy ide o kompromis – na juhu je síce teplo, ale je tam veľa solárnej energie. Na severe veľa slnka nie je, ale zasa je jednoduchšie chladenie.
Slovensko je súčasťou veľkého projektu EuroHPC JU (Spoločný európsky podnik pre vysokovýkonné počítače). Čo je cieľom tohto projektu?
V rámci tohto projektu sa v Európe vybuduje osem superpočítačov. Tri z nich predstavujú z hľadiska výkonu superpočítače prvej triedy, tzv. pre-exascale, a budú sa nachádzať v Taliansku, Španielsku a vo Fínsku. Ďalších päť patrí do druhej triedy, teda skupiny petascale superpočítačov. Do tejto skupiny patria bulharský Discoverer, rovnako ako MeluXina (Luxembursko), Karolina (Česko), Vega (Slovinsko) a Deucalion (Portugalsko).
Pre predstavu, pre-exascale superpočítače budú asi 10- až 50-násobne výkonnejšie ako tie v Bulharsku alebo v Česku. Prvý petascale superpočítač v rámci siete EuroHPC – Vega – bol sprevádzkovaný v Slovinsku v marci a už sa dá na ňom žiadať o strojový čas. Keby teda mali slovenskí výskumníci záujem, na našej stránke kompetenčného centra nájdu odkazy a v prípade potreby im vieme poskytnúť pomoc.
Koncom tohto roku by sme mohli vysúťažiť aj nasledovníka slovenského superpočítača Aurel. Malo by ísť o stroj tesne pod úrovňou petascale.
Čo sa v súčasnosti deje s Aurelom?
Aurel je už starý stroj, má deväť rokov. Český superpočítač Anselm bol nainštalovaný rok po Aurelovi a skončil minulý rok, je v múzeu. Aurel má vážne poruchy a nedajú sa naň zohnať náhradné diely. Netrpezlivo teda čakáme, kedy ho nahradíme novým strojom. Zatiaľ sa spoliehame na ostatné stroje, ktoré máme k dispozícii. Okrem Aurela sme v rovnakom čase postavili aj sedem menších systémov, ktoré sú v Košiciach, Banskej Bystrici, Žiline a ďalšie tiež v Bratislave, takže našich používateľov smerujeme na tieto zariadenia. A, samozrejme, aj v zahraničí postupne pribúdajú nové stroje, ktoré sú k dispozícii.
Za rozhovor ďakuje redakcia Quarku
Zhovárala sa Tamara Leontievová, Veda na dosah
Foto Pavol Novák, CSČ SAV