PERUN architektúra
Superpočítač PERUN predstavuje centrálny výpočtový systém, ktorý je súčasťou infraštruktúry Superpočítačového centra Technickej univerzity v Košiciach.
Je navrhnutý pre vysoko paralelné výpočty, vedecké simulácie, spracovanie veľkých dát a úlohy využívajúce akcelerátory GPU novej generácie.
Systém je postavený na dvoch komplementárnych častiach – univerzálnej výpočtovej partícii a akcelerovanej GPU partícii, ktoré spoločne poskytujú vyvážený výkon, flexibilitu a energetickú efektivitu.
Univerzálna výpočtová partícia (PERUN Universal)
áto časť je určená pre široké spektrum HPC úloh – od paralelných vedeckých simulácií až po dátovo náročné aplikácie.
- Počet uzlov: 32 × HPE Cray XD2000 (XD225v)
- Procesor: 2× AMD EPYC 9745 (celkovo 256 jadier na uzol)
- Pamäť RAM: 1536 GB DDR5 ECC
- Prepojenie:
- 2× 100 Gb/s Ethernet
- 1× 200 Gb/s NDR200 InfiniBand
Táto partícia poskytuje vysoký výpočtový výkon pre klasické HPC aplikácie, optimalizované paralelné algoritmy a úlohy s vysokými nárokmi na pamäťovú kapacitu.
Akcelerovaná GPU partícia (PERUN AI)
Určená pre najnáročnejšie výpočty v oblasti umelej inteligencie, strojového učenia, numerických simulácií a spracovania dát s využitím grafických akcelerátorov.
- Počet uzlov: 26× HPE ProLiant Compute XD685
- Procesor CPU: 2× AMD EPYC 9535 (128 jadier na uzol)
- Akcelerátor GPU: 8× Nvidia H200 s 141 GB HBM3e pamäte
- Pamäť RAM: 2304 GB DDR5 ECC
- Prepojenie:
- 2× 100 Gb/s Ethernet
- 4× 400 Gb/s NDR InfiniBand
- Prepojenie GPU-GPU: 900 GB/s
- Prepojenie GPU-CPU: 128 GB/s
- Interná GPU sieť: Nvidia NVLink
Vďaka architektúre Nvidia Hopper a vysokej priepustnosti medzi akcelerátormi poskytuje táto partícia výnimočný výkon pre výpočty s vysokou mierou paralelizmu a pre aplikácie založené na neurónových sieťach či rozsiahlych dátových modeloch.
Výkon a flexibilita
Kombináciou týchto dvoch častí – univerzálnej CPU a akcelerovanej GPU – systém PERUN umožňuje optimálne priradenie výpočtových zdrojov podľa charakteru úlohy.
Jeho architektúra zabezpečuje vysoký výkon, stabilitu a škálovateľnosť pre potreby výskumu, výučby a inovatívnych technologických projektov. Celkový výkon 10,7 Pflops / Rmax
Superpočítač PERUN je priamo prepojený s vysokorýchlostnou InfiniBand sieťou a diskovým úložiskom HPC PERUN, čo umožňuje efektívnu prácu s dátami a maximálne využitie dostupného výpočtového výkonu.
V čom je klaster jedinečný na Slovensku
- Výkonné grafické akcelerátory NVIDIA H200: Na TUKE sú nasadené akcelerátory H200 s 141 GB HBM3e pamäte na adaptér, čo predstavuje výrazne viac ako 96 GB HBM3 v bežných GH200. Pri veľkorozmerných dátových sadách a tréningových vzorkách pre AI znamená vyššiu dostupnú kapacitu rýchlej pamäte a tým aj efektívnejší tréning modelov.
- Vysokorýchlostné GPU prepojenie cez NVLink: Každý akcelerovaný výpočtový uzol obsahuje 8 GPU prepojených 900 GB/s NVLink zbernicou. Toto prepojenie je rádovo rýchlejšie ako tradičné clustrové prepojenie cez Infiniband medzi uzlami, čo umožňuje omnoho efektívnejší paralelný tréning veľkých LLM a iných náročných AI modelov.
- Nadštandardná kapacita operačnej pamäte: Kapacita je kľúčová pre veľké simulácie, HPC úlohy, spracovanie big data a pre potreby moderného AI výskumu. Klaster disponuje až:
2304 GB DDR5 ECC v akcelerovanom uzle,
1536 GB DDR5 ECC v univerzálnom uzle.
- Integrovaný kvantový simulátor: Súčasťou infraštruktúry je hardvérové a softvérové riešenie kvantového simulátora s možnosťou priameho napojenia budúceho kvantového počítača. To umožní prechod na reálne kvantové spracovanie bez potreby zásahov do existujúcej softvérovej architektúry.

