
Dél-Korea előnye: a szilícium új útja
A MI-hardver területén alig néhány új szereplő képes jelentős piacot kiharcolni az Nvidia óriási előnye mellett. Bár olyan innovátorok, mint a Hailo vagy az Axelera megjelentek Kínán és az USA-n kívül is, összességében csekély a sikeres próbálkozások száma – strukturális okok miatt. A kriptobányászatban például az algoritmus egyszerű, de az MI villámgyorsan fejlődik, mindig új hardver- és fordítóprogram-tudásra van szükség. Ez pedig csak azokban az országokban összpontosul, ahol erős a félvezetőipari múlt, és ahol komoly kapcsolatok vannak a chipgyártókhoz.
A FuriosaAI éppen ezért látott nagy lehetőséget abban, hogy Dél-Koreában alapuljon. Hozzáfértek felsőfokú mérnökképzést nyújtó egyetemekhez, valamint helyi gigászok, például az SK Hynix (amely a második generációs RNGD chip HBM3 memóriáját adta) és a tajvani TSMC is stratégiai partnerré vált.
A Szilícium-völgytől való távolság is előnyt jelentett: a cég szűkösen, mindössze 400 millió forintnyi (1 millió dollár) magvető tőkével indult, így éveken át fejlesztette ötleteit, míg végül hardvert szállított. Ezalatt összpontosíthattak a tenzoralapú megközelítésükre, mentesülve a divathullámok és megszokások hatásától.
Szoftver-háttér: a CUDA helyett új utak
Az Nvidia évek óta szinte bevehetetlen szoftveres erődöt épített ki (CUDA rendszerével). A Furiosa nem próbálta meg másolni ezt: az első elveken alapuló hardver- és szoftvertervezéssel kifejezetten MI-re optimalizáltak. Saját TCP architektúrájukkal a mélytanulás matematikáját natívan, hatékonyan hajtják végre, nem kényszerítve a műveleteket a GPU-hagyományokra.
Így a fordítóprogram optimalizálhatja a modelleket anélkül, hogy ezernyi kézzel finomított kernelre lenne szükség. Az RNGD chip 180 wattos fogyasztás mellett biztosít magas teljesítményt, szemben a tipikus GPU-k legalább 600 wattos áramigényével – a világ legnagyobb partnerei is igazolták ezt a hatékonyságot. Fontos előrelépés, hogy a szoftveres ökoszisztéma azonnal használható PyTorch- és vLLM-keretrendszerekkel, így a fejlesztők megtarthatják saját munkamódszereiket.
Erőforrásválság és új célcsoportok
A GPU-k energiaigényéből és az infrastruktúra szűkösségéből fakadó kihívások az egész ágazat, de még a legnagyobb cloudszolgáltatók számára is égető problémát jelentenek. Amit látunk, az túlmutat a megszokotton: a jövőben különféle architektúrák élnek majd egymás mellett, attól függően, hogy éppen MI-betanításról vagy futtatásról van szó.
A FuriosaAI négy területen lát különleges lehetőséget:
– Az állami és szabályozott iparágak szenzitív adatokat helyben, saját gépparkban akarnak feldolgozni, nem a publikus felhőben, így a magas teljesítményű RNGD chipjük a meglévő áramkereteken belül, önálló adatközpontban ad megoldást, ahol az adatbiztonság kulcsfontosságú.
– A vállalati ügyfelek számára a költséghatékonyság, rugalmasság és TCO (teljes bekerülési költség) a lényeg. Az RNGD befér 15 kW teljesítményű, léghűtéses rackekbe, elkerülhetők így a drága folyadékhűtéses beruházások.
– A régiós és specializált felhőszolgáltatók csak olcsó üzemeltetéssel vehetik fel a versenyt az Amazon–Microsoft–Google trióval: az RNGD chip sűrűsége segít maximalizálni a bevételt rackenként, miközben az üzemeltetés olcsó marad.
– A telekommunikációs cégeknek az elosztott, energiahatékony adatközpont kulcsfontosságú.
A Furiosa következő generációs chipje már közvetlenül a hiperskálereket is célba veszi.
Milyen lesz az adatközpont 2036-ban?
Egy évtized múlva az adatközpont már rengeteg dolgot jelenthet – ugyanúgy, ahogy a számítógép sem feltétlenül egy PC-t takar: lehet okosóra vagy szerver, bármi a skálán. Lesznek orbitális vagy akár fúzióval működő, óriási létesítmények, de másutt inkább a helyi, rendkívül hatékony miniadatközpontoké a főszerep: például egy kórház saját MI-központot tarthat fenn, amely helyben segíti az orvosokat és nővéreket, helyi adatkezeléssel, minimális késleltetéssel.
Az edge-megoldások is előtérbe kerülnek, ahol a telekommunikációs vállalatok nagyon gyors, valós idejű adatfeldolgozást igényelnek helyben. Ebből kifolyólag az MI-adatközpontok 2036-ban messze nem lesznek tele GPU-kkal. Számos különböző MI-specifikus szilícium jelenik majd meg, amelyek célirányosan különböző feladatokat látnak el.
A GPU-k energiahatékonysági problémáit már a gyártók is igyekeznek enyhíteni (tensor core-okkal), de az MI-központú architektúrák előnyeit hamarosan nem lehet majd figyelmen kívül hagyni.
Új mércék és folyamatos fejlesztés
A vállalati ügyfelek számára gyors, ugyanakkor energiatakarékos, könnyedén telepíthető adatközponti inferenciát szállítanak, elkerülve a bonyolult fejlesztési költségeket. Kiemelt mérőszám a watt/feldolgozott token aránya és a rack-sűrűség, így nő a számítási kapacitás.
A Furiosa az iparági újdonságokat is gyorsan beépíti – például 14 nm-es gyártástechnológiával kezdtek, az RNGD pedig már HBM3 memóriával és 5 nm-es technológiával dolgozik. Az igazi áttörés azonban az architekturális újításban rejlik, amely azonos technológián is energiatakarékosabb és gyorsabb, mint a GPU-k. A fejlesztés hangsúlya legalább annyira a szoftveren van, mint a hardveren: az alkalmazkodóképességet mutatja, hogy már most több a szoftvermérnök, mint a hardvermérnök, és évente jó néhány nagy SDK-frissítéssel támogatják az új modelleket.
Partnerségek és koreai háttér
A Furiosa szoros kapcsolatokat ápol a koreai techóriásokkal: a Samsung Foundry gyártotta az első generációs chipet, az SK Hynix szállítja az RNGD-hez használt HBM3 memóriát, az LG pedig zászlóshajó vállalati ügyfélként vezette be a Furiosa szilíciumát. E kapcsolatok évek alatt szilárdultak meg.
A nagyvállalatokon túl együttműködnek feltörekvő, versenyképes koreai MI-cégekkel, például az Upstage-dzsel; mellettük ott a technológiára nyitott koreai felhasználóbázis, valamint az autó- és hajógyártás jelentős ipari szereplői.
Az MI az ország politikájában is kiemelt helyet foglal el: a kormány célja, hogy Dél-Korea globális MI-nagyhatalommá váljon, amelynek középpontjában az MI-chipek állnak. Ezért a Furiosa is aktív részese kíván lenni az ágazat fejlődésének, és segíteni akarja, hogy az egész szektor túllépjen a GPU-któl való függőségen.
