MA 06:58

Az Nvidia szoftverrel győzi le az AMD-t a tudományos MI-ben?

Az Nvidia szoftverrel győzi le az AMD-t a tudományos MI-ben?
Az utóbbi években az MI fejlődése hatalmas teljesítményigénnyel párosul, különösen a tudományos és nagy számítási teljesítményű (HPC) alkalmazásokban. Ezekben a feladatokban még mindig kiemelkedő jelentősége van a double precision, magyarul dupla pontosságú lebegőpontos (FP64) számításoknak. Ez a technológia tartja a levegőben a repülőgépeket és rakétákat, biztosítja a hatékony vakcinafejlesztést, és a nukleáris fegyverek működtetésében is kulcsszerepet játszik. Az Nvidia azonban szakít a hagyományos hardveres úttal: a Rubin és a Blackwell GPU-ikon szoftveres emulációt vet be, hogy jobb teljesítményt csikarjon ki MI-chipjeiből. Ezzel próbálja beérni az utóbbi időben fölénybe kerülő AMD-t.

Miért olyan fontos még a dupla pontosság?

Miközben egyre több chip dolgozik alacsonyabb pontosságú (például FP8) adattípusokkal, a tudományos számításokban az FP64-et nem tudták kiszorítani: senki sem tud olyan széles értéktartományt kezelni, mint ez a formátum, amely több mint 18,44 kvintillió különböző értéket képes reprezentálni. Ezzel szemben az MI-modellek javát mindössze 256-féle FP8-értéken tanítják, ami elképesztően kevés a tudományos pontossághoz képest. Az MI-vel szemben a HPC-feladatok hibára jelentősen érzékenyek; például áramlástanban, égésfolyamatokban vagy anyagtudományban még a legkisebb hibák is akkumulálódnak, és hibás végeredményhez vezetnek.

Szoftveres emuláció: régi ötlet, új köntösben

A hardver hiányában már az 1950-es években is alkalmazták az FP64 szoftveres emulációját. Az eljárás lényege, hogy a bonyolultabb számítást apróbb, alacsonyabb pontosságú műveletekre bontják, például 8 bites egész (INT8) műveletek összességével érik el az eredményt. A Rubin GPU-n a szoftveres kapcsolót bekapcsolva a felhasználó akár 4,4-szeres FP64 teljesítményt kaphat, összevetve a hardveres Blackwell-gyorsítókkal, holott azok is csúcstartók a piacon. Így a Rubin ma nemcsak az Nvidia legerősebb MI-gyorsítója, de a legütősebb tudományos GPU is.

Különösen fontos kiemelni, hogy az Nvidia Rubin-GPU-ja hardverből még mindig 33 teraFLOPS FP64 csúcsteljesítményt nyújt (ez egy teraFLOP-pal kevesebb, mint a négyéves H100), de szoftveres emulációval ezt az értéket jelentősen meg tudja növelni. Az innováció alapját adó Ozaki-módszert japán kutatók dolgozták ki: az egész számokra lebontott FP64 mátrixműveletek Nvidia tensor magokon futtatva meghaladják a natív teljesítményt.

Egyre több a kérdőjel – AMD is vitatja az áttörést

Az Nvidia ugyan kiemeli, hogy az emuláció pontossága legalább annyira jó, mint a valódi hardveres megoldásoké, az AMD szakértőinek egy része nem teljesen osztja ezt a lelkesedést. Szerintük az eljárás jól működik azoknál a benchmarkoknál, ahol kerek, rendezett adathalmazokról van szó, mint a High Performance Linpack tesztnél. Viszont bonyolultabb tudományos szimulációknál (anyagkutatás, kémiai folyamatok, sávos lineáris algebra) már döcög a rendszer, és hibák csúsznak a végeredménybe.

A legtöbb problémát az IEEE-szabvány szerinti pontosság hiánya okozza: az Nvidia algoritmusai nem kezelik megfelelően például a pozitív és negatív nullákat vagy a végtelenbe futó hibákat. Ez azt eredményezi, hogy a több tízezer művelet eredménye összetett zavarokat, akár hibás végeredményt is okozhat – ilyen esetekben az emuláció nem megbízható. Ráadásul az emulációhoz szükséges többletműveletek miatt a memóriahasználat akár a duplájára is nőhet.

Az AMD ezért továbbra is dedikált, kifejezetten HPC-re tervezett hardverekre koncentrál, mint az MI430X, ahol chiplet-architektúrával erősíti meg az FP64- és FP32-teljesítményt.


Kinek éri meg ez a trükk?

Nem minden alkalmazás profitál az FP64 emulációból. Az eljárás főleg sűrű mátrixszorzásoknál (DGEMM) ütős, ezek viszont a teljes HPC-felhasználás csak 30–40 százalékát teszik ki. A legtöbb valós szimulációs igény, áramlástani modellezés, spektrálanalízis és társaik továbbra is a klasszikus, vektoros FMA-műveletekre építenek. Ezeknél az emuláció semmilyen vagy csak minimális előnyt biztosít. Ez az oka annak, hogy a TOP500 szuperszámítógép-listán a vektoros (nem mátrixalapú) számításokban továbbra is a CPU-k dominálnak.

A Rubin GPU vektoros FP64 teljesítménye nem kiugró, viszont a 22 TB/s-os (!) HBM4 memóriasávszélesség révén a valós munkaterhelésekben még így is jóval többet tud, mint amit a puszta specifikáció mutatna.

A történet itt még nem ér véget

A következő években annyi Blackwell- és Rubin-GPU kerül szuperszámítógépekbe, hogy az FP64 emuláció igazi próbája csak most következik. Ha az algoritmusok nincsenek hardverhez kötve, idővel folyamatosan fejleszthetők, finomíthatók. Az AMD sem zárja ki végleg a szoftveres FP64 megoldásokat, az MI355X chipnél például teszteli a lehetőségeiket.

Különösen fontos kiemelni, hogy az iparági áttöréshez az IEEE-szabványos megfelelőség elengedhetetlen lenne – csak így állítható garantáltan, hogy a szoftveres végeredmény megegyezik a dedikált szilíciumos eredménnyel.

Összességében elmondható, hogy az Nvidia szoftveres FP64 emulációja izgalmas út, de jelenleg főként a matematikai mátrixműveletekre korlátozódik. A való életben a HPC továbbra is igényli a hagyományos hardveres pontosságot, de a technológia folyamatos fejlesztésével, tesztelésével akár néhány éven belül szélesebb körben is elterjedhet.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz, jó ötlet-e a szoftveres emuláció ilyen érzékeny területeken?
  • Te hogyan döntenél, ha választanod kellene a gyorsabb, de kevésbé pontos megoldás és a lassabb, megbízhatóbb rendszer között?


Legfrissebb posztok

MA 08:34

Az MI nem egy lufi, hanem egy egész lufiparádé.

Érdemes megvizsgálni, hogy valóban csak egyetlen MI-lufiról beszélhetünk-e, vagy inkább több, egymással összefonódó lufi fúvódik fel egyszerre a technológiai piacokon...

MA 08:26

A Tylenol igazi veszélye nem az autizmus

Az acetaminofen – ez a népszerű és könnyen elérhető fájdalom- és lázcsillapító, amely a Tylenol és számtalan nátha- és influenzaszer fő hatóanyaga – valójában jóval nagyobb kockázatot rejt magában, mint amit a közösségi médiában terjedő, autizmussal kapcsolatos elméletek sugallnak...

MA 08:18

Az emberi génhiba csodafegyverré válhat: amikor két rossz gén jót tesz

Néha a genetika világában két negatív génváltozat együtt épphogy jótékony hatást fejt ki...

MA 07:57

Az űrből érkező vírusok legyűrhetik a makacs baktériumokat

A baktériumok és az őket fertőző vírusok, azaz a bakteriofágok folyamatos evolúciós harcot vívnak egymással...

MA 07:50

A pénztárcabarát Roku-projektor, ami otthonra varázsolja a mozit

🎥 A házimozi-projektorok legnagyobb kihívása még mindig az ár. Erre igyekszik megoldást nyújtani az Aurzen EAZZE D1R, amely kedvező áron és egyszerű kezelhetőséggel teszi lehetővé, hogy otthon is gyakran tarts moziestéket – mindenféle speciális helyiség vagy bonyolult technika beszerzése nélkül...

MA 07:41

A Windows 11 legújabb frissítése miatt nem állnak le a gépek

💻 A Microsoft január 13-án adta ki az első Windows 11-frissítését 2026-ban, de pár nap múlva már sürgősségi javítást kellett kiadnia, mert komoly hibák jelentek meg...

MA 07:25

Az univerzum legősibb, Tejúthoz hasonló galaxisa meglepő felfedezést hozott

🚀 Egy nemzetközi csillagászcsoport megerősítette, hogy a világegyetem eddig ismert legrégebbi, Tejútrendszerhez hasonló, rúddal rendelkező spirálgalaxisa mindössze 2 milliárd évvel az ősrobbanás után már létezett...

MA 07:17

A régi jelszavak időt rabolnak és kockára teszik a biztonságot

Reggelente már a munka kezdete előtt három különböző jelszót kell beírni, mindegyikre egyre bonyolultabb szabályok vonatkoznak...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 1/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Elden Ring Map: Game Companion (iPhone/iPad)Az „Ultimate Adventure Guide for The Lands Between and the Shadow of the Erdtree” átfogó kalauz mindazoknak, akik fejlesztési anyagokat és ritka fegyvereket keresnek The Lands Between világában...

MA 07:09

Az új Fannie Mae: Trump MI-hangja otthont ígér minden amerikainak

🏠 Donald Trump mesterséges intelligenciával generált hangján szólal meg az a friss videóhirdetés, amely forradalmi változásokat ígér a lakáspiacon, egy teljesen megújult Fannie Mae-t hirdetve...

MA 07:03

A lenyúlt kriptómilliók: így vadásznak rád az online csalók

Egy lényeges szempont, hogy a kriptovaluták világában a veszteségnek különösen fájdalmas arca van: a blokklánc technológiának köszönhetően minden tranzakció nyilvánosan követhető, így az ellopott pénz is látható – visszaszerezni azonban szinte lehetetlen...

MA 06:49

A Google új húzása: nehezebb lesz appot telepíteni Androidon

Androidon hamarosan megjelenik egy szigorúbb, úgynevezett „nagyobb súrlódású” (high-friction) kézi telepítési folyamat, amely minden olyan eszközt érint majd, amely Android 8...

MA 06:41

Az Ethereum: út a nyugdíjmilliókhoz, vagy csak délibáb?

Az Ethereum idén minden várakozást felülmúlhat, legalábbis a Standard Chartered elemzői szerint...

MA 06:33

A Gyűrűs-köd felfedi titkát: itt a vasóriás

🪐 Megvizsgálandó, hogy mi is rejtőzik valójában a Gyűrűs-köd színes gyűrűi mögött: európai csillagászok óriási, Mars-méretű vastömböt azonosítottak a világhírű planetáris köd belsejében...

MA 06:25

Az elektromos Porsche Macan meghódította Európát

A Porsche óriási sikert ért el Európában: tavaly több elektrifikált autót adott el, mint hagyományos benzinmotoros modellt...

MA 06:19

Az antarktiszi jégmag-archívum megmentheti a Föld klímamúltját

🌨 2026. január 14-én hivatalosan is megnyílt a világ leghidegebb könyvtára az Antarktiszon, a Concordia-állomás alatt...

MA 06:06

Történelmi események a mai napon (Január 19.)

Ezen a napon kirajzolódik Európa háborúinak és kultúrájának lenyomata: Rouen eleste és a normandiai visszahódítás csúcspontja, a tokiói nemzetközi törvényszék felállítása és Jan Palach önfeláldozó tiltakozása új irányt szabtak a történelemnek...

vasárnap 22:53

Az Acer szembeszáll az amerikai mobilszolgáltatókkal

Az Acer pert indított az Egyesült Államok három legnagyobb mobilszolgáltatója, a Verizon, az AT&T és a T-Mobile ellen, mivel állítása szerint a szolgáltatók jogtalanul használják az Acer mobilhálózati szabadalmait...

vasárnap 22:52

Az idei influenzaszezon pokoli: miért rosszabb, mint valaha?

Ami először apróságnak tűnt: nálunk is egyre több ismerős esik ágynak influenzával, a statisztikák pedig nem javítanak a helyzeten...