MA 06:58

Az Nvidia szoftverrel győzi le az AMD-t a tudományos MI-ben?

Az Nvidia szoftverrel győzi le az AMD-t a tudományos MI-ben?
Az utóbbi években az MI fejlődése hatalmas teljesítményigénnyel párosul, különösen a tudományos és nagy számítási teljesítményű (HPC) alkalmazásokban. Ezekben a feladatokban még mindig kiemelkedő jelentősége van a double precision, magyarul dupla pontosságú lebegőpontos (FP64) számításoknak. Ez a technológia tartja a levegőben a repülőgépeket és rakétákat, biztosítja a hatékony vakcinafejlesztést, és a nukleáris fegyverek működtetésében is kulcsszerepet játszik. Az Nvidia azonban szakít a hagyományos hardveres úttal: a Rubin és a Blackwell GPU-ikon szoftveres emulációt vet be, hogy jobb teljesítményt csikarjon ki MI-chipjeiből. Ezzel próbálja beérni az utóbbi időben fölénybe kerülő AMD-t.

Miért olyan fontos még a dupla pontosság?

Miközben egyre több chip dolgozik alacsonyabb pontosságú (például FP8) adattípusokkal, a tudományos számításokban az FP64-et nem tudták kiszorítani: senki sem tud olyan széles értéktartományt kezelni, mint ez a formátum, amely több mint 18,44 kvintillió különböző értéket képes reprezentálni. Ezzel szemben az MI-modellek javát mindössze 256-féle FP8-értéken tanítják, ami elképesztően kevés a tudományos pontossághoz képest. Az MI-vel szemben a HPC-feladatok hibára jelentősen érzékenyek; például áramlástanban, égésfolyamatokban vagy anyagtudományban még a legkisebb hibák is akkumulálódnak, és hibás végeredményhez vezetnek.

Szoftveres emuláció: régi ötlet, új köntösben

A hardver hiányában már az 1950-es években is alkalmazták az FP64 szoftveres emulációját. Az eljárás lényege, hogy a bonyolultabb számítást apróbb, alacsonyabb pontosságú műveletekre bontják, például 8 bites egész (INT8) műveletek összességével érik el az eredményt. A Rubin GPU-n a szoftveres kapcsolót bekapcsolva a felhasználó akár 4,4-szeres FP64 teljesítményt kaphat, összevetve a hardveres Blackwell-gyorsítókkal, holott azok is csúcstartók a piacon. Így a Rubin ma nemcsak az Nvidia legerősebb MI-gyorsítója, de a legütősebb tudományos GPU is.

Különösen fontos kiemelni, hogy az Nvidia Rubin-GPU-ja hardverből még mindig 33 teraFLOPS FP64 csúcsteljesítményt nyújt (ez egy teraFLOP-pal kevesebb, mint a négyéves H100), de szoftveres emulációval ezt az értéket jelentősen meg tudja növelni. Az innováció alapját adó Ozaki-módszert japán kutatók dolgozták ki: az egész számokra lebontott FP64 mátrixműveletek Nvidia tensor magokon futtatva meghaladják a natív teljesítményt.

Egyre több a kérdőjel – AMD is vitatja az áttörést

Az Nvidia ugyan kiemeli, hogy az emuláció pontossága legalább annyira jó, mint a valódi hardveres megoldásoké, az AMD szakértőinek egy része nem teljesen osztja ezt a lelkesedést. Szerintük az eljárás jól működik azoknál a benchmarkoknál, ahol kerek, rendezett adathalmazokról van szó, mint a High Performance Linpack tesztnél. Viszont bonyolultabb tudományos szimulációknál (anyagkutatás, kémiai folyamatok, sávos lineáris algebra) már döcög a rendszer, és hibák csúsznak a végeredménybe.

A legtöbb problémát az IEEE-szabvány szerinti pontosság hiánya okozza: az Nvidia algoritmusai nem kezelik megfelelően például a pozitív és negatív nullákat vagy a végtelenbe futó hibákat. Ez azt eredményezi, hogy a több tízezer művelet eredménye összetett zavarokat, akár hibás végeredményt is okozhat – ilyen esetekben az emuláció nem megbízható. Ráadásul az emulációhoz szükséges többletműveletek miatt a memóriahasználat akár a duplájára is nőhet.

Az AMD ezért továbbra is dedikált, kifejezetten HPC-re tervezett hardverekre koncentrál, mint az MI430X, ahol chiplet-architektúrával erősíti meg az FP64- és FP32-teljesítményt.


Kinek éri meg ez a trükk?

Nem minden alkalmazás profitál az FP64 emulációból. Az eljárás főleg sűrű mátrixszorzásoknál (DGEMM) ütős, ezek viszont a teljes HPC-felhasználás csak 30–40 százalékát teszik ki. A legtöbb valós szimulációs igény, áramlástani modellezés, spektrálanalízis és társaik továbbra is a klasszikus, vektoros FMA-műveletekre építenek. Ezeknél az emuláció semmilyen vagy csak minimális előnyt biztosít. Ez az oka annak, hogy a TOP500 szuperszámítógép-listán a vektoros (nem mátrixalapú) számításokban továbbra is a CPU-k dominálnak.

A Rubin GPU vektoros FP64 teljesítménye nem kiugró, viszont a 22 TB/s-os (!) HBM4 memóriasávszélesség révén a valós munkaterhelésekben még így is jóval többet tud, mint amit a puszta specifikáció mutatna.

A történet itt még nem ér véget

A következő években annyi Blackwell- és Rubin-GPU kerül szuperszámítógépekbe, hogy az FP64 emuláció igazi próbája csak most következik. Ha az algoritmusok nincsenek hardverhez kötve, idővel folyamatosan fejleszthetők, finomíthatók. Az AMD sem zárja ki végleg a szoftveres FP64 megoldásokat, az MI355X chipnél például teszteli a lehetőségeiket.

Különösen fontos kiemelni, hogy az iparági áttöréshez az IEEE-szabványos megfelelőség elengedhetetlen lenne – csak így állítható garantáltan, hogy a szoftveres végeredmény megegyezik a dedikált szilíciumos eredménnyel.

Összességében elmondható, hogy az Nvidia szoftveres FP64 emulációja izgalmas út, de jelenleg főként a matematikai mátrixműveletekre korlátozódik. A való életben a HPC továbbra is igényli a hagyományos hardveres pontosságot, de a technológia folyamatos fejlesztésével, tesztelésével akár néhány éven belül szélesebb körben is elterjedhet.

2025, adminboss, go.theregister.com alapján

  • Te mit gondolsz, jó ötlet-e a szoftveres emuláció ilyen érzékeny területeken?
  • Te hogyan döntenél, ha választanod kellene a gyorsabb, de kevésbé pontos megoldás és a lassabb, megbízhatóbb rendszer között?


Legfrissebb posztok

MA 09:58

A mesterséges intelligencia elszabadult: aranykor vagy káosz a zenében?

Az elmúlt évek egyik legbeszédesebb példája Bad Bunny sikere: amikor az NFL és az Apple Music bejelentette, hogy ő lesz a 2026-os Super Bowl félidei show főfellépője, sokakat meglepett...

MA 09:49

A chilei rémálom folytatódik: lángtenger, káosz, tömeges kitelepítés

Dél-Chile tüzei ismét lesújtottak: már legalább 15 halálos áldozatot követelnek az elszabadult erdőtüzek, és több mint 50 ezren kényszerültek elhagyni otthonukat...

MA 09:41

Az öntudatos MI csábító, de veszélyes mítosz

A tudatosság, mint számítás? A tudatos MI ötlete abból a feltevésből indul ki, hogy maga a tudatosság is puszta számítási folyamat eredménye...

MA 09:33

A közösségi trón új ura: a Threads letaszította az X-et mobilon

👑 Az utóbbi hónapokban a Threads, a Meta új közösségi alkalmazása egyre több felhasználót hódított meg, és már lenyomta Elon Musk X-ét (korábban Twitter) a napi aktív mobilhasználók számában...

MA 09:18

Az USA–Tajvan chipmegállapodása: marad a szilíciumpajzs?

🛠 Tajvan még jó ideig megőrizné a világ csúcstechnológiájú chipgyártásának otthonát – annak ellenére, hogy Washington komoly lépéseket tesz azért, hogy a sziget legfejlettebb félvezetőgyártó kapacitásának egy részét az Egyesült Államokba költöztesse...

MA 09:10

Az emberi szem titkából született fototranzisztor forradalmasítja a gépi látást

A Kínai Tudományos Akadémia Fémkutató Intézetének tudósai úttörő érzékelőt fejlesztettek, amely az emberi szemhez hasonlóan alkalmazkodóképes, és extrém érzékenységgel képes alacsony kontrasztú célpontokat észlelni...

MA 09:01

Az amerikai diplomások előnye elveszett: nem jutnak gyorsabban álláshoz

Az Egyesült Államokban évtizedekig a főiskolai diploma jelentette a gyorsabb elhelyezkedés kulcsát, de ennek most vége szakadhat...

MA 08:49

Megint gond van a Windows-frissítéssel? Itt a sürgősségi javítás

A januári biztonsági frissítések után számos Windows 10 és 11, valamint Windows Server gép szorult sürgősségi, úgynevezett OOB (out-of-band) javításra...

MA 08:42

Az új szuperszója átírja a tejipar szabályait

Dél-Michiganben, a Preston család tejgazdaságának 160 hektáros szójaföldje első ránézésre teljesen átlagos...

MA 08:34

Az MI nem egy lufi, hanem egy egész lufiparádé.

Érdemes megvizsgálni, hogy valóban csak egyetlen MI-lufiról beszélhetünk-e, vagy inkább több, egymással összefonódó lufi fúvódik fel egyszerre a technológiai piacokon...

MA 08:26

A Tylenol igazi veszélye nem az autizmus

Az acetaminofen – ez a népszerű és könnyen elérhető fájdalom- és lázcsillapító, amely a Tylenol és számtalan nátha- és influenzaszer fő hatóanyaga – valójában jóval nagyobb kockázatot rejt magában, mint amit a közösségi médiában terjedő, autizmussal kapcsolatos elméletek sugallnak...

MA 08:18

Az emberi génhiba csodafegyverré válhat: amikor két rossz gén jót tesz

Néha a genetika világában két negatív génváltozat együtt épphogy jótékony hatást fejt ki...

MA 07:57

Az űrből érkező vírusok legyűrhetik a makacs baktériumokat

A baktériumok és az őket fertőző vírusok, azaz a bakteriofágok folyamatos evolúciós harcot vívnak egymással...

MA 07:50

A pénztárcabarát Roku-projektor, ami otthonra varázsolja a mozit

🎥 A házimozi-projektorok legnagyobb kihívása még mindig az ár. Erre igyekszik megoldást nyújtani az Aurzen EAZZE D1R, amely kedvező áron és egyszerű kezelhetőséggel teszi lehetővé, hogy otthon is gyakran tarts moziestéket – mindenféle speciális helyiség vagy bonyolult technika beszerzése nélkül...

MA 07:41

A Windows 11 legújabb frissítése miatt nem állnak le a gépek

💻 A Microsoft január 13-án adta ki az első Windows 11-frissítését 2026-ban, de pár nap múlva már sürgősségi javítást kellett kiadnia, mert komoly hibák jelentek meg...

MA 07:25

Az univerzum legősibb, Tejúthoz hasonló galaxisa meglepő felfedezést hozott

🚀 Egy nemzetközi csillagászcsoport megerősítette, hogy a világegyetem eddig ismert legrégebbi, Tejútrendszerhez hasonló, rúddal rendelkező spirálgalaxisa mindössze 2 milliárd évvel az ősrobbanás után már létezett...

MA 07:17

A régi jelszavak időt rabolnak és kockára teszik a biztonságot

Reggelente már a munka kezdete előtt három különböző jelszót kell beírni, mindegyikre egyre bonyolultabb szabályok vonatkoznak...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 1/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Elden Ring Map: Game Companion (iPhone/iPad)Az „Ultimate Adventure Guide for The Lands Between and the Shadow of the Erdtree” átfogó kalauz mindazoknak, akik fejlesztési anyagokat és ritka fegyvereket keresnek The Lands Between világában...

MA 07:09

Az új Fannie Mae: Trump MI-hangja otthont ígér minden amerikainak

🏠 Donald Trump mesterséges intelligenciával generált hangján szólal meg az a friss videóhirdetés, amely forradalmi változásokat ígér a lakáspiacon, egy teljesen megújult Fannie Mae-t hirdetve...