2025. 03. 30., 15:37

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve
Jensen Huang, az Nvidia vezérigazgatója már régóta hangoztatja, hogy a Moore-törvény halott. A legutóbbi GTC-konferencián tartott bemutatón azonban kiderült, hogy ez a számítástechnikai törvényszerűség nemcsak halott, hanem mélyen el is van már temetve. Huang nemcsak a cég következő generációs processzorait mutatta be, hanem meglepően részletes információkat osztott meg a következő két generációs számítási platformról is, például egy 600 kW-os rack-rendszerről. Azt is megtudtuk, hogy a 2028-ban érkező GPU-családot Richard Feynmanról nevezik majd el. Szokatlan, hogy a csipgyártók ilyen részletesen felfedik jövőbeli terveiket. Ennek oka egyszerű: az Nvidia akadályokba ütközött, méghozzá nem is egybe, hanem többbe. A legrosszabb pedig az, hogy ezeknek a problémáknak a megoldása – a pénzpumpáláson kívül – nagyrészt kívül esik az Nvidia hatáskörén.

Innentől csak felfelé és kifelé

Az első és legnyilvánvalóbb kihívás a számítási kapacitás skálázásával kapcsolatos. A gyártási folyamatok fejlődése az utóbbi években lelassult. Bár még mindig vannak lehetőségek a fejlesztésre, ezek egyre nehezebbé és költségesebbé válnak.

E korlátokkal szembesülve az Nvidia stratégiája egyszerű: maximalizálni a szilícium mennyiségét minden számítási csomópontban. Jelenleg az Nvidia legsűrűbb rendszerei 72 GPU-t kapcsolnak össze egyetlen számítási tartományban a nagy sebességű, 1,8 TB/s NVLink szövet segítségével. A GTC-n az Nvidia bejelentette, hogy ezt a számot előbb 144-re, majd végül 576 GPU-ra kívánja növelni rackenként. A méretezés azonban nemcsak a rackekben történik, hanem a csipek csomagolásán belül is.

Ez már a Nvidia Blackwell-gyorsítóinak tavalyi bemutatásakor is nyilvánvalóvá vált. A csipek ötszörös teljesítménynövekedést ígértek a Hopperhez képest, ami impozánsan hangzott, egészen addig, amíg ki nem derült, hogy ehhez kétszer annyi die-ra, egy új, 4 bites adattípusra és 500 wattal több energiára volt szükség.

2027-re 600 kW-os rackek érkeznek

Még nem tudjuk, milyen gyártási technológiát tervez az Nvidia a következő generációs csipjeihez, de annyi biztos, hogy a Rubin Ultra folytatja a felskálázás trendjét. Még a TSMC 2 nm-es technológiájától várt körülbelül 20 százalékos hatékonyságnövekedés mellett is ez egy rendkívül forró csipcsomag lesz.

Nemcsak a számítási kapacitás növekszik, hanem a memória is. A Rubinról a Rubin Ultrára való átálláskor jelentős ugrás várható a kapacitásban és a sávszélességben is – 288 GB-ról 1 TB-ra. Ennek körülbelül fele a gyorsabb, nagyobb kapacitású memóriamoduloknak köszönhető, míg a másik fele a memóriára szánt szilícium mennyiségének megduplázódásából ered – a Blackwell és Rubin nyolc moduljáról a Rubin Ultra tizenhat moduljára.

A megnövelt kapacitás lehetővé teszi, hogy az Nvidia több modellparamétert tömörítsen egyetlen csomagba, FP4 formátumban körülbelül 2 billiót, vagy “GPU-nként” 500 milliárdot. A HBM4e memória várhatóan megduplázza a sávszélességet a HBM3e-hez képest. Így a jelenlegi Blackwell  körülbelül 4 TB/s sávszélessége várhatóan 8 TB/s-ra ugrik a Rubin Ultra esetében.

A gigawatt per rack elfogadható felső korlátnak tűnik

A gyártási folyamatok fejlődése nem az egyetlen módja a számítási kapacitás vagy a memória skálázásának. A 16 bitről 8 bitre való áttérés például gyakorlatilag megduplázza a teljesítményt, miközben felére csökkenti egy adott modell memóriaigényét. A probléma azonban az, hogy a Nvidia lassan kifogy a csökkenthető bitszámokból. A Hopperről a Blackwellre történő váltás során négy bitet vettek el, megduplázták a szilícium mennyiségét, és ötszörös lebegőpontos teljesítménynövekedést értek el.

A négy bitnél alacsonyabb precizitás viszont már durva eredményeket produkál az LLM-következtetéseknél, jelentősen emelkedő perplexitás-pontszámokkal. Ugyanakkor érdekes kutatások zajlanak a szuper alacsony precizitású kvantálás terén, akár 1,58 bitig, miközben megőrzik a pontosságot.

Mindenesetre az Nvidia stratégiája egyértelmű: a számítási platformok egyre nagyobbak, sűrűbbek, forróbbak és energiaéhesebbek lesznek a jövőben. Ahogyan Huang fogalmazott a múlt heti sajtótájékoztatón, a limit itt az, hogy mennyi energiát tudsz beletáplálni egy rackbe.

“Egy adatközpont jelenleg 250 megawatt. Ez valamiféle korlát rackenként. A többi csak részletkérdés” – mondta Huang. “Azt mondanám, hogy a gigawatt per rack jó határnak tűnik.”


Az energiaproblémát nem lehet megkerülni

Természetesen a 600 kW-os rackek hatalmas fejfájást okoznak az adatközpont-üzemeltetőknek. Az ultra-sűrű számítási kapacitás hűtése, amely már megawattokban mérhető, nem új kihívás. Ami megváltozott, az az, hogy itt most nem néhány apró klaszterről beszélünk évente, hanem tucatnyiról, amelyek közül néhány elég erős ahhoz, hogy letaszítsa a világ legerősebb szuperszámítógépeit a trónról.

Ezeknél a méretekben a nagyon specializált, kis volumenű hőkezelési és energiaellátási rendszerek egyszerűen nem elégségesek. Sajnos az adatközpont-forgalmazók – akik azokat a nem éppen izgalmas alkatrészeket árulják, amelyek nélkül a több millió dolláros NVL72 rackek nem működnének – csak most kezdik magukat utolérni az igények terén.

Ez lehet az oka annak, hogy a bejelentett Blackwell-telepítések többségét a léghűtéses HGX B200-ra tervezték, nem az NVL72-re, amelyet Huang kitartóan reklámoz. Az HGX rendszerek – nyolc GPU-val – sok meglévő H100 környezetben telepíthetők.

Az NVL72 egy teljes rackméretű kialakítás, amelyet jelentősen a hiperskálázók ihlettek, DC-buszokkal, tápegység-szánokkal és elöl kivezetett hálózattal. 120 kW folyadékhűtéses számítási teljesítményével több ilyen telepítése egy meglévő létesítményben gyorsan problematikussá válik. És ahogy megjósolható, ez még nehezebbé válik, amikor az Nvidia 600 kW-os “szörnyrackjei” 2027 végén debütálnak.

A vezetőt követni kell

Fontos tisztázni, hogy ezek az akadályok nemcsak az Nvidiára vonatkoznak. Az AMD, az Intel és minden más felhőszolgáltató vagy csiptervező, amely az Nvidia piaci részesedéséből szeretne kihasítani egy szeletet, hamarosan ugyanezekkel a problémákkal találja szemben magát.

Ennek a kihívásnak azonban előnyei is vannak. Az Nvidia egyedülálló helyzetben van ahhoz, hogy meghatározza a jövőbeli adatközpontok energia- és hőtechnikai szabványait.

Ahogy Huang korábban is elmondta, hajlandó volt felfedni a következő három GPU-generációt, sőt utalni a negyedikre is, hogy infrastruktúrális partnereik megfelelően felkészülhessenek.

“Azért ismertettem a világgal az Nvidia következő három-négy éves útitervét, hogy mostantól mindenki más is ennek megfelelően tervezhessen” – mondta Huang.

Másrészt ezek az erőfeszítések egyengetik az utat a konkurens csipgyártók számára is. Ha az Nvidia megtervez egy 120 kW-os vagy most már 600 kW-os rack-et, és a kolokációs szolgáltatók, valamint a felhőüzemeltetők hajlandóak támogatni azt, akkor az AMD vagy az Intel is nyugodtan beépítheti ugyanezt a teljesítményszintet a saját rackjeikbe anélkül, hogy aggódnának, hol állítják majd üzembe azokat a megrendelők.

2025, adminboss, go.theregister.com alapján

  • Mit gondolsz az Nvidia jövőbeli terveiről?
  • Hogyan látod a technológiai fejlődés hatásait a környezetre?
  • Mennyire tartod fenntarthatónak az egyre nagyobb energiaigényű rendszereket?
  • Mit tennél a helyükben a versenytársak?
  • Mennyire fontos a nyílt kommunikáció a technológiai iparban?
  • Hogyan befolyásolhatja a társadalmat az ilyen mértékű számítási kapacitás?


Legfrissebb posztok

MA 17:02

Az MI újabb bakija: fejlesztők letiltva, megállnak a nagy szoftverek

Érdekes felvetés, hogy néhány kulcsfontosságú, nyílt forráskódú program fejlesztői napok óta nem tudják frissíteni alkalmazásaikat Windowsra, mert a Microsoft egyik pillanatról a másikra, érdemi figyelmeztetés nélkül felfüggesztette a fejlesztői fiókjaikat...

MA 16:56

A belek rejthetik az ALS és a demencia kulcsát

A Case Western Reserve Egyetem kutatói egy meglepő összefüggésre derítettek fényt: a bélben élő baktériumok által termelt káros cukrok jelentős szerepet játszhatnak a rendkívül pusztító agyi betegségek, például az ALS (amiotrófiás laterálszklerózis) és a frontotemporális demencia kialakulásában...

MA 16:34

A rejtélyesen eltűnt rendszergazda pokollá teszi a Samsungosok életét

A Galaxy S22 Ultra-tulajdonosok egy része teljesen váratlan akadályba ütközik, amikor a gyári beállítások visszaállítása után az általuk legálisan vásárolt telefont egyszer csak zárolják — ráadásul nem is ők, hanem egy ismeretlen, gyanús szervezet, a Numero LLC neve jelenik meg a készüléken...

MA 16:02

A JBL új fejhallgatói: finom előrelépés, bosszantó hibákkal

A JBL két új modellje, a Live 780NC és a Live 680NC csábító ígérettel érkezett, hogy a középkategóriás vezeték nélküli, zajszűrős fejhallgatók élmezőnyébe törjön...

MA 15:47

Az Artemis II után: Megváltozott, amit a Holdról tudunk?

🚲 Egy újabb történelmi kört zárt a NASA, amikor az Orion űrhajó tizenhárom évnyi előkészület után négyfős személyzettel kerülte meg a Holdat és indult vissza a Föld felé...

MA 15:34

A Google új trükkje: jegyzetelj okosabban, lustábban!

📝 Komolyan mondom, végre egy kis ész a digitális káoszban! A Google beolvasztotta a NotebookLM nevű mesterségesintelligencia-alapú kutatósegédjét a Gemini csevegőjébe, így mostantól már nem kell ezer ablak között vergődve kezelni a jegyzeteidet...

MA 15:23

Az új Muse Spark: a Meta MI-forradalma újraindul

Érdemes megvizsgálni, hogy a Meta legutóbbi MI-modellje, a Muse Spark képes-e új alapokra helyezni a cég mesterségesintelligencia-stratégiáját, miután a Llama 4 csalódást keltő fogadtatásban részesült...

MA 15:12

A Meta új modellje: totális zártság, nyitottság sehol

Mark Zuckerberg, aki korábban a nyílt forráskódú MI élharcosaként tündökölt, most meglepő fordulattal egészen eltérő irányt vett...

MA 15:02

A magánszféra otthoni védelmének 7 egyszerű, mégis ütős módja

Nemcsak a közösségi média vagy a kéretlen telefonhívások jelenthetnek veszélyt az adatainkra – az otthonunkban lévő technológia is komoly kockázati forrás lehet...

MA 14:56

Az új titkosítás véget vethet a kvantumhackerek uralmának

A tudomány nem tétlenkedik: egy új titkosítási rendszer született, amely már ma képes megvédeni a videofájlokat a jövő kvantumszámítógépeinek támadásaitól...

MA 14:48

A DJI Romo P: forradalmi porszívó, vagy csak menő kütyü?

🧺 A DJI, a dróntechnológiában jártas kínai óriásvállalat új szintre emelte az okos otthon gépeket: bemutatkozott a Romo P, amely végre nem csak kütyürajongóknak szól...

MA 14:34

Az Artemis II pokla: forróság, félelem és hazatérés a Holdról

Négy asztronauta történelmi utazása a Hold körül az Artemis II küldetés keretében a végéhez közeledik...

MA 14:24

Az új akkumulátor, amellyel a laptop hónapokig bírja

Képzelj el egy olyan akkumulátort, amelyet hónapokig, sőt akár évekig sem kell tölteni vagy cserélni egy energiaigényes laptopban – mindezt egy párkilós eszköz segítségével...

MA 14:03

Végleg búcsút inthetünk a titokzatos steril neutrínónak?

A neutrínók a lehető legelhanyagolhatóbb részecskék közé tartoznak: szinte semmi tömegük, nincs sem elektromos, sem színtöltésük, így a természet legtöbb erői gyakorlatilag nem hatnak rájuk...

MA 13:56

Az emberi DNS rejtett második kódja kapcsolja ki a géneket

🔑 Az emberi DNS egy bonyolult, hárombetűs egységekből álló rendszer; ezek az egységek négyféle nukleotidból épülnek fel...

MA 13:44

Az összehajtható iPhone jön? Szeptemberre készül a nagy Apple-hajtogatás

Nincs unalmasabb annál, mint amikor egy techóriás csak tologatja az újdonságokat – na de komolyan, most tényleg beindultak Cupertinóban!..

MA 13:34

A Ghost Murmur: valódi kémkütyü vagy csak sci-fi?

🕵 Noha a Ghost Murmur eszközről szóló történetek izgalmasak, a tudomány jelenlegi állása szerint meglehetősen valószínűtlen, hogy ilyen kvantumkémkedési technológia létezne vagy működne a leírtak szerint...

MA 13:24

Az MI körüli viták fékezik a vállalatok növekedését

Ilyen eset például, amikor egy vállalat rengeteg pénzt és erőforrást önt az MI-be, de a várt áttörések elmaradnak...

MA 13:01

Az ember 60 ezer éve meghódította Ausztráliát

🚶 Az emberiség vándorlásának egyik legnagyobb rejtélyére sikerült rávilágítani, méghozzá a DNS nyomozásával: már bizonyíték van arra, hogy az emberek körülbelül 60 ezer évvel ezelőtt érték el először Ausztráliát és Új-Guineát – sokkal korábban, mint azt néhány újabb elmélet eddig sejtette...

MA 12:57

Az öböl kapuja hetekig, akár hónapokig is zárva marad

🚢 Különösen igaz ez akkor, ha a világ energiaellátását fenyegető útvonalak kerülnek veszélybe...

MA 12:45

A nagy fordulat: a John Deere visszakozik, a gazdák nyernek

Évek óta dúl a vita: a gazdák szabadon szerelhetnék a saját gépeiket, vagy csak a John Deere drága szervizei babrálhatnak a traktorokkal?..

MA 12:34

Az Adobe Reader súlyos veszélyben: négy hónapja tart a hackerostrom

Aggasztó fejlemény, hogy már legalább négy hónapja kihasználnak hackerek egy súlyos, eddig nem javított, úgynevezett zero-day sebezhetőséget az Adobe Readerben...

MA 12:23

Az eddigi leggyorsabb töltés: BYD és KFC összefog Kínában

Tipikus eset, amikor két óriás egymásra talál: a kínai elektromosautó-gyártó BYD és a KFC különleges együttműködésbe kezdett, hogy közösen nyissák meg az ország első, kilenc perc alatt letudható gyorséttermi töltőállomásait...

MA 12:01

Az MI-ügynökök megjöttek – és velük a káosz

Például néhány éve még csak csevegtünk egy barátságos chatbottal, ma pedig már érezhető, hogy a mindennapokban is jelen van a mesterséges intelligencia...

MA 11:56

A gigantikus Bitcoin ATM-hálózatot milliós kibertámadás rázta meg

💸 A világ egyik legnagyobb Bitcoin ATM-hálózatát üzemeltető Bitcoin Depot súlyos pénzügyi károkat szenvedett el, miután hekkerek márciusban betörtek a rendszerükbe, és mintegy 1,4 milliárd forint (3,665 millió dollár) értékű Bitcoint loptak el a cég tárcáiból...

MA 11:46

Az orrában fejlődő légylárva – döbbenetes görög eset

Egy görög szigeten élő, 58 éves nő elképesztő egészségügyi problémával szembesült: hosszan tartó arcfájdalom, majd heves köhögés kínozta, miközben egyre rosszabbul érezte magát...

MA 11:34

Az okosórád már a termékenységet is figyeli: megérkezett a Garmin új funkciója

A Garmin legújabb fejlesztésével már a termékenységi adatok is elérhetők az okosórákon...

MA 11:01

Az Xbox végre forradalmasítja az elavult Achievement-rendszert

Az Xbox Achievement-rendszer évek óta nem kapott érdemi frissítést, mostanra azonban látványosan megújul: az Xbox Insider program résztvevői már tesztelhetik az új funkciókat, amelyek hamarosan mindenkihez megérkeznek...

MA 10:44

A mesterséges intelligencia háborút indít az üzleti adataidért

🤓 A digitalizáció rohamosan átalakítja, hogyan dolgoznak a vállalkozások minden iparágban, miközben az MI-alapú megoldások egyre mélyebben beépülnek a mindennapi munkafolyamatokba...