2025. 03. 30., 15:37

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve
Jensen Huang, az Nvidia vezérigazgatója már régóta hangoztatja, hogy a Moore-törvény halott. A legutóbbi GTC-konferencián tartott bemutatón azonban kiderült, hogy ez a számítástechnikai törvényszerűség nemcsak halott, hanem mélyen el is van már temetve. Huang nemcsak a cég következő generációs processzorait mutatta be, hanem meglepően részletes információkat osztott meg a következő két generációs számítási platformról is, például egy 600 kW-os rack-rendszerről. Azt is megtudtuk, hogy a 2028-ban érkező GPU-családot Richard Feynmanról nevezik majd el. Szokatlan, hogy a csipgyártók ilyen részletesen felfedik jövőbeli terveiket. Ennek oka egyszerű: az Nvidia akadályokba ütközött, méghozzá nem is egybe, hanem többbe. A legrosszabb pedig az, hogy ezeknek a problémáknak a megoldása – a pénzpumpáláson kívül – nagyrészt kívül esik az Nvidia hatáskörén.

Innentől csak felfelé és kifelé

Az első és legnyilvánvalóbb kihívás a számítási kapacitás skálázásával kapcsolatos. A gyártási folyamatok fejlődése az utóbbi években lelassult. Bár még mindig vannak lehetőségek a fejlesztésre, ezek egyre nehezebbé és költségesebbé válnak.

E korlátokkal szembesülve az Nvidia stratégiája egyszerű: maximalizálni a szilícium mennyiségét minden számítási csomópontban. Jelenleg az Nvidia legsűrűbb rendszerei 72 GPU-t kapcsolnak össze egyetlen számítási tartományban a nagy sebességű, 1,8 TB/s NVLink szövet segítségével. A GTC-n az Nvidia bejelentette, hogy ezt a számot előbb 144-re, majd végül 576 GPU-ra kívánja növelni rackenként. A méretezés azonban nemcsak a rackekben történik, hanem a csipek csomagolásán belül is.

Ez már a Nvidia Blackwell-gyorsítóinak tavalyi bemutatásakor is nyilvánvalóvá vált. A csipek ötszörös teljesítménynövekedést ígértek a Hopperhez képest, ami impozánsan hangzott, egészen addig, amíg ki nem derült, hogy ehhez kétszer annyi die-ra, egy új, 4 bites adattípusra és 500 wattal több energiára volt szükség.

2027-re 600 kW-os rackek érkeznek

Még nem tudjuk, milyen gyártási technológiát tervez az Nvidia a következő generációs csipjeihez, de annyi biztos, hogy a Rubin Ultra folytatja a felskálázás trendjét. Még a TSMC 2 nm-es technológiájától várt körülbelül 20 százalékos hatékonyságnövekedés mellett is ez egy rendkívül forró csipcsomag lesz.

Nemcsak a számítási kapacitás növekszik, hanem a memória is. A Rubinról a Rubin Ultrára való átálláskor jelentős ugrás várható a kapacitásban és a sávszélességben is – 288 GB-ról 1 TB-ra. Ennek körülbelül fele a gyorsabb, nagyobb kapacitású memóriamoduloknak köszönhető, míg a másik fele a memóriára szánt szilícium mennyiségének megduplázódásából ered – a Blackwell és Rubin nyolc moduljáról a Rubin Ultra tizenhat moduljára.

A megnövelt kapacitás lehetővé teszi, hogy az Nvidia több modellparamétert tömörítsen egyetlen csomagba, FP4 formátumban körülbelül 2 billiót, vagy “GPU-nként” 500 milliárdot. A HBM4e memória várhatóan megduplázza a sávszélességet a HBM3e-hez képest. Így a jelenlegi Blackwell  körülbelül 4 TB/s sávszélessége várhatóan 8 TB/s-ra ugrik a Rubin Ultra esetében.

A gigawatt per rack elfogadható felső korlátnak tűnik

A gyártási folyamatok fejlődése nem az egyetlen módja a számítási kapacitás vagy a memória skálázásának. A 16 bitről 8 bitre való áttérés például gyakorlatilag megduplázza a teljesítményt, miközben felére csökkenti egy adott modell memóriaigényét. A probléma azonban az, hogy a Nvidia lassan kifogy a csökkenthető bitszámokból. A Hopperről a Blackwellre történő váltás során négy bitet vettek el, megduplázták a szilícium mennyiségét, és ötszörös lebegőpontos teljesítménynövekedést értek el.

A négy bitnél alacsonyabb precizitás viszont már durva eredményeket produkál az LLM-következtetéseknél, jelentősen emelkedő perplexitás-pontszámokkal. Ugyanakkor érdekes kutatások zajlanak a szuper alacsony precizitású kvantálás terén, akár 1,58 bitig, miközben megőrzik a pontosságot.

Mindenesetre az Nvidia stratégiája egyértelmű: a számítási platformok egyre nagyobbak, sűrűbbek, forróbbak és energiaéhesebbek lesznek a jövőben. Ahogyan Huang fogalmazott a múlt heti sajtótájékoztatón, a limit itt az, hogy mennyi energiát tudsz beletáplálni egy rackbe.

“Egy adatközpont jelenleg 250 megawatt. Ez valamiféle korlát rackenként. A többi csak részletkérdés” – mondta Huang. “Azt mondanám, hogy a gigawatt per rack jó határnak tűnik.”


Az energiaproblémát nem lehet megkerülni

Természetesen a 600 kW-os rackek hatalmas fejfájást okoznak az adatközpont-üzemeltetőknek. Az ultra-sűrű számítási kapacitás hűtése, amely már megawattokban mérhető, nem új kihívás. Ami megváltozott, az az, hogy itt most nem néhány apró klaszterről beszélünk évente, hanem tucatnyiról, amelyek közül néhány elég erős ahhoz, hogy letaszítsa a világ legerősebb szuperszámítógépeit a trónról.

Ezeknél a méretekben a nagyon specializált, kis volumenű hőkezelési és energiaellátási rendszerek egyszerűen nem elégségesek. Sajnos az adatközpont-forgalmazók – akik azokat a nem éppen izgalmas alkatrészeket árulják, amelyek nélkül a több millió dolláros NVL72 rackek nem működnének – csak most kezdik magukat utolérni az igények terén.

Ez lehet az oka annak, hogy a bejelentett Blackwell-telepítések többségét a léghűtéses HGX B200-ra tervezték, nem az NVL72-re, amelyet Huang kitartóan reklámoz. Az HGX rendszerek – nyolc GPU-val – sok meglévő H100 környezetben telepíthetők.

Az NVL72 egy teljes rackméretű kialakítás, amelyet jelentősen a hiperskálázók ihlettek, DC-buszokkal, tápegység-szánokkal és elöl kivezetett hálózattal. 120 kW folyadékhűtéses számítási teljesítményével több ilyen telepítése egy meglévő létesítményben gyorsan problematikussá válik. És ahogy megjósolható, ez még nehezebbé válik, amikor az Nvidia 600 kW-os “szörnyrackjei” 2027 végén debütálnak.

A vezetőt követni kell

Fontos tisztázni, hogy ezek az akadályok nemcsak az Nvidiára vonatkoznak. Az AMD, az Intel és minden más felhőszolgáltató vagy csiptervező, amely az Nvidia piaci részesedéséből szeretne kihasítani egy szeletet, hamarosan ugyanezekkel a problémákkal találja szemben magát.

Ennek a kihívásnak azonban előnyei is vannak. Az Nvidia egyedülálló helyzetben van ahhoz, hogy meghatározza a jövőbeli adatközpontok energia- és hőtechnikai szabványait.

Ahogy Huang korábban is elmondta, hajlandó volt felfedni a következő három GPU-generációt, sőt utalni a negyedikre is, hogy infrastruktúrális partnereik megfelelően felkészülhessenek.

“Azért ismertettem a világgal az Nvidia következő három-négy éves útitervét, hogy mostantól mindenki más is ennek megfelelően tervezhessen” – mondta Huang.

Másrészt ezek az erőfeszítések egyengetik az utat a konkurens csipgyártók számára is. Ha az Nvidia megtervez egy 120 kW-os vagy most már 600 kW-os rack-et, és a kolokációs szolgáltatók, valamint a felhőüzemeltetők hajlandóak támogatni azt, akkor az AMD vagy az Intel is nyugodtan beépítheti ugyanezt a teljesítményszintet a saját rackjeikbe anélkül, hogy aggódnának, hol állítják majd üzembe azokat a megrendelők.

2025, adminboss, go.theregister.com alapján

  • Mit gondolsz az Nvidia jövőbeli terveiről?
  • Hogyan látod a technológiai fejlődés hatásait a környezetre?
  • Mennyire tartod fenntarthatónak az egyre nagyobb energiaigényű rendszereket?
  • Mit tennél a helyükben a versenytársak?
  • Mennyire fontos a nyílt kommunikáció a technológiai iparban?
  • Hogyan befolyásolhatja a társadalmat az ilyen mértékű számítási kapacitás?


Legfrissebb posztok

MA 17:23

Az államkötvény-hozamok milliárdokat szívnak ki a bitcoin ETF-ekből

A kriptovaluták iránti lendület komoly csapást szenvedett el, ahogy a befektetők tömegesen menekítik a pénzüket a bitcoin-alapú tőzsdén kereskedett alapokból...

MA 17:01

Az évszázad hőhulláma sújtja Európát: újabb halálos áldozatok

Döbbenetesen szokatlan, rendkívüli hőséggel küzd Nyugat-Európa: sorra dőlnek a melegrekordok, miközben egyre többen vesztik életüket a forróság következtében...

MA 16:35

Az új Bond-játék végre igazi Bond-mozi: lopakodás és robbanások

Üldözések, szuperkütyük és látványos akciópillanatok – a 007 First Light minden eddiginél jobban képes átélhetővé tenni, milyen érzés James Bondként beszivárogni a világ legveszélyesebb színtereire...

MA 16:23

Az új Ferrari Luce sokkol: Jony Ive védi, egy döntést imádnak

A Ferrari leleplezte története első elektromos autóját, a Lucét, ami máris heves vitákat kavart...

MA 16:13

A GEEKOM A9 Max (2026) tesztje: mini PC, munkaállomás-erővel

Az asztali méretű, kis helyet foglaló gépek mezőnyében a GEEKOM A9 Max 2026 komoly kihívóként lépett színre...

MA 15:56

A League of Legends nemet mond a kollab skinek dömpingjére

🔴 Ritka az a népszerű online játék, amely még ellenáll a marketing- és együttműködési őrületnek...

MA 15:45

Az MMO-knak nem kell 200 óra egyedi tartalommal indulniuk

Az új MMO-k fejlesztése manapság igazi kihívás, hiszen a piacot évtizedes múlttal rendelkező játékok uralják...

MA 15:34

A StablR befagyasztotta az USDR-t és EURR-t 13,5 milliós támadás után

A StablR, egy máltai stabilcoin-kibocsátó felfüggesztette két fő tokenje, a USDR és az EURR minden műveletét, miután jelentős kibertámadás érte...

MA 15:23

A bitcoin újra gyengélkedik, az MI-tokenek szárnyalnak

Az utóbbi két hétben jelentős lejtmenet jellemezte a legnagyobb kriptopénzek piacát, miközben a hagyományos tőzsdeindexek, mint az S&P 500 és a Nasdaq 100, stabilan emelkedtek...

MA 15:12

A Bitcoin sorsa kritikus támasz és opciós csata szorításában

📈 A Bitcoin árfolyama napok óta szűk sávban mozog, méghozzá nem véletlenül...

MA 15:01

A GTA 6-nak ma kellett volna jönnie: egy szuperfan sorba áll

Ami kezdetben ártalmatlannak tűnt, mostanra a rajongók szemében valódi csalódássá vált: május 26...

MA 14:34

Az MI nem hoz munkahely-apokalipszist? Altman örül, ha téved

🙂 Felmerül a kérdés, hogy mennyire kell tartanunk a munkahelyek elvesztésétől a mesterséges intelligencia (MI) térnyerése miatt...

MA 14:23

Egy új szemvizsgálat tű nélkül jelzi a vérszegénységet

👀 A vérszegénység kiszűrését eddig csak vérvétellel tudták megoldani, most azonban egy hihetetlenül innovatív eljárás kerülhet reflektorfénybe...

MA 14:02

A 2500 éves egyiptomi gyöngyfátyol, amely Ozirisszá változtatja a halottat

Több ezer apró, színes gyöngyből készült halotti lepel került elő Luxorban, amely mintegy 2500 évvel ezelőtt szolgált a halottak túlvilágra való átvezetésének szimbólumaként...

MA 13:56

Az ergonómia bajnoka: Sihoo Doro C300 Pro V2 teszt

Felmerül a kérdés, hogy mennyit számít egy jó irodai szék a mindennapi munkában...

MA 13:45

Az óriási szuperszámítógépes szimulációk feltárták a kozmosz mágneses titkát

💫 Fontos kérdés, hogy miért találhatók rendezett, óriási mágneses terek az univerzum minden szegletében – a bolygóktól a csillagokon át egészen a galaxisokig...

MA 13:23

A Hyperliquid makrogazdasági fogadásokkal támadja a Polymarketet

A Hyperliquid elhozta a való élet eseményeire épülő jóslatokat a decentralizált tőzsdék világába...

MA 13:12

Mikor érkezik végre a Riválisok 2. évad 5. része Hulu-ra és Disney+-ra?

😱 A Riválisok (Rivals) pimasz második évadából a jelenlegi adagban már csak két epizód van hátra, és az előző részben minden eddiginél többet láthattunk – szó szerint is...

MA 12:44

A szaúdi NEOM 2030 utánra halasztja a The Line építését

🚧 Különösen igaz ez, ha grandiózus, sci-fibe illő tervekről van szó: Szaúd-Arábia leállította A Vonal (The Line) projekt további munkálatait legalább 2030-ig...

MA 11:55

A stabilcoinok értéke már 95 ország devizatartalékát is veri

A stabilcoinok piaci értéke mára elérte a 322 milliárd dollárt (kb...

MA 11:35

Egy ritka genetikai betegség átírja, mit gondolunk az agy félelemközpontjáról

💪 Különösen akkor, ha egy ritka genetikai eltérés világít rá, hogy amit az agytudomány évtizedek óta biztosnak hitt, az lehet, hogy alapjaiban nem igaz...

MA 11:12

Az Apple új Star Cityje teljesen más, mint Az egész emberiségért

Érdekes felvetés, hogy egy alkotógárda akár két teljesen eltérő sci-fi sorozatot is le tud tenni az asztalra, miközben a témájuk első pillantásra nagyon hasonlónak tűnik...

MA 11:01

Az XRP 1,35 alá esik: 1,30-nál dőlhet el minden

Erre példa, amikor egy kriptovaluta hetekig alig mozdul, majd hirtelen elindul a lejtőn: az XRP árfolyama már harmadszor pattant le a fontos 1,36 dolláros ellenállásról, így a bikák lendülete megtört, és a jegyzés most az 1,35 dolláros szint alá süllyedt...

MA 10:55

Az MI-adósságok csendben átrajzolják a vállalati kockázati térképet

Egy lényeges szempont, hogy az elmúlt húsz évben a technikai adósság leginkább elavult rendszereket, zűrzavaros programkódot és elhanyagolt dokumentációt jelentett...

MA 10:46

A Mars parittyaként hajítja a NASA Psyche-t a rejtélyes fémvilág felé

Ebből következően érdemes megérteni, hogy a NASA Psyche űrszondája meghatározó mérföldkőhöz ért: sikeresen kihasználta a Mars gravitációját, hogy lendületet kapjon és megfelelő irányba álljon a kisbolygóövben keringő titokzatos, fémben gazdag Psyche aszteroida felé...

MA 10:37

Váratlanul meghalt Nathan Allman, az Ondo Finance alapítója

Egy egész iparág meglepő hírre ébredt: Nathan Allman, az Ondo Finance alapítója és vezérigazgatója váratlanul elhunyt...

MA 10:28

A Jupiteren túl rejtélyes gyűrűben bolygógyárra bukkantak a tudósok

4,6 milliárd éve a Napot masszív gáz- és porlemez vette körül, amelyből először apró porszemek születtek, majd ezekből bonyolult ütközések és összetapadások révén kialakultak a bolygókezdemények...

MA 10:19

A Derelict Star, az űrplatformer, amely Jonathan Blow-nál is kiverte a biztosítékot

🚀 Az indie platformerek piacán időnként felbukkan egy-egy olyan játék, amely képes megosztani még a műfaj legnagyobb rajongóit is...

MA 10:01

A bab és a szója akár 30%-kal mérsékelheti a magas vérnyomás kockázatát

Egy lényeges szempont, hogy az étkezési szokásaink drasztikusan befolyásolják a magas vérnyomás kialakulásának kockázatát...