2025. 03. 30., 15:37

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve
Jensen Huang, az Nvidia vezérigazgatója már régóta hangoztatja, hogy a Moore-törvény halott. A legutóbbi GTC-konferencián tartott bemutatón azonban kiderült, hogy ez a számítástechnikai törvényszerűség nemcsak halott, hanem mélyen el is van már temetve. Huang nemcsak a cég következő generációs processzorait mutatta be, hanem meglepően részletes információkat osztott meg a következő két generációs számítási platformról is, például egy 600 kW-os rack-rendszerről. Azt is megtudtuk, hogy a 2028-ban érkező GPU-családot Richard Feynmanról nevezik majd el. Szokatlan, hogy a csipgyártók ilyen részletesen felfedik jövőbeli terveiket. Ennek oka egyszerű: az Nvidia akadályokba ütközött, méghozzá nem is egybe, hanem többbe. A legrosszabb pedig az, hogy ezeknek a problémáknak a megoldása – a pénzpumpáláson kívül – nagyrészt kívül esik az Nvidia hatáskörén.

Innentől csak felfelé és kifelé

Az első és legnyilvánvalóbb kihívás a számítási kapacitás skálázásával kapcsolatos. A gyártási folyamatok fejlődése az utóbbi években lelassult. Bár még mindig vannak lehetőségek a fejlesztésre, ezek egyre nehezebbé és költségesebbé válnak.

E korlátokkal szembesülve az Nvidia stratégiája egyszerű: maximalizálni a szilícium mennyiségét minden számítási csomópontban. Jelenleg az Nvidia legsűrűbb rendszerei 72 GPU-t kapcsolnak össze egyetlen számítási tartományban a nagy sebességű, 1,8 TB/s NVLink szövet segítségével. A GTC-n az Nvidia bejelentette, hogy ezt a számot előbb 144-re, majd végül 576 GPU-ra kívánja növelni rackenként. A méretezés azonban nemcsak a rackekben történik, hanem a csipek csomagolásán belül is.

Ez már a Nvidia Blackwell-gyorsítóinak tavalyi bemutatásakor is nyilvánvalóvá vált. A csipek ötszörös teljesítménynövekedést ígértek a Hopperhez képest, ami impozánsan hangzott, egészen addig, amíg ki nem derült, hogy ehhez kétszer annyi die-ra, egy új, 4 bites adattípusra és 500 wattal több energiára volt szükség.

2027-re 600 kW-os rackek érkeznek

Még nem tudjuk, milyen gyártási technológiát tervez az Nvidia a következő generációs csipjeihez, de annyi biztos, hogy a Rubin Ultra folytatja a felskálázás trendjét. Még a TSMC 2 nm-es technológiájától várt körülbelül 20 százalékos hatékonyságnövekedés mellett is ez egy rendkívül forró csipcsomag lesz.

Nemcsak a számítási kapacitás növekszik, hanem a memória is. A Rubinról a Rubin Ultrára való átálláskor jelentős ugrás várható a kapacitásban és a sávszélességben is – 288 GB-ról 1 TB-ra. Ennek körülbelül fele a gyorsabb, nagyobb kapacitású memóriamoduloknak köszönhető, míg a másik fele a memóriára szánt szilícium mennyiségének megduplázódásából ered – a Blackwell és Rubin nyolc moduljáról a Rubin Ultra tizenhat moduljára.

A megnövelt kapacitás lehetővé teszi, hogy az Nvidia több modellparamétert tömörítsen egyetlen csomagba, FP4 formátumban körülbelül 2 billiót, vagy “GPU-nként” 500 milliárdot. A HBM4e memória várhatóan megduplázza a sávszélességet a HBM3e-hez képest. Így a jelenlegi Blackwell  körülbelül 4 TB/s sávszélessége várhatóan 8 TB/s-ra ugrik a Rubin Ultra esetében.

A gigawatt per rack elfogadható felső korlátnak tűnik

A gyártási folyamatok fejlődése nem az egyetlen módja a számítási kapacitás vagy a memória skálázásának. A 16 bitről 8 bitre való áttérés például gyakorlatilag megduplázza a teljesítményt, miközben felére csökkenti egy adott modell memóriaigényét. A probléma azonban az, hogy a Nvidia lassan kifogy a csökkenthető bitszámokból. A Hopperről a Blackwellre történő váltás során négy bitet vettek el, megduplázták a szilícium mennyiségét, és ötszörös lebegőpontos teljesítménynövekedést értek el.

A négy bitnél alacsonyabb precizitás viszont már durva eredményeket produkál az LLM-következtetéseknél, jelentősen emelkedő perplexitás-pontszámokkal. Ugyanakkor érdekes kutatások zajlanak a szuper alacsony precizitású kvantálás terén, akár 1,58 bitig, miközben megőrzik a pontosságot.

Mindenesetre az Nvidia stratégiája egyértelmű: a számítási platformok egyre nagyobbak, sűrűbbek, forróbbak és energiaéhesebbek lesznek a jövőben. Ahogyan Huang fogalmazott a múlt heti sajtótájékoztatón, a limit itt az, hogy mennyi energiát tudsz beletáplálni egy rackbe.

“Egy adatközpont jelenleg 250 megawatt. Ez valamiféle korlát rackenként. A többi csak részletkérdés” – mondta Huang. “Azt mondanám, hogy a gigawatt per rack jó határnak tűnik.”


Az energiaproblémát nem lehet megkerülni

Természetesen a 600 kW-os rackek hatalmas fejfájást okoznak az adatközpont-üzemeltetőknek. Az ultra-sűrű számítási kapacitás hűtése, amely már megawattokban mérhető, nem új kihívás. Ami megváltozott, az az, hogy itt most nem néhány apró klaszterről beszélünk évente, hanem tucatnyiról, amelyek közül néhány elég erős ahhoz, hogy letaszítsa a világ legerősebb szuperszámítógépeit a trónról.

Ezeknél a méretekben a nagyon specializált, kis volumenű hőkezelési és energiaellátási rendszerek egyszerűen nem elégségesek. Sajnos az adatközpont-forgalmazók – akik azokat a nem éppen izgalmas alkatrészeket árulják, amelyek nélkül a több millió dolláros NVL72 rackek nem működnének – csak most kezdik magukat utolérni az igények terén.

Ez lehet az oka annak, hogy a bejelentett Blackwell-telepítések többségét a léghűtéses HGX B200-ra tervezték, nem az NVL72-re, amelyet Huang kitartóan reklámoz. Az HGX rendszerek – nyolc GPU-val – sok meglévő H100 környezetben telepíthetők.

Az NVL72 egy teljes rackméretű kialakítás, amelyet jelentősen a hiperskálázók ihlettek, DC-buszokkal, tápegység-szánokkal és elöl kivezetett hálózattal. 120 kW folyadékhűtéses számítási teljesítményével több ilyen telepítése egy meglévő létesítményben gyorsan problematikussá válik. És ahogy megjósolható, ez még nehezebbé válik, amikor az Nvidia 600 kW-os “szörnyrackjei” 2027 végén debütálnak.

A vezetőt követni kell

Fontos tisztázni, hogy ezek az akadályok nemcsak az Nvidiára vonatkoznak. Az AMD, az Intel és minden más felhőszolgáltató vagy csiptervező, amely az Nvidia piaci részesedéséből szeretne kihasítani egy szeletet, hamarosan ugyanezekkel a problémákkal találja szemben magát.

Ennek a kihívásnak azonban előnyei is vannak. Az Nvidia egyedülálló helyzetben van ahhoz, hogy meghatározza a jövőbeli adatközpontok energia- és hőtechnikai szabványait.

Ahogy Huang korábban is elmondta, hajlandó volt felfedni a következő három GPU-generációt, sőt utalni a negyedikre is, hogy infrastruktúrális partnereik megfelelően felkészülhessenek.

“Azért ismertettem a világgal az Nvidia következő három-négy éves útitervét, hogy mostantól mindenki más is ennek megfelelően tervezhessen” – mondta Huang.

Másrészt ezek az erőfeszítések egyengetik az utat a konkurens csipgyártók számára is. Ha az Nvidia megtervez egy 120 kW-os vagy most már 600 kW-os rack-et, és a kolokációs szolgáltatók, valamint a felhőüzemeltetők hajlandóak támogatni azt, akkor az AMD vagy az Intel is nyugodtan beépítheti ugyanezt a teljesítményszintet a saját rackjeikbe anélkül, hogy aggódnának, hol állítják majd üzembe azokat a megrendelők.

2025, adminboss, go.theregister.com alapján

  • Mit gondolsz az Nvidia jövőbeli terveiről?
  • Hogyan látod a technológiai fejlődés hatásait a környezetre?
  • Mennyire tartod fenntarthatónak az egyre nagyobb energiaigényű rendszereket?
  • Mit tennél a helyükben a versenytársak?
  • Mennyire fontos a nyílt kommunikáció a technológiai iparban?
  • Hogyan befolyásolhatja a társadalmat az ilyen mértékű számítási kapacitás?


Legfrissebb posztok

MA 06:36

Az OpenAI berobban: jön a biológiára hangolt MI

Az OpenAI bemutatta legújabb nyelvi modelljét, a GPT-Rosalindot, amelyet kifejezetten biológiai kutatásra fejlesztettek...

MA 06:29

Az Intel végre új életet lehel az alap Core processzorokba

💻 Az Intel hosszú idő után frissíti a nem-Ultra Core processzorokat, amelyekre eddig a korosodó Raptor Lake architektúrára épülő meglévő Core-szériák voltak jellemzők...

MA 06:22

Elkészült az univerzum eddigi legnagyobb, legélesebb 3D-s térképe

💫 Áttörő eredményt értek el a csillagászok: elkészült a valaha készült legnagyobb felbontású 3D-s térkép az univerzumról...

MA 06:15

A mesterséges intelligencia lehet az amerikai kriptófelügyelet megmentője?

Az amerikai Commodity Futures Trading Commission (CFTC) élén Mike Selig egyre növekvő felügyeleti feladatokkal néz szembe, miközben az ügynökség létszáma az utóbbi években jelentősen csökkent...

MA 06:09

A tokenizáció forradalma: kézzelfogható eszközök, valódi lehetőségek?

💰 Az elmúlt másfél évben a tokenizáció robbanásszerű fejlődésen ment keresztül: eddig csak koncepció volt, de ma már a portfólióépítés legitim eleme lett...

MA 06:05

Történelmi események a mai napon (Április 17.)

Kiemelkedő nap a történelemben: szerződés, lázadás, köztársaság és űrdrámából csoda. A legemlékezetesebb pillanatok között ott van a Republic of Ireland kikiáltása, a The Canterbury Tales (Canterbury mesék) első udvari előadása és az Apollo 13 biztonságos hazatérése...

MA 06:01

Az okos robotmadarak új életet lehelnek a Grand Teton madárvilágába

A Grand Teton Nemzeti Parkban elképesztő módon léptek fel a fogyatkozó fürjtyúk-populáció megmentéséért: nemcsak hagyományos madárcsali figurákat használnak, hanem rendkívül ötletes, robotizált példányokat is...

csütörtök 21:46

Az MI-ügynökök új rémálma: foltozás után is szivárognak a bizalmas adatok

🚩 A legfrissebb kutatások rávilágítanak arra, mennyire sérülékenyek maradtak a vállalati MI-ügynökök, hiába foltozták be a friss biztonsági réseket...

csütörtök 21:13

Az igazi kvantumgyerek: kilencéves csodagyerek podcastel a jövőről

Érdekes, hogy a kilencéves Kai Moskvitch hobbiból podcastet indított, amelyben azt kutatja, miként változtatja meg a mindennapjainkat a kvantumtechnológia...

csütörtök 21:02

Az Anna’s Archive 115 milliárdos kártérítést fizet a Spotifynak és kiadóknak

💸 Az Anna’s Archive nevű nyílt könyvtárat és keresőmotort 115 milliárd forint (322 millió dollár) kártérítés megfizetésére kötelezték, miután állítólag letöltötte és elmentette a Spotify teljes zenegyűjteményét...

csütörtök 20:56

Az EU tiniappja tényleg megoldja az életkor-ellenőrzést adatpara nélkül?

Közeleg az az idő, amikor az uniós tinik nemcsak szívüket, hanem életkorukat is egy appban hordozzák: az új digitális igazolványalkalmazás lehetővé teszi, hogy bárki igazolja a korhatáros tartalmakhoz való hozzáférési jogosultságát, miközben személyes adatai titokban maradnak...

csütörtök 20:45

Az Alzheimer-gyógyszerek szinte semmit sem érnek?

🤔 Fontos kérdés, hogy az utóbbi években áttörésként ünnepelt Alzheimer-kór elleni gyógyszerek mennyire képesek valóban lassítani vagy megelőzni a betegség előrehaladását...

csütörtök 20:12

A Google amerikai adatátadása botrányt kavart Svájcban

🚧 Felmerül a kérdés, mennyire bízhatunk az online óriáscégek adatkezelésében, ha azonnal teljesítik az állami szervek kéréseit...

csütörtök 20:02

Az MI már a Google Fotóidból is képeket generál

🤖 Például ha régóta vágytál rá, hogy MI-modellek a saját preferenciáid, emlékeid vagy Google Fotóid alapján alkossanak képeket, ez most valóra válhat...

csütörtök 19:46

A bolondok aranyában lítiumkincs rejtőzik

A modern világ egyik kulcsfontosságú alapanyaga, a lítium meglepő helyen bukkant fel: ősi palák és ipari hulladékok tartalmazhatják ezt az értékes fémet...

csütörtök 19:34

A Google új fegyvere: a Gemini MI levadássza a csaló hirdetéseket

A Google tavaly 8,3 milliárd rosszindulatú hirdetést állított le, és közel 25 millió hirdetői fiókot függesztett fel – köztük 602 ezret csalással összefüggésben...

csütörtök 19:23

Az MI-láz fűti a kvantumrészvények új őrületét

💸 Érdekes fejlemény, hogy a kvantumszámítógépes vállalatok részvényei szárnyalni kezdtek, amint az Nvidia bemutatta új, nyílt forráskódú MI-modelljeit, amelyek a kvantumtechnológia gyorsítását célozzák...

csütörtök 19:12

A tenger mélyén lappangó metán felpörgetheti a klímaválságot

💧 Érdemes megérteni, hogy a világ óceánjai eddig rejtett szerepet játszhattak a klímaváltozás felgyorsításában...

csütörtök 18:57

Az elsőként felfedezett fekete lyuk táncoló sugárnyalábokat lövell az űrbe

A Földtől mindössze 7000 fényévre található Cygnus X-1 az elsőként felfedezett és megerősített fekete lyuk, amely most is komoly meglepetésekkel szolgál...

csütörtök 18:46

Az MI tényleg ellustítja az agyunkat? Lesújtó új kutatás

Különösen igaz ez akkor, ha a technológia mindennapjaink részévé válik: egy friss amerikai és brit kutatás szerint már tíz perc MI-használat is elég ahhoz, hogy függőséget alakítson ki, ami a gondolkodási képességek látványos romlásához és gyors kimerüléshez vezet, ha utána hirtelen megvonják az eszközt...

csütörtök 18:35

Az MI-korszak aranyszabálya: ne találd fel magad újra, inkább mindent kapcsolj össze

🖥 Az elmúlt időszakban minden beszélgetés, fórum és előadás a munka jövőjére és arra a kérdésre összpontosított: hogyan tudunk alkalmazkodni a mesterséges intelligencia villámgyors fejlődéséhez?..

csütörtök 18:23

Az ultrahang, amely az orrod helyett az agyadnak illatozik

Négy fiatal kutató egy elképesztően izgalmas kütyüt rakott össze: úgy tudnak illatélményt előidézni, hogy közben nem kell semmiféle vegyi patronnal vacakolni...

csütörtök 17:46

A legújabb Google-botrány: tényleg biztonságban vannak az adataid?

🔒 Az amerikai hatóságok folyamatosan kérnek ki felhasználói adatokat a technológiai cégektől, és a Google sem kivétel...

csütörtök 17:34

A Pixel-mobilok játékteljesítménye drámaian visszaesett – hatalmas a lemaradás

🔥 A legutóbbi tesztek alapján egyértelműen látszik, hogy a Google Pixel mobilok hardvere jelentősen lemaradt játékos teljesítmény terén vetélytársaikhoz képest...

csütörtök 17:14

Az MI igazi kihívása: merünk-e bízni benne?

Az MI‑modellek fejlődése az utóbbi időben valósággal kirobbanó: gyakorlatilag minden héten új modell jelenik meg, mindegyik egyre hatékonyabbnak vagy sokoldalúbbnak tűnik...

csütörtök 17:04

A zaj észrevétlenül rombol – képesek vagyunk csendet teremteni?

🔇 Amikor a Covid–19 járvány megállította a világot, a városok elcsendesedtek, és hirtelen tisztábban hallhatóvá váltak a madarak énekei...

csütörtök 16:56

Az európai légi közlekedés bajban: hat hétre vagyunk a kerozinhiánytól

⚠ A Nemzetközi Energiaügynökség (IEA) figyelmeztetése szerint Európa alig hat hétre elegendő kerozinnal rendelkezik, ami drámai következményekkel járhat a kontinens gazdaságára nézve...

csütörtök 16:23

Az újabb bitcoinláz: rekordközeli mélyponton a finanszírozási díjak

💸 Az elmúlt hetekben a bitcoin árfolyama meredeken emelkedett, elérve a 27,2 millió forintot (kb...

csütörtök 16:13

Az öregedés visszafordítható? Forradalmi egérkísérletek rengetik meg a tudományt

🗓 Az öregedéssel járó károsodások egyik fő okozóját sikerült azonosítani amerikai kutatóknak: a szervezetben csendben felgyülemlő úgynevezett „zombi” immunsejteket...