2025. 03. 30., 15:37

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve
Jensen Huang, az Nvidia vezérigazgatója már régóta hangoztatja, hogy a Moore-törvény halott. A legutóbbi GTC-konferencián tartott bemutatón azonban kiderült, hogy ez a számítástechnikai törvényszerűség nemcsak halott, hanem mélyen el is van már temetve. Huang nemcsak a cég következő generációs processzorait mutatta be, hanem meglepően részletes információkat osztott meg a következő két generációs számítási platformról is, például egy 600 kW-os rack-rendszerről. Azt is megtudtuk, hogy a 2028-ban érkező GPU-családot Richard Feynmanról nevezik majd el. Szokatlan, hogy a csipgyártók ilyen részletesen felfedik jövőbeli terveiket. Ennek oka egyszerű: az Nvidia akadályokba ütközött, méghozzá nem is egybe, hanem többbe. A legrosszabb pedig az, hogy ezeknek a problémáknak a megoldása – a pénzpumpáláson kívül – nagyrészt kívül esik az Nvidia hatáskörén.

Innentől csak felfelé és kifelé

Az első és legnyilvánvalóbb kihívás a számítási kapacitás skálázásával kapcsolatos. A gyártási folyamatok fejlődése az utóbbi években lelassult. Bár még mindig vannak lehetőségek a fejlesztésre, ezek egyre nehezebbé és költségesebbé válnak.

E korlátokkal szembesülve az Nvidia stratégiája egyszerű: maximalizálni a szilícium mennyiségét minden számítási csomópontban. Jelenleg az Nvidia legsűrűbb rendszerei 72 GPU-t kapcsolnak össze egyetlen számítási tartományban a nagy sebességű, 1,8 TB/s NVLink szövet segítségével. A GTC-n az Nvidia bejelentette, hogy ezt a számot előbb 144-re, majd végül 576 GPU-ra kívánja növelni rackenként. A méretezés azonban nemcsak a rackekben történik, hanem a csipek csomagolásán belül is.

Ez már a Nvidia Blackwell-gyorsítóinak tavalyi bemutatásakor is nyilvánvalóvá vált. A csipek ötszörös teljesítménynövekedést ígértek a Hopperhez képest, ami impozánsan hangzott, egészen addig, amíg ki nem derült, hogy ehhez kétszer annyi die-ra, egy új, 4 bites adattípusra és 500 wattal több energiára volt szükség.

2027-re 600 kW-os rackek érkeznek

Még nem tudjuk, milyen gyártási technológiát tervez az Nvidia a következő generációs csipjeihez, de annyi biztos, hogy a Rubin Ultra folytatja a felskálázás trendjét. Még a TSMC 2 nm-es technológiájától várt körülbelül 20 százalékos hatékonyságnövekedés mellett is ez egy rendkívül forró csipcsomag lesz.

Nemcsak a számítási kapacitás növekszik, hanem a memória is. A Rubinról a Rubin Ultrára való átálláskor jelentős ugrás várható a kapacitásban és a sávszélességben is – 288 GB-ról 1 TB-ra. Ennek körülbelül fele a gyorsabb, nagyobb kapacitású memóriamoduloknak köszönhető, míg a másik fele a memóriára szánt szilícium mennyiségének megduplázódásából ered – a Blackwell és Rubin nyolc moduljáról a Rubin Ultra tizenhat moduljára.

A megnövelt kapacitás lehetővé teszi, hogy az Nvidia több modellparamétert tömörítsen egyetlen csomagba, FP4 formátumban körülbelül 2 billiót, vagy “GPU-nként” 500 milliárdot. A HBM4e memória várhatóan megduplázza a sávszélességet a HBM3e-hez képest. Így a jelenlegi Blackwell  körülbelül 4 TB/s sávszélessége várhatóan 8 TB/s-ra ugrik a Rubin Ultra esetében.

A gigawatt per rack elfogadható felső korlátnak tűnik

A gyártási folyamatok fejlődése nem az egyetlen módja a számítási kapacitás vagy a memória skálázásának. A 16 bitről 8 bitre való áttérés például gyakorlatilag megduplázza a teljesítményt, miközben felére csökkenti egy adott modell memóriaigényét. A probléma azonban az, hogy a Nvidia lassan kifogy a csökkenthető bitszámokból. A Hopperről a Blackwellre történő váltás során négy bitet vettek el, megduplázták a szilícium mennyiségét, és ötszörös lebegőpontos teljesítménynövekedést értek el.

A négy bitnél alacsonyabb precizitás viszont már durva eredményeket produkál az LLM-következtetéseknél, jelentősen emelkedő perplexitás-pontszámokkal. Ugyanakkor érdekes kutatások zajlanak a szuper alacsony precizitású kvantálás terén, akár 1,58 bitig, miközben megőrzik a pontosságot.

Mindenesetre az Nvidia stratégiája egyértelmű: a számítási platformok egyre nagyobbak, sűrűbbek, forróbbak és energiaéhesebbek lesznek a jövőben. Ahogyan Huang fogalmazott a múlt heti sajtótájékoztatón, a limit itt az, hogy mennyi energiát tudsz beletáplálni egy rackbe.

“Egy adatközpont jelenleg 250 megawatt. Ez valamiféle korlát rackenként. A többi csak részletkérdés” – mondta Huang. “Azt mondanám, hogy a gigawatt per rack jó határnak tűnik.”


Az energiaproblémát nem lehet megkerülni

Természetesen a 600 kW-os rackek hatalmas fejfájást okoznak az adatközpont-üzemeltetőknek. Az ultra-sűrű számítási kapacitás hűtése, amely már megawattokban mérhető, nem új kihívás. Ami megváltozott, az az, hogy itt most nem néhány apró klaszterről beszélünk évente, hanem tucatnyiról, amelyek közül néhány elég erős ahhoz, hogy letaszítsa a világ legerősebb szuperszámítógépeit a trónról.

Ezeknél a méretekben a nagyon specializált, kis volumenű hőkezelési és energiaellátási rendszerek egyszerűen nem elégségesek. Sajnos az adatközpont-forgalmazók – akik azokat a nem éppen izgalmas alkatrészeket árulják, amelyek nélkül a több millió dolláros NVL72 rackek nem működnének – csak most kezdik magukat utolérni az igények terén.

Ez lehet az oka annak, hogy a bejelentett Blackwell-telepítések többségét a léghűtéses HGX B200-ra tervezték, nem az NVL72-re, amelyet Huang kitartóan reklámoz. Az HGX rendszerek – nyolc GPU-val – sok meglévő H100 környezetben telepíthetők.

Az NVL72 egy teljes rackméretű kialakítás, amelyet jelentősen a hiperskálázók ihlettek, DC-buszokkal, tápegység-szánokkal és elöl kivezetett hálózattal. 120 kW folyadékhűtéses számítási teljesítményével több ilyen telepítése egy meglévő létesítményben gyorsan problematikussá válik. És ahogy megjósolható, ez még nehezebbé válik, amikor az Nvidia 600 kW-os “szörnyrackjei” 2027 végén debütálnak.

A vezetőt követni kell

Fontos tisztázni, hogy ezek az akadályok nemcsak az Nvidiára vonatkoznak. Az AMD, az Intel és minden más felhőszolgáltató vagy csiptervező, amely az Nvidia piaci részesedéséből szeretne kihasítani egy szeletet, hamarosan ugyanezekkel a problémákkal találja szemben magát.

Ennek a kihívásnak azonban előnyei is vannak. Az Nvidia egyedülálló helyzetben van ahhoz, hogy meghatározza a jövőbeli adatközpontok energia- és hőtechnikai szabványait.

Ahogy Huang korábban is elmondta, hajlandó volt felfedni a következő három GPU-generációt, sőt utalni a negyedikre is, hogy infrastruktúrális partnereik megfelelően felkészülhessenek.

“Azért ismertettem a világgal az Nvidia következő három-négy éves útitervét, hogy mostantól mindenki más is ennek megfelelően tervezhessen” – mondta Huang.

Másrészt ezek az erőfeszítések egyengetik az utat a konkurens csipgyártók számára is. Ha az Nvidia megtervez egy 120 kW-os vagy most már 600 kW-os rack-et, és a kolokációs szolgáltatók, valamint a felhőüzemeltetők hajlandóak támogatni azt, akkor az AMD vagy az Intel is nyugodtan beépítheti ugyanezt a teljesítményszintet a saját rackjeikbe anélkül, hogy aggódnának, hol állítják majd üzembe azokat a megrendelők.

2025, adminboss, go.theregister.com alapján

  • Mit gondolsz az Nvidia jövőbeli terveiről?
  • Hogyan látod a technológiai fejlődés hatásait a környezetre?
  • Mennyire tartod fenntarthatónak az egyre nagyobb energiaigényű rendszereket?
  • Mit tennél a helyükben a versenytársak?
  • Mennyire fontos a nyílt kommunikáció a technológiai iparban?
  • Hogyan befolyásolhatja a társadalmat az ilyen mértékű számítási kapacitás?


Legfrissebb posztok

MA 15:56

Valóban felforrósítják a környéket az MI-adatközpontok?

Egy új tanulmány szerint az MI-adatközpontok jelentősen emelhetik a környező területek hőmérsékletét...

MA 15:46

A MI-alapú Softr segítségével bárki készíthet üzleti appot kódolás nélkül

💻 A berlini székhelyű Softr új szintre emeli a céges alkalmazásépítést: a platformon mostantól bárki – programozói tudás nélkül – üzleti alkalmazásokat készíthet egyszerű szöveges utasításokkal...

MA 15:34

Az első kvantumszámítógép 10 ezer qubittel lenullázhatja a kriptotárcádat

⚡ Az utóbbi években egyre többen figyelik aggodalommal, mikor éri el a kvantumszámítógépek teljesítménye azt a szintet, amikor már képesek lesznek feltörni a jelenleg legelterjedtebb titkosításokat...

MA 15:23

AT&T: Már egy előfizetésben a mobil és az otthoni internet

Az AT&T most összecsomagolt mindent, amire tényleg vágytunk: egy előfizetéssel élvezheted a mobilhálózatot és az otthoni szupergyors internetet egyszerre...

MA 15:12

Kibertámadás ütötte ki a holland államkincstár portálját

🔒 A holland pénzügyminisztérium két hete észlelt kibertámadás után kénytelen volt több rendszerét, köztük az államkincstár digitális portálját is ideiglenesen leállítani...

MA 15:02

Megtorpant az amerikai tévébirodalom: bíró megállította a Nexstar–TEGNA-fúziót

Egy mindent felforgató amerikai tévéfelvásárlás a vártnál jóval nagyobb viharokat kavart: egy kaliforniai bíróság váratlanul megtiltotta a Nexstar Media Group és a TEGNA összeolvadását...

MA 14:57

A Google végre engedi, hogy lecseréld a ciki régi Gmail nevedet – mutatjuk, hogyan!

😊 Sokan évtizedekkel ezelőtt választottak olyan e-mail-címet, ami akkor viccesnek tűnt, most viszont már inkább kínos...

MA 14:35

A kvantumkockázat a legrosszabbkor tér vissza a Bitcoinra, de egy token szárnyal

💸 Hiába múltak el a makrogazdasági feszültségek a közel-keleti konfliktus kapcsán, most újabb egzisztenciális fenyegetés rémíti a kriptopiacot: a kvantumszámítógépek gyorsabb fejlődése...

MA 14:23

Vádat emeltek az 53 millió dollárt zsákmányoló Uranium-hacker ellen

💸 Hihetetlen, de mégis igaz, hogy egy marylandi férfi 53 millió dollárt (kb...

MA 14:01

Új RoadK1ll WebSocket implantátum: a támadók ezzel terjeszkednek a feltört hálózatokon

🛡 Egyre kifinomultabb módszerek jelennek meg a digitális fenyegetések terén, amelyek a támadóknak szinte észrevétlenül biztosítanak hozzáférést belső rendszerekhez...

MA 13:45

Az online és MI-jövőt diktáló nagy márkák

Ma már egyáltalán nem szokatlan, hogy egymástól látszólag távoli cégek, mint a ScottsMiracle-Gro és a Clinique, hasonló stratégiával szólítják meg a vásárlókat...

MA 13:34

Megszabadulnál a Google Workspace-től? A Proton most indított egy teljesen titkosított alternatívát.

🔒 Tipikus, hogy a nagy techcégek szolgáltatásai kényelmesnek tűnnek, de mögülük hiányzik a valódi adatvédelem...

MA 13:23

TSMC: 2028-ig teltház, még a fel sem épült arizonai gyár is előre lefoglalva

Érdemes megvizsgálni, hogy a világ legnagyobb chipgyára, a tajvani TSMC kapacitása már 2028-ig teljesen le van kötve...

MA 11:46

Most izzik igazán az indiai adatközpontpiac

🔥 India vezető mobilszolgáltatója, a Bharti Airtel friss tőkét vont be adatközpontokat üzemeltető leányvállalatába, a Nxtra Data-ba...

MA 11:34

Az FCC rábólint a régi vonalak villámgyors kivezetésére

⚡ Az Egyesült Államok távközlési hatósága, az FCC új szabályokat vezet be, amelyek célja, hogy gyorsabban válthassanak a szolgáltatók korszerű, nagy sebességű hálózatokra...

MA 11:11

A Windows 11 appforradalma: a Microsoft végre a natív élményre fókuszál

A Microsoft most komolyan belevágott abba, hogy a Windows 11-re szánt új alkalmazásokat száz százalékban natívan fejlessze, vagyis tényleg a rendszerhez igazodva építse meg őket, nem pedig webes keretben futtassa...

MA 10:50

Az emberiség visszatér a Holdra: hamarosan startol az Artemis II

A NASA új fejezetet ír az űrkutatásban, hiszen hónapok előkészítő munkája után most végre elindult a visszaszámlálás a történelmi Artemis II Hold-misszióhoz...

MA 10:43

A látszólag ártalmatlan laborkesztyű a mikroműanyag-vadászok réme

A laborélet egy újabb csavart kap: kiderült, hogy még a legprofibb kutatók is rendre beleszaladnak egy bosszantó hibába, amikor a környezetből vett mintáikban mikroműanyagokra vadásznak...

MA 10:36

Az Eidos Montréalnál brutális leépítés: 124 embert elküldenek, a főnök is

🙁 Jó, jó, persze, csak épp közben újabb baljós hullám söpör végig a gamer világon: az Eidos Montréal 124 dolgozójától válik meg, még a főnök, David Anfossi is állás nélkül marad...

MA 10:32

Az olcsó fejhallgatók titkos ászai: prémium hang fillérekért

Sokan még ma is azt gondolják, hogy a jó fejhallgató bizony mélyen a pénztárcába nyúl, pedig az utóbbi években igencsak felzárkóztak a pénztárcabarát darabok...

MA 10:22

Az OkCupid titokban hárommillió felhasználói szelfit adott a Clarifainak

Na most kapaszkodj, mert az OkCupidnál a 2014-es év kicsit másképp zajlott, mint gondolnád!..

MA 10:10

Az olcsó MacBook visszatér: iPhone-chipre épül az új Neó

Az Apple legújabb belépő szintű laptopja, a MacBook Neo komoly meglepetést hoz a piacon: iPhone-ból átemelt A18 Pro chip dolgozik benne, miközben az élmény sokkal többet nyújt az alap MacBookoknál, pénztárcabarát áron...

MA 10:01

Az MI-tanácsadás sötét oldala: Tényleg rosszabb emberré tesz?

🕵 Miközben az MI egyre inkább beépül mindennapjainkba, munkahelyeinkre és online kommunikációnkba, egy új kutatás szerint jobb, ha személyes vagy érzelmi problémáinkra nem tőle várjuk a választ...

MA 09:57

A Sony nagy szünete: az MI-láz felfalja a memóriakártyákat

A Sony most parkolópályára tette a CFexpress- és SD-memóriakártyái megrendeléseinek felvételét, egy brutális NAND flash-hiány miatt...

MA 09:50

Az északi fény visszatér: látványos jelenség 15 amerikai államban

A tavaszi időszak ellenére az égbolt az utóbbi hetekben meglehetősen nyugodt maradt, csak pár szerényebb sarki fény jelent meg...

MA 09:36

Az Android már előre szól, hol van baj: itt az új segélyriasztás

🚨 Mostantól az Android rendszerszintű segélyriasztásai szintet lépnek: az új Google Play-szolgáltatások frissítésének (v26...

MA 09:29

Az MI a szövetségesed: így használd, hogy ne maradj le

Jerome Powell, az amerikai jegybank elnöke a Harvardon tett látogatásán szókimondó véleményt fogalmazott meg a Z generációnak...

MA 09:22

Az alvás titkos kapcsolója: több izom, kevesebb zsír, élesebb agy

😴 Felmerül a kérdés, hogy miért képes a mélyalvás annyira felpörgetni testünket és agyunkat, hogy nemcsak kipihentnek érezzük magunkat, hanem erősebbek, magasabbak, karcsúbbak, sőt akár élesebb gondolkodásúak is leszünk tőle...

MA 09:15

Az űr hőskora: Így indult útnak a két Voyager

Egy NASA-munkatárs egy kézikamerával járja be azokat a termeket, ahol a Voyager-program számítógépei teljesítettek szolgálatot 1977-ben...