2025. 03. 30., 15:37

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve
Jensen Huang, az Nvidia vezérigazgatója már régóta hangoztatja, hogy a Moore-törvény halott. A legutóbbi GTC-konferencián tartott bemutatón azonban kiderült, hogy ez a számítástechnikai törvényszerűség nemcsak halott, hanem mélyen el is van már temetve. Huang nemcsak a cég következő generációs processzorait mutatta be, hanem meglepően részletes információkat osztott meg a következő két generációs számítási platformról is, például egy 600 kW-os rack-rendszerről. Azt is megtudtuk, hogy a 2028-ban érkező GPU-családot Richard Feynmanról nevezik majd el. Szokatlan, hogy a csipgyártók ilyen részletesen felfedik jövőbeli terveiket. Ennek oka egyszerű: az Nvidia akadályokba ütközött, méghozzá nem is egybe, hanem többbe. A legrosszabb pedig az, hogy ezeknek a problémáknak a megoldása – a pénzpumpáláson kívül – nagyrészt kívül esik az Nvidia hatáskörén.

Innentől csak felfelé és kifelé

Az első és legnyilvánvalóbb kihívás a számítási kapacitás skálázásával kapcsolatos. A gyártási folyamatok fejlődése az utóbbi években lelassult. Bár még mindig vannak lehetőségek a fejlesztésre, ezek egyre nehezebbé és költségesebbé válnak.

E korlátokkal szembesülve az Nvidia stratégiája egyszerű: maximalizálni a szilícium mennyiségét minden számítási csomópontban. Jelenleg az Nvidia legsűrűbb rendszerei 72 GPU-t kapcsolnak össze egyetlen számítási tartományban a nagy sebességű, 1,8 TB/s NVLink szövet segítségével. A GTC-n az Nvidia bejelentette, hogy ezt a számot előbb 144-re, majd végül 576 GPU-ra kívánja növelni rackenként. A méretezés azonban nemcsak a rackekben történik, hanem a csipek csomagolásán belül is.

Ez már a Nvidia Blackwell-gyorsítóinak tavalyi bemutatásakor is nyilvánvalóvá vált. A csipek ötszörös teljesítménynövekedést ígértek a Hopperhez képest, ami impozánsan hangzott, egészen addig, amíg ki nem derült, hogy ehhez kétszer annyi die-ra, egy új, 4 bites adattípusra és 500 wattal több energiára volt szükség.

2027-re 600 kW-os rackek érkeznek

Még nem tudjuk, milyen gyártási technológiát tervez az Nvidia a következő generációs csipjeihez, de annyi biztos, hogy a Rubin Ultra folytatja a felskálázás trendjét. Még a TSMC 2 nm-es technológiájától várt körülbelül 20 százalékos hatékonyságnövekedés mellett is ez egy rendkívül forró csipcsomag lesz.

Nemcsak a számítási kapacitás növekszik, hanem a memória is. A Rubinról a Rubin Ultrára való átálláskor jelentős ugrás várható a kapacitásban és a sávszélességben is – 288 GB-ról 1 TB-ra. Ennek körülbelül fele a gyorsabb, nagyobb kapacitású memóriamoduloknak köszönhető, míg a másik fele a memóriára szánt szilícium mennyiségének megduplázódásából ered – a Blackwell és Rubin nyolc moduljáról a Rubin Ultra tizenhat moduljára.

A megnövelt kapacitás lehetővé teszi, hogy az Nvidia több modellparamétert tömörítsen egyetlen csomagba, FP4 formátumban körülbelül 2 billiót, vagy “GPU-nként” 500 milliárdot. A HBM4e memória várhatóan megduplázza a sávszélességet a HBM3e-hez képest. Így a jelenlegi Blackwell  körülbelül 4 TB/s sávszélessége várhatóan 8 TB/s-ra ugrik a Rubin Ultra esetében.

A gigawatt per rack elfogadható felső korlátnak tűnik

A gyártási folyamatok fejlődése nem az egyetlen módja a számítási kapacitás vagy a memória skálázásának. A 16 bitről 8 bitre való áttérés például gyakorlatilag megduplázza a teljesítményt, miközben felére csökkenti egy adott modell memóriaigényét. A probléma azonban az, hogy a Nvidia lassan kifogy a csökkenthető bitszámokból. A Hopperről a Blackwellre történő váltás során négy bitet vettek el, megduplázták a szilícium mennyiségét, és ötszörös lebegőpontos teljesítménynövekedést értek el.

A négy bitnél alacsonyabb precizitás viszont már durva eredményeket produkál az LLM-következtetéseknél, jelentősen emelkedő perplexitás-pontszámokkal. Ugyanakkor érdekes kutatások zajlanak a szuper alacsony precizitású kvantálás terén, akár 1,58 bitig, miközben megőrzik a pontosságot.

Mindenesetre az Nvidia stratégiája egyértelmű: a számítási platformok egyre nagyobbak, sűrűbbek, forróbbak és energiaéhesebbek lesznek a jövőben. Ahogyan Huang fogalmazott a múlt heti sajtótájékoztatón, a limit itt az, hogy mennyi energiát tudsz beletáplálni egy rackbe.

“Egy adatközpont jelenleg 250 megawatt. Ez valamiféle korlát rackenként. A többi csak részletkérdés” – mondta Huang. “Azt mondanám, hogy a gigawatt per rack jó határnak tűnik.”


Az energiaproblémát nem lehet megkerülni

Természetesen a 600 kW-os rackek hatalmas fejfájást okoznak az adatközpont-üzemeltetőknek. Az ultra-sűrű számítási kapacitás hűtése, amely már megawattokban mérhető, nem új kihívás. Ami megváltozott, az az, hogy itt most nem néhány apró klaszterről beszélünk évente, hanem tucatnyiról, amelyek közül néhány elég erős ahhoz, hogy letaszítsa a világ legerősebb szuperszámítógépeit a trónról.

Ezeknél a méretekben a nagyon specializált, kis volumenű hőkezelési és energiaellátási rendszerek egyszerűen nem elégségesek. Sajnos az adatközpont-forgalmazók – akik azokat a nem éppen izgalmas alkatrészeket árulják, amelyek nélkül a több millió dolláros NVL72 rackek nem működnének – csak most kezdik magukat utolérni az igények terén.

Ez lehet az oka annak, hogy a bejelentett Blackwell-telepítések többségét a léghűtéses HGX B200-ra tervezték, nem az NVL72-re, amelyet Huang kitartóan reklámoz. Az HGX rendszerek – nyolc GPU-val – sok meglévő H100 környezetben telepíthetők.

Az NVL72 egy teljes rackméretű kialakítás, amelyet jelentősen a hiperskálázók ihlettek, DC-buszokkal, tápegység-szánokkal és elöl kivezetett hálózattal. 120 kW folyadékhűtéses számítási teljesítményével több ilyen telepítése egy meglévő létesítményben gyorsan problematikussá válik. És ahogy megjósolható, ez még nehezebbé válik, amikor az Nvidia 600 kW-os “szörnyrackjei” 2027 végén debütálnak.

A vezetőt követni kell

Fontos tisztázni, hogy ezek az akadályok nemcsak az Nvidiára vonatkoznak. Az AMD, az Intel és minden más felhőszolgáltató vagy csiptervező, amely az Nvidia piaci részesedéséből szeretne kihasítani egy szeletet, hamarosan ugyanezekkel a problémákkal találja szemben magát.

Ennek a kihívásnak azonban előnyei is vannak. Az Nvidia egyedülálló helyzetben van ahhoz, hogy meghatározza a jövőbeli adatközpontok energia- és hőtechnikai szabványait.

Ahogy Huang korábban is elmondta, hajlandó volt felfedni a következő három GPU-generációt, sőt utalni a negyedikre is, hogy infrastruktúrális partnereik megfelelően felkészülhessenek.

“Azért ismertettem a világgal az Nvidia következő három-négy éves útitervét, hogy mostantól mindenki más is ennek megfelelően tervezhessen” – mondta Huang.

Másrészt ezek az erőfeszítések egyengetik az utat a konkurens csipgyártók számára is. Ha az Nvidia megtervez egy 120 kW-os vagy most már 600 kW-os rack-et, és a kolokációs szolgáltatók, valamint a felhőüzemeltetők hajlandóak támogatni azt, akkor az AMD vagy az Intel is nyugodtan beépítheti ugyanezt a teljesítményszintet a saját rackjeikbe anélkül, hogy aggódnának, hol állítják majd üzembe azokat a megrendelők.

2025, adminboss, go.theregister.com alapján

  • Mit gondolsz az Nvidia jövőbeli terveiről?
  • Hogyan látod a technológiai fejlődés hatásait a környezetre?
  • Mennyire tartod fenntarthatónak az egyre nagyobb energiaigényű rendszereket?
  • Mit tennél a helyükben a versenytársak?
  • Mennyire fontos a nyílt kommunikáció a technológiai iparban?
  • Hogyan befolyásolhatja a társadalmat az ilyen mértékű számítási kapacitás?


Legfrissebb posztok

MA 20:38

Az OpenAI-t belülről marcangolja a ChatGPT-hajsza

💥 Ebből következően érdemes megérteni, hogy az OpenAI stratégiai váltása nemcsak a cég működésére, hanem az egész MI-ágazatra komoly hatással lehet...

MA 20:20

A süllyesztett, automata kilincseknek Kína végleg búcsút int

Kína 2027-től betiltja az automatikus, süllyesztett ajtókilincseket az új autóknál, 2029-től pedig a már forgalomban lévő modelleknél is kötelező az átalakítás...

MA 20:01

Az MI-fejlesztők kávészünetelnek? Leállt a Claude Code

A Claude Code, az Anthropic népszerű MI-fejlesztői eszköze ma jelentős leállást szenvedett el, több ezer programozó életét borítva fel...

MA 19:55

A mesterséges intelligencia sorra buktatja a csalókat Dél-Koreában

🔎 Dél-Korea kormánya és fő értéktőzsdéje, a Korea Exchange új MI-alapú eszközöket vet be, hogy kiszűrje azokat a manipulációs trükköket, amelyek során befektetők először felvásárolnak részvényeket vagy kriptovalutákat, majd hamis híreket terjesztve próbálják felpörgetni az árakat...

MA 19:37

Az év nagy ugrása: szárnyal a Kraken anyavállalata

A Kraken kriptotőzsde mögött álló Payward elképesztő évet zárt: bevételei 33%-kal, 818 milliárd forintra emelkedtek, miközben a teljes tranzakciós volumen elérte a 2 billió dollárt (kb...

MA 19:20

A PayPal élére HP-s nagyágyú érkezik

💵 Meglepetést hozott a PayPal bejelentése: Enrique Lores, a HP korábbi vezérigazgatója lesz a vállalat új vezérigazgatója és elnöke...

MA 19:02

A pók ihlette forradalom: megszületett az elsüllyeszthetetlen fém

🕷 Első pillantásra úgy tűnt, hogy a süllyedő fém örök törvény: egy pénzérme elmerül a vízben, mindenki tudja, hogy a fém nehezebb, mint a víz...

MA 18:55

A sikeres MI-bevezetés kulcsa: a profi termékmenedzsment

A generatív MI valódi értékét csak akkor lehet kiaknázni a munkahelyen, ha a csapat tagjai elsajátítják a termékmenedzsment alapjait...

MA 18:19

Az Adobe leállítja az Animate-et, felháborodtak az animátorok és fejlesztők

Az Adobe váratlanul bejelentette, hogy megszünteti az Adobe Animate programot, és erről e-mailben értesítette a felhasználókat...

MA 18:02

A francia rendőrség razziázott az X irodájában a Grok deepfake-botrány miatt

A francia hatóságok kedden razziát tartottak az X párizsi irodájában, miután büntetőeljárás indult a platform Grok nevű MI-eszköze miatt, amelyet széles körben használtak szexuálisan explicit képek generálására...

MA 17:56

Az alumínium visszatér: csúszós Google-forradalom a laptopokon?

Hosszú évek várakozása után végre eljuthatunk oda, hogy a Google egyesíti az Androidot és a ChromeOS-t egyetlen operációs rendszerben...

MA 17:38

A Waymo robban: önvezető taxik 20 új városban

🚗 A Google anyacégéhez, az Alphabethez tartozó Waymo komolyan veszi a Tesla egyre erősebb kihívását, és hatalmas bővülésre készül...

MA 17:19

Az Artemis II főpróbája szivárgás miatt hiúsult meg

A NASA leállította az Artemis II rakéta hidrogénnel való feltöltését, miután feltételezett szivárgást észleltek az üzemanyagrendszerben...

MA 17:04

Az új hűtő tényleg megéri – ennyit spórolsz a villanyszámlán

Az otthoni nagy háztartási gépek közül a hűtőszekrény az, amely folyamatosan fogyasztja az áramot – ezért nem árt időnként elgondolkodni a cseréjén...

MA 16:56

Az új Windows 11-frissítés felforgatja a mindennapokat

💻 A februári Windows 11-frissítés már a küszöbön áll, és nemcsak apró változásokkal, hanem néhány igazán izgalmas újítással érkezik...

MA 16:38

Az olcsó fém lehet a klímaválság kulcsa?

⚡ A Yale Egyetem és a Missouri Egyetem kutatói jelentős áttörést értek el a tiszta energiaforrások kutatásában: sikerült egy olcsó, könnyen hozzáférhető fém, a mangán segítségével hatékonyan átalakítani a szén-dioxidot formiáttá...

MA 16:19

Az MI-láz pörgeti a tőzsdéket, a Palantir az élen

A Palantir rendkívül erős negyedéves eredményei valódi felfutást indítottak el a globális részvénypiacokon...

MA 16:01

A Nothing Phone 4a-széria küszöbön: hamarosan debütál

📱 A Nothing Phone 4a és a Nothing Phone 4a Pro várhatóan már március elején, pontosabban március 5-én mutatkoznak be, így aki új készülékre vágyik, annak már alig egy hónapot kell csak várnia...

MA 15:55

Az új BTS-korszak berobban: koncert, film és világtúra a Netflixen

🎶 A K-pop ikonikus zenekara, a BTS idén márciusban nagyszabású visszatérést tart...

MA 15:37

Az okos zárak kora leáldozott Kínában

🔒 Kína betiltja a Tesla-féle rejtett, elektronikus ajtónyitókat, miután ezek számos halálos balesethez vezettek...

MA 15:21

Az Artemis II megint csúszik: a hidrogén utat tör magának

🚀 A NASA ismét elhalasztja az Artemis II holdmisszió indítását, mert a hétfői próbán a rakéta és a floridai Kennedy Űrközpont indítóállványa között komoly hidrogénszivárgást észleltek...

MA 15:02

A Crunchyroll árat emel: drágább lesz az anime

Az anime-rajongóknak mélyebben kell a zsebükbe nyúlniuk, ugyanis emelkedtek a Crunchyroll havidíjai...

MA 14:20

A Pfizer új, havi injekciója forradalmasíthatja a fogyást

A Pfizer legújabb humán kísérlete biztató eredményeket mutat egy új, havonta adható elhízás elleni injekcióval kapcsolatban...

MA 14:02

Az új Switch csúcsra ért, történelmet ír a Nintendo

A Switch végre letaszította a DS-t a trónról, így minden idők legkelendőbb Nintendo konzolja lett: 2025...

MA 13:38

A SpaceX bekebelezte az xAI-t – MI forradalom az űrben

🚀 Elon Musk újabb meghökkentő lépése alapjaiban formálja át a technológiai világot: a SpaceX váratlanul felvásárolta a három éve alapított xAI-t, így egyesült a rakétatechnológia, az MI és az űrinternet világa...

MA 13:19

Az orosz hekkerek ismét célba vették a Microsoft Office-t

🕵 A napokban orosz hackerek, az APT28 (más néven Fancy Bear vagy Sofacy), kihasználták a Microsoft Office egy frissen javított sérülékenységét (CVE-2026-21509) célzott támadásokhoz Ukrajnában és más európai szervezetek ellen...

MA 13:02

A szíved otthoni ellenőrzésének két pofonegyszerű módja

Érdekes felvetés, hogy a szívbetegségek, amelyek ma Magyarországon is vezető haláloknak számítanak, sok esetben megelőzhetők lennének egy kis odafigyeléssel...

MA 12:55

Az MI még nem gyújtotta be a kriptó rakétáit

Az MI és a kriptopiac összefonódása rengeteg izgalmat vált ki, de egyelőre hiányzik az a világos és közérthető alkalmazás, amely valódi áttörést hozna...

MA 12:37

Az X francia irodáira is rajtaütött a rendőrség

A francia hatóságok kibervédelmi egységei, az Europol támogatásával, razziát tartottak Elon Musk közösségi platformjának, az X-nek a párizsi irodáiban...