2025. 03. 30., 15:37

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve
Jensen Huang, az Nvidia vezérigazgatója már régóta hangoztatja, hogy a Moore-törvény halott. A legutóbbi GTC-konferencián tartott bemutatón azonban kiderült, hogy ez a számítástechnikai törvényszerűség nemcsak halott, hanem mélyen el is van már temetve. Huang nemcsak a cég következő generációs processzorait mutatta be, hanem meglepően részletes információkat osztott meg a következő két generációs számítási platformról is, például egy 600 kW-os rack-rendszerről. Azt is megtudtuk, hogy a 2028-ban érkező GPU-családot Richard Feynmanról nevezik majd el. Szokatlan, hogy a csipgyártók ilyen részletesen felfedik jövőbeli terveiket. Ennek oka egyszerű: az Nvidia akadályokba ütközött, méghozzá nem is egybe, hanem többbe. A legrosszabb pedig az, hogy ezeknek a problémáknak a megoldása – a pénzpumpáláson kívül – nagyrészt kívül esik az Nvidia hatáskörén.

Innentől csak felfelé és kifelé

Az első és legnyilvánvalóbb kihívás a számítási kapacitás skálázásával kapcsolatos. A gyártási folyamatok fejlődése az utóbbi években lelassult. Bár még mindig vannak lehetőségek a fejlesztésre, ezek egyre nehezebbé és költségesebbé válnak.

E korlátokkal szembesülve az Nvidia stratégiája egyszerű: maximalizálni a szilícium mennyiségét minden számítási csomópontban. Jelenleg az Nvidia legsűrűbb rendszerei 72 GPU-t kapcsolnak össze egyetlen számítási tartományban a nagy sebességű, 1,8 TB/s NVLink szövet segítségével. A GTC-n az Nvidia bejelentette, hogy ezt a számot előbb 144-re, majd végül 576 GPU-ra kívánja növelni rackenként. A méretezés azonban nemcsak a rackekben történik, hanem a csipek csomagolásán belül is.

Ez már a Nvidia Blackwell-gyorsítóinak tavalyi bemutatásakor is nyilvánvalóvá vált. A csipek ötszörös teljesítménynövekedést ígértek a Hopperhez képest, ami impozánsan hangzott, egészen addig, amíg ki nem derült, hogy ehhez kétszer annyi die-ra, egy új, 4 bites adattípusra és 500 wattal több energiára volt szükség.

2027-re 600 kW-os rackek érkeznek

Még nem tudjuk, milyen gyártási technológiát tervez az Nvidia a következő generációs csipjeihez, de annyi biztos, hogy a Rubin Ultra folytatja a felskálázás trendjét. Még a TSMC 2 nm-es technológiájától várt körülbelül 20 százalékos hatékonyságnövekedés mellett is ez egy rendkívül forró csipcsomag lesz.

Nemcsak a számítási kapacitás növekszik, hanem a memória is. A Rubinról a Rubin Ultrára való átálláskor jelentős ugrás várható a kapacitásban és a sávszélességben is – 288 GB-ról 1 TB-ra. Ennek körülbelül fele a gyorsabb, nagyobb kapacitású memóriamoduloknak köszönhető, míg a másik fele a memóriára szánt szilícium mennyiségének megduplázódásából ered – a Blackwell és Rubin nyolc moduljáról a Rubin Ultra tizenhat moduljára.

A megnövelt kapacitás lehetővé teszi, hogy az Nvidia több modellparamétert tömörítsen egyetlen csomagba, FP4 formátumban körülbelül 2 billiót, vagy “GPU-nként” 500 milliárdot. A HBM4e memória várhatóan megduplázza a sávszélességet a HBM3e-hez képest. Így a jelenlegi Blackwell  körülbelül 4 TB/s sávszélessége várhatóan 8 TB/s-ra ugrik a Rubin Ultra esetében.

A gigawatt per rack elfogadható felső korlátnak tűnik

A gyártási folyamatok fejlődése nem az egyetlen módja a számítási kapacitás vagy a memória skálázásának. A 16 bitről 8 bitre való áttérés például gyakorlatilag megduplázza a teljesítményt, miközben felére csökkenti egy adott modell memóriaigényét. A probléma azonban az, hogy a Nvidia lassan kifogy a csökkenthető bitszámokból. A Hopperről a Blackwellre történő váltás során négy bitet vettek el, megduplázták a szilícium mennyiségét, és ötszörös lebegőpontos teljesítménynövekedést értek el.

A négy bitnél alacsonyabb precizitás viszont már durva eredményeket produkál az LLM-következtetéseknél, jelentősen emelkedő perplexitás-pontszámokkal. Ugyanakkor érdekes kutatások zajlanak a szuper alacsony precizitású kvantálás terén, akár 1,58 bitig, miközben megőrzik a pontosságot.

Mindenesetre az Nvidia stratégiája egyértelmű: a számítási platformok egyre nagyobbak, sűrűbbek, forróbbak és energiaéhesebbek lesznek a jövőben. Ahogyan Huang fogalmazott a múlt heti sajtótájékoztatón, a limit itt az, hogy mennyi energiát tudsz beletáplálni egy rackbe.

“Egy adatközpont jelenleg 250 megawatt. Ez valamiféle korlát rackenként. A többi csak részletkérdés” – mondta Huang. “Azt mondanám, hogy a gigawatt per rack jó határnak tűnik.”


Az energiaproblémát nem lehet megkerülni

Természetesen a 600 kW-os rackek hatalmas fejfájást okoznak az adatközpont-üzemeltetőknek. Az ultra-sűrű számítási kapacitás hűtése, amely már megawattokban mérhető, nem új kihívás. Ami megváltozott, az az, hogy itt most nem néhány apró klaszterről beszélünk évente, hanem tucatnyiról, amelyek közül néhány elég erős ahhoz, hogy letaszítsa a világ legerősebb szuperszámítógépeit a trónról.

Ezeknél a méretekben a nagyon specializált, kis volumenű hőkezelési és energiaellátási rendszerek egyszerűen nem elégségesek. Sajnos az adatközpont-forgalmazók – akik azokat a nem éppen izgalmas alkatrészeket árulják, amelyek nélkül a több millió dolláros NVL72 rackek nem működnének – csak most kezdik magukat utolérni az igények terén.

Ez lehet az oka annak, hogy a bejelentett Blackwell-telepítések többségét a léghűtéses HGX B200-ra tervezték, nem az NVL72-re, amelyet Huang kitartóan reklámoz. Az HGX rendszerek – nyolc GPU-val – sok meglévő H100 környezetben telepíthetők.

Az NVL72 egy teljes rackméretű kialakítás, amelyet jelentősen a hiperskálázók ihlettek, DC-buszokkal, tápegység-szánokkal és elöl kivezetett hálózattal. 120 kW folyadékhűtéses számítási teljesítményével több ilyen telepítése egy meglévő létesítményben gyorsan problematikussá válik. És ahogy megjósolható, ez még nehezebbé válik, amikor az Nvidia 600 kW-os “szörnyrackjei” 2027 végén debütálnak.

A vezetőt követni kell

Fontos tisztázni, hogy ezek az akadályok nemcsak az Nvidiára vonatkoznak. Az AMD, az Intel és minden más felhőszolgáltató vagy csiptervező, amely az Nvidia piaci részesedéséből szeretne kihasítani egy szeletet, hamarosan ugyanezekkel a problémákkal találja szemben magát.

Ennek a kihívásnak azonban előnyei is vannak. Az Nvidia egyedülálló helyzetben van ahhoz, hogy meghatározza a jövőbeli adatközpontok energia- és hőtechnikai szabványait.

Ahogy Huang korábban is elmondta, hajlandó volt felfedni a következő három GPU-generációt, sőt utalni a negyedikre is, hogy infrastruktúrális partnereik megfelelően felkészülhessenek.

“Azért ismertettem a világgal az Nvidia következő három-négy éves útitervét, hogy mostantól mindenki más is ennek megfelelően tervezhessen” – mondta Huang.

Másrészt ezek az erőfeszítések egyengetik az utat a konkurens csipgyártók számára is. Ha az Nvidia megtervez egy 120 kW-os vagy most már 600 kW-os rack-et, és a kolokációs szolgáltatók, valamint a felhőüzemeltetők hajlandóak támogatni azt, akkor az AMD vagy az Intel is nyugodtan beépítheti ugyanezt a teljesítményszintet a saját rackjeikbe anélkül, hogy aggódnának, hol állítják majd üzembe azokat a megrendelők.

2025, adminboss, go.theregister.com alapján

  • Mit gondolsz az Nvidia jövőbeli terveiről?
  • Hogyan látod a technológiai fejlődés hatásait a környezetre?
  • Mennyire tartod fenntarthatónak az egyre nagyobb energiaigényű rendszereket?
  • Mit tennél a helyükben a versenytársak?
  • Mennyire fontos a nyílt kommunikáció a technológiai iparban?
  • Hogyan befolyásolhatja a társadalmat az ilyen mértékű számítási kapacitás?


Legfrissebb posztok

szerda 17:02

Az MI is tud trágár lenni: amikor a ChatGPT elszabadul

Tipikus eset, amikor valaki egy MI-csevegővel próbál beszélgetni, és az mindenáron udvarias akar lenni – néha azonban épp az ellenkezője történik...

szerda 16:57

Itt az áttörés: érkeznek az 1 nanométer alatti processzorok

Külön említést érdemel, hogy a TSMC komoly terveket sző a 2029-re ígért, 1 nanométernél is kisebb transzisztorokkal ellátott chipek fejlesztésére...

szerda 16:34

Az év felfedezése: a fánk alakú rejtély megdöntötte a 150 éves szabályt

🍩 Egy 150 éves geometriai elvet cáfolt meg egy friss matematikai áttörés: sikerült két zárt, fánkszerű felületet létrehozni, amelyek helyi mérési adatai azonosak, de globálisan mégsem ugyanazok...

szerda 15:45

A Universal Print megint leállt: bakizott a Microsoft

A Microsoft Universal Print felhasználói mostanában különösen sok bosszúságot tapasztalnak: sokan hiába próbálják megosztani a nyomtatókat, a rendszer hibát jelez, és nem hozza létre a nyomtatómegosztást...

szerda 15:34

Az élet nyomában: a marsjáró meglepő vegyületekre bukkant

A Mars felszíne alatt rejlő ősi szerves anyagok után szimatol a NASA Curiosity marsjárója, és most egész különleges, eddig nem látott szerves vegyületekre bukkant – köztük egy nitrogéntartalmú molekulára, amelynek szerkezete meglepően hasonlít a DNS előfutárához...

szerda 15:23

A köd szelleme: új pitvipera-fajt fedeztek fel Kínában

Szecsuán nyugati hegyeinek sűrű, zöld rengetegei rejtették el az egyik leglátványosabb új kígyófajt, amelyet most azonosítottak...

szerda 14:57

Az új adatbázis-korszak: a Google szabadjára engedi az MI‑ügynököket

Az adattárolási rendszerek világa gyökeresen változik: a régi, kimondottan emberi lekérdezésekre épített architektúra napjai meg vannak számlálva...

szerda 14:45

Az FCA éles MI-tesztet indít a brit bankoknál

Kezdetben csak néhány cég vágott bele, most viszont nyolc jelentős bank és pénzügyi szolgáltató, köztük a Barclays, a Lloyds Banking Group, a Scottish Widows, az UBS és az Experian is részt vesz a brit pénzügyi felügyelet (FCA) MI-próbaprogramjában...

szerda 14:34

Az ügyfelek menekülnek a Three új sebességkorlátja elől

A mobilinternetezés frontján váratlan fordulatot vett a Three: az eddig korlátlan 5G-sebesség helyett mostantól jelentős sebességkorlátokat vezetett be a legtöbb új és hosszabbított előfizetésnél...

szerda 14:23

Az Aave-ból ömlik ki a tőke: hová tűnt 3700 milliárd forint?

💸 Nehéz elhinni, de több mint 3700 milliárd forint értékű vagyon hagyta el az Aave platformját egyetlen, 108 milliárd forintos incidens után...

szerda 14:02

A mesterséges intelligencia feltárja az óceáni áramlatok titkos ösvényeit

A világ óceánjainak áramlatai kulcsszerepet játszanak a földi klíma, az élővilág és az óceánok szén-dioxid-tárolási képességének alakításában...

szerda 13:56

Villámgyors javítás az ASP.NET Core kritikus hibájára

⚡ A Microsoft váratlanul adott ki biztonsági frissítést egy rendkívül veszélyes ASP...

szerda 13:47

Az Amazon raktárai a sérülések árnyékában: mi folyik bent?

Egy lényeges szempont, hogy az Amazon évről évre a figyelem középpontjába kerül munkahelyi biztonsága miatt...

szerda 13:23

Az Anker egy apró chippel turbózza az okos fülhallgatók MI-jét

Az Anker új irányba lépett: a vállalat saját fejlesztésű, CIM (Compute-in-Memory) technológiát alkalmazó csipjével forradalmasíthatja a hordozható eszközök MI-teljesítményét...

szerda 13:01

Az AI új csodafegyvere és a hackerek titkos klubja

Az Anthropic vadonatúj kiberbiztonsági modellje, a Claude Mythos Preview, a nagy techcégek belső tesztplatformjaiból indult hódító útjára alig pár hete...

szerda 12:56

Az Apple új vezére: hardverzseni vagy szoftveres úttörő lesz?

Tim Cook számára anno minden azzal a kérdéssel indult: képes lesz-e túlszárnyalni Steve Jobs legendás időszakát?..

szerda 12:45

Az amerikai hadsereg többet költene drónokra, mint sok ország haderejére

Az amerikai védelmi minisztérium a következő pénzügyi évre 1,5 billió dolláros – közel 540 000 milliárd forintos – költségvetést kér, amelyben kulcsszerepet kap az eddigi legnagyobb drón- és drónellenes fejlesztési csomag...

szerda 12:23

Az apró mobilok korszaka tényleg véget ért?

A mobilgyártók egyre határozottabban távolodnak a kisméretű telefonoktól, ahogy például a Samsung után a kínai riválisok sem látják értelmét a 6 colos kijelzők fejlesztésének...

szerda 12:01

Az amerikai saját otthon álma darabokra hullik: nemcsak a fiatalok szorulnak ki

🏠 Az otthonhoz jutás problémája mára már nemcsak a huszon- és harmincéveseket sújtja: egyre több negyvenes, ötvenes, sőt idősebb vásárló is kiszorul a lakáspiacról...

szerda 11:45

Az Apple visszahozná a betiltott egészségügyi funkciót

Az Apple Watch véroxigénszint-mérője évek óta jogi viták középpontjában áll. Az okosóra 2020-ban debütált ezzel a forradalmi szenzorral, amely a véroxigénszintet méri...

szerda 11:34

A filmiskolás, akiből a kvantumszámítógépek milliárdost csináltak

Christian Weedbrook nevét néhány nap leforgása alatt ismerhette meg a világ: a Xanadu Quantum Technologies vezetőjeként hihetetlen gazdagságra tett szert, miután az MI jövőjét a kvantumszámítógépekhez kötötte...

szerda 11:23

Az elképesztő új kamera egy billiómod másodpercet is megörökít

📷 Új szintre lépett a mikroszkopikus világ villámgyors eseményeinek vizsgálata: kínai kutatók egy forradalmian új képrögzítési módszert mutattak be, amellyel hihetetlenül rövid, akár néhányszáz femtoszekundum alatt lezajló folyamatok minden eddiginél részletesebb megfigyelése vált lehetővé...

szerda 11:11

Az űr citromcsigája: a Hubble ismét a Trifid-köd bűvöletében

A Hubble űrtávcső idén már 36 éves, és most egy igazán friss, lélegzetelállító képpel ünnepli ezt: a Nyilas (Sagittarius) csillagképben található Trifid-köd legkülönlegesebb alakzata, az űrbéli citromcsiga (Cosmic Sea Lemon) újra lencsevégre került...

szerda 11:01

A bosszantó YouTube-értesítéseknek végre vége

A YouTube mobilon mostantól automatikusan némítja azoknak a csatornáknak a push-értesítéseit, amelyeket több mint egy hónapja nem követsz figyelemmel...

szerda 10:57

Az amerikai tőke újra lángra lobbantja a Bitcoint

🔥 Lényeges szempont, hogy a bitcoin hónapok óta nem látott tempóban erősödik: 14 egymást követő napon át pozitív a Coinbase-prémium, ami legutóbb tavaly októberben történt, amikor a kriptopénz történelmi csúcson, 126 000 dolláron (kb...

szerda 10:50

A mesterséges intelligencia leszámol a Firefox biztonsági hibáival

A Mozilla legfrissebb tesztjei során meglepő eredmények születtek: az Anthropic fejlesztette Mythos Preview MI-modellje 271 biztonsági sérülékenységet azonosított a hamarosan megjelenő Firefox 150 forráskódjában...

szerda 10:44

Az OAuth sebezhetőségei: amikor az MI-eszközök kaput nyitnak a hekkereknek

Felmerül a kérdés, hogy miként fordulhat elő, hogy egyetlen alkalmazotti tevékenység elegendő ahhoz, hogy egy egész vállalati infrastruktúrát feltörjék...

szerda 10:37

A Honor 600 Pro leveri az iPhone-t – de miért narancssárga?

🟢 A Honor legújabb középkategóriás készüléke, a 600 Pro, már első ránézésre is ismerős lehet – a teljes szélességű, vízszintes kamerasziget, a precízen megmunkált unibody kialakítás és a hátlapi lencsék elrendezése határozottan idézi a prémium telefonok világát...

szerda 10:29

A Microsoft Game Pass végre olcsóbb Ausztráliában

🎉 Hatalmas meglepetést okozott a Microsoft azzal, hogy lejjebb vitte a PC- és Xbox Game Pass havidíjait – ezt Ausztráliában már meg is érezhetik a játékosok...