2025. 03. 30., 15:37

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve

A Moore-törvény halott – mutatja az Nvidia újabb GPU-útiterve
Jensen Huang, az Nvidia vezérigazgatója már régóta hangoztatja, hogy a Moore-törvény halott. A legutóbbi GTC-konferencián tartott bemutatón azonban kiderült, hogy ez a számítástechnikai törvényszerűség nemcsak halott, hanem mélyen el is van már temetve. Huang nemcsak a cég következő generációs processzorait mutatta be, hanem meglepően részletes információkat osztott meg a következő két generációs számítási platformról is, például egy 600 kW-os rack-rendszerről. Azt is megtudtuk, hogy a 2028-ban érkező GPU-családot Richard Feynmanról nevezik majd el. Szokatlan, hogy a csipgyártók ilyen részletesen felfedik jövőbeli terveiket. Ennek oka egyszerű: az Nvidia akadályokba ütközött, méghozzá nem is egybe, hanem többbe. A legrosszabb pedig az, hogy ezeknek a problémáknak a megoldása – a pénzpumpáláson kívül – nagyrészt kívül esik az Nvidia hatáskörén.

Innentől csak felfelé és kifelé

Az első és legnyilvánvalóbb kihívás a számítási kapacitás skálázásával kapcsolatos. A gyártási folyamatok fejlődése az utóbbi években lelassult. Bár még mindig vannak lehetőségek a fejlesztésre, ezek egyre nehezebbé és költségesebbé válnak.

E korlátokkal szembesülve az Nvidia stratégiája egyszerű: maximalizálni a szilícium mennyiségét minden számítási csomópontban. Jelenleg az Nvidia legsűrűbb rendszerei 72 GPU-t kapcsolnak össze egyetlen számítási tartományban a nagy sebességű, 1,8 TB/s NVLink szövet segítségével. A GTC-n az Nvidia bejelentette, hogy ezt a számot előbb 144-re, majd végül 576 GPU-ra kívánja növelni rackenként. A méretezés azonban nemcsak a rackekben történik, hanem a csipek csomagolásán belül is.

Ez már a Nvidia Blackwell-gyorsítóinak tavalyi bemutatásakor is nyilvánvalóvá vált. A csipek ötszörös teljesítménynövekedést ígértek a Hopperhez képest, ami impozánsan hangzott, egészen addig, amíg ki nem derült, hogy ehhez kétszer annyi die-ra, egy új, 4 bites adattípusra és 500 wattal több energiára volt szükség.

2027-re 600 kW-os rackek érkeznek

Még nem tudjuk, milyen gyártási technológiát tervez az Nvidia a következő generációs csipjeihez, de annyi biztos, hogy a Rubin Ultra folytatja a felskálázás trendjét. Még a TSMC 2 nm-es technológiájától várt körülbelül 20 százalékos hatékonyságnövekedés mellett is ez egy rendkívül forró csipcsomag lesz.

Nemcsak a számítási kapacitás növekszik, hanem a memória is. A Rubinról a Rubin Ultrára való átálláskor jelentős ugrás várható a kapacitásban és a sávszélességben is – 288 GB-ról 1 TB-ra. Ennek körülbelül fele a gyorsabb, nagyobb kapacitású memóriamoduloknak köszönhető, míg a másik fele a memóriára szánt szilícium mennyiségének megduplázódásából ered – a Blackwell és Rubin nyolc moduljáról a Rubin Ultra tizenhat moduljára.

A megnövelt kapacitás lehetővé teszi, hogy az Nvidia több modellparamétert tömörítsen egyetlen csomagba, FP4 formátumban körülbelül 2 billiót, vagy “GPU-nként” 500 milliárdot. A HBM4e memória várhatóan megduplázza a sávszélességet a HBM3e-hez képest. Így a jelenlegi Blackwell  körülbelül 4 TB/s sávszélessége várhatóan 8 TB/s-ra ugrik a Rubin Ultra esetében.

A gigawatt per rack elfogadható felső korlátnak tűnik

A gyártási folyamatok fejlődése nem az egyetlen módja a számítási kapacitás vagy a memória skálázásának. A 16 bitről 8 bitre való áttérés például gyakorlatilag megduplázza a teljesítményt, miközben felére csökkenti egy adott modell memóriaigényét. A probléma azonban az, hogy a Nvidia lassan kifogy a csökkenthető bitszámokból. A Hopperről a Blackwellre történő váltás során négy bitet vettek el, megduplázták a szilícium mennyiségét, és ötszörös lebegőpontos teljesítménynövekedést értek el.

A négy bitnél alacsonyabb precizitás viszont már durva eredményeket produkál az LLM-következtetéseknél, jelentősen emelkedő perplexitás-pontszámokkal. Ugyanakkor érdekes kutatások zajlanak a szuper alacsony precizitású kvantálás terén, akár 1,58 bitig, miközben megőrzik a pontosságot.

Mindenesetre az Nvidia stratégiája egyértelmű: a számítási platformok egyre nagyobbak, sűrűbbek, forróbbak és energiaéhesebbek lesznek a jövőben. Ahogyan Huang fogalmazott a múlt heti sajtótájékoztatón, a limit itt az, hogy mennyi energiát tudsz beletáplálni egy rackbe.

“Egy adatközpont jelenleg 250 megawatt. Ez valamiféle korlát rackenként. A többi csak részletkérdés” – mondta Huang. “Azt mondanám, hogy a gigawatt per rack jó határnak tűnik.”


Az energiaproblémát nem lehet megkerülni

Természetesen a 600 kW-os rackek hatalmas fejfájást okoznak az adatközpont-üzemeltetőknek. Az ultra-sűrű számítási kapacitás hűtése, amely már megawattokban mérhető, nem új kihívás. Ami megváltozott, az az, hogy itt most nem néhány apró klaszterről beszélünk évente, hanem tucatnyiról, amelyek közül néhány elég erős ahhoz, hogy letaszítsa a világ legerősebb szuperszámítógépeit a trónról.

Ezeknél a méretekben a nagyon specializált, kis volumenű hőkezelési és energiaellátási rendszerek egyszerűen nem elégségesek. Sajnos az adatközpont-forgalmazók – akik azokat a nem éppen izgalmas alkatrészeket árulják, amelyek nélkül a több millió dolláros NVL72 rackek nem működnének – csak most kezdik magukat utolérni az igények terén.

Ez lehet az oka annak, hogy a bejelentett Blackwell-telepítések többségét a léghűtéses HGX B200-ra tervezték, nem az NVL72-re, amelyet Huang kitartóan reklámoz. Az HGX rendszerek – nyolc GPU-val – sok meglévő H100 környezetben telepíthetők.

Az NVL72 egy teljes rackméretű kialakítás, amelyet jelentősen a hiperskálázók ihlettek, DC-buszokkal, tápegység-szánokkal és elöl kivezetett hálózattal. 120 kW folyadékhűtéses számítási teljesítményével több ilyen telepítése egy meglévő létesítményben gyorsan problematikussá válik. És ahogy megjósolható, ez még nehezebbé válik, amikor az Nvidia 600 kW-os “szörnyrackjei” 2027 végén debütálnak.

A vezetőt követni kell

Fontos tisztázni, hogy ezek az akadályok nemcsak az Nvidiára vonatkoznak. Az AMD, az Intel és minden más felhőszolgáltató vagy csiptervező, amely az Nvidia piaci részesedéséből szeretne kihasítani egy szeletet, hamarosan ugyanezekkel a problémákkal találja szemben magát.

Ennek a kihívásnak azonban előnyei is vannak. Az Nvidia egyedülálló helyzetben van ahhoz, hogy meghatározza a jövőbeli adatközpontok energia- és hőtechnikai szabványait.

Ahogy Huang korábban is elmondta, hajlandó volt felfedni a következő három GPU-generációt, sőt utalni a negyedikre is, hogy infrastruktúrális partnereik megfelelően felkészülhessenek.

“Azért ismertettem a világgal az Nvidia következő három-négy éves útitervét, hogy mostantól mindenki más is ennek megfelelően tervezhessen” – mondta Huang.

Másrészt ezek az erőfeszítések egyengetik az utat a konkurens csipgyártók számára is. Ha az Nvidia megtervez egy 120 kW-os vagy most már 600 kW-os rack-et, és a kolokációs szolgáltatók, valamint a felhőüzemeltetők hajlandóak támogatni azt, akkor az AMD vagy az Intel is nyugodtan beépítheti ugyanezt a teljesítményszintet a saját rackjeikbe anélkül, hogy aggódnának, hol állítják majd üzembe azokat a megrendelők.

2025, adminboss, go.theregister.com alapján

  • Mit gondolsz az Nvidia jövőbeli terveiről?
  • Hogyan látod a technológiai fejlődés hatásait a környezetre?
  • Mennyire tartod fenntarthatónak az egyre nagyobb energiaigényű rendszereket?
  • Mit tennél a helyükben a versenytársak?
  • Mennyire fontos a nyílt kommunikáció a technológiai iparban?
  • Hogyan befolyásolhatja a társadalmat az ilyen mértékű számítási kapacitás?


Legfrissebb posztok

MA 17:37

Az áttörő CRISPR-technika megállíthatja és visszafordíthatja az antibiotikum-rezisztenciát

A globális egészségügyet egyre súlyosabb veszély fenyegeti: az antibiotikumoknak ellenálló baktériumok miatt 2050-re évente akár 10 millió halálesetet is jósolnak...

MA 17:20

Az AI-chipháború elszabadult: a Meta halmozza az Nvidia-GPU-kat

Na most kapaszkodj: a Meta hosszú távú szerződést kötött az Nvidiával, és évekig tonnaszámra vásárolja az Nvidia vadiúj Grace és Vera CPU-it, meg a Blackwell- és Rubin GPU-it a saját adatközpontjaihoz...

MA 17:03

Az MI sosem gondolkodik igazán – veszélyes önámításban élünk?

🧐 Amikor valaki orvoshoz fordul, magától értetődőnek veszi, hogy a szakember már találkozott valódi testtel, tapasztalatokat szerzett, vizsgált szerveket, megkülönböztette a különböző fájdalomtípusokat...

MA 16:55

Az olimpiai síalpinisták sikertitka: a VO2 max mindent visz

Nemcsak a profik számára fontos az, amit a 2026-os téli olimpián debütáló síalpinisták teste tud: a kiemelkedő állóképességi szint, amelyet egy mutató, a VO2 max mér...

MA 16:38

Az okos otthonok áttörést hozhatnak a demenciagondozásban

Fontos kérdés, hogy az egyre fejlettebb digitális technológiák hogyan javíthatják az idősebbek életminőségét, különösen azokét, akik Alzheimer-kórral vagy más demenciával élnek...

MA 16:19

Az Androidból száműzik az OpenVPN-t: megéri az új irány?

A Proton VPN androidos alkalmazása jelentősen átalakult: frissítés után a felhasználók gyorsabb, átláthatóbb felületet kapnak, ám az ikonikusnak számító OpenVPN-protokoll már nem elérhető...

MA 16:02

Az ingatlanpiac forradalma: kezdődik a kriptóval fedezett hitelek kora

Az amerikai Milo óriási eredményt ért el: több mint 100 millió dollár (kb...

MA 15:55

Az Anthropic új MI-je már a saját pusztulásától retteg

Az Anthropic frissítette Sonnet nevű MI-modelljét a 4.6-os verzióra, amely most jobban programoz, ügyesebben kezeli a számítógépes feladatokat, és fejlettebb következtetési, valamint tervezési képességekkel is rendelkezik...

MA 15:37

Az Autopilot kivonul Kaliforniából, a Tesla lázasan takarít

Meglepetés, a Tesla már nem dobálózik az Autopilot névvel Kaliforniában, hogy elkerülje a csúnya 30 napos kitiltást...

MA 15:19

Az ősi hányás, ami idősebb, mint a dinoszauruszok

🤢 Érdemes tudni, hogy egy németországi kövület nem mindennapi felfedezést rejt: egy 290 millió éves, megkövesedett hányásdarabkát – vagyis regurgitalitot – sikerült azonosítaniuk paleontológusoknak...

MA 15:02

A humanoid robotok lélegzetelállító kungfu-showja Kínában

A 2026-os pekingi Tavaszünnepi Gálán különleges esemény zajlott: emberformájú robotok adtak elő teljesen autonóm harcművészeti műsort a holdújévi ünnepség keretében...

MA 14:56

A mesterséges intelligencia félrevezette a beteget – így bukott le a Gemini

Egy nyugdíjas informatikus kísérleti céllal fordult a Google Geminihez: saját gyógyszerlistáját és egészségügyi adatait akarta rendszerezni, bízva abban, hogy a bot tárolja az ezekből összeállított orvosi profilt...

MA 14:38

Az óriásláncok csatája: merre kormányozzák új vezérigazgatóik a Walmartot és a Targetet?

💲 Tipikus eset, amikor két óriási rivális egyszerre új vezetőhöz kerül, de teljesen eltérő pályán mozognak tovább...

MA 14:18

A Bayer óriásalkuja: milliárdokat fizet a rákkeltő gyomirtóért

A Bayer megdöbbentő, 2600 milliárd forint (7,25 milliárd dollár) összegű egyezségre készül, hogy végre lezárja a Roundup nevű gyomirtó körül évek óta húzódó amerikai rákkártérítési pereket...

MA 14:01

Megint szakad: a Bitcoin 70 ezer dollár alatt

A Bitcoin ismét a 68 000 dolláros (kb. 24,8 millió forintos) szintre süllyedt, miután képtelen volt tartósan visszahódítani a 70 000 dolláros (kb...

MA 13:55

Az új WordPress AI-asszisztens mindent visz – weboldaltervezés egy szempillantás alatt

Na most kapaszkodj, mert a WordPress.com beizzított egy extra okos AI-asszisztenst, amitől az egész weboldal-építés egy laza, bulis séta lesz...

MA 13:38

Az OpenClaw felvásárlása után leáldozik a ChatGPT csillaga?

Február közepén a MI világa komoly fordulóponthoz érkezett: az OpenAI bejelentette az OpenClaw felvásárlását...

MA 13:19

Az őskori temető sötét rejtélye: apja csontjaival temették el a lányt

5500 évvel ezelőtt egy svédországi szigeten élt vadászó-gyűjtögető közösség tagjait egy különleges temetőben temették el, amelyről most DNS-vizsgálatok révén egyedülálló részletek derültek ki...

MA 13:02

Az amerikai bíróság elé áll Zuckerberg a fiatalok veszélyeztetése miatt

Mark Zuckerberg, a Meta vezérigazgatója szerdán tanúskodik egy jelentős kaliforniai perben, amely azt vizsgálja, hogy a közösségi oldalak szándékosan teszik-e függővé és károsítják-e a fiatalokat...

MA 12:37

A kaliforniai végjáték: besokallt a Tesla az Autopilot miatt

Egy világ omlott össze a Tesla kaliforniai rajongói számára: már hiába keresed az Autopilot kifejezést, az államban hivatalosan is eltűnik a márka kommunikációjából...

MA 12:01

Az Infosys az Anthropic-kal szövetkezik – veszélyben a munkahelyek?

Az indiai IT-piac óriása, az Infosys együttműködési megállapodást kötött az Anthropic MI-fejlesztő céggel, amelynek célja, hogy az úgynevezett agentikus MI-től új lendületet kapjon a távközlési és egyéb, erősen szabályozott iparágak digitalizációja világszerte...

MA 11:56

Megáll a mesterséges intelligencia diadalmenete? Miért torpannak meg a cégek

A vállalatok világszerte hatalmas összegeket fektetnek mesterséges intelligenciába, ám a várt eredmények gyakran elmaradnak...

MA 11:37

Az éghajlatváltozás soha nem látott erőre kapcsolja a spanyol áradásokat

🌊 2024 októberében a valenciai térséget olyan rendkívüli esőzések sújtották, amelyek néhány óra alatt több csapadékot zúdítottak a vidékre, mint amennyi máskor egy teljes év alatt esik...

MA 11:19

Az Abu-Dzabi milliárdosok zuhanásban is halmozták a bitcoint

💰 Az Abu-Dzabi állami befektetési alapok jelentős szereplői nem riadtak vissza a bitcoin 2025-ös árfolyamzuhanásától: a Mubadala Investment Company és az Al Warda Investments a negyedik negyedévben komoly mennyiséget vásároltak a BlackRock iShares Bitcoin Trust (IBIT) spot bitcoin ETF-jéből...

MA 10:58

Az MI-uralomért folyó háború: a Pentagon, az Anthropic és a Palantir

🛡 Érdemes megvizsgálni, hogyan került az Anthropic, a Pentagon és a Palantir különös háromszögébe a mesterséges intelligencia...

MA 10:50

A kínai hekkerek lecsaptak: kritikus Dell-hibát használnak ki

⚠ Külön említést érdemel, hogy 2024 közepe óta egy kínai államilag támogatott hackercsoport folyamatosan kihasználja a Dell egyik kritikus sebezhetőségét...

MA 10:41

Az idei Google I/O: rejtvények, mesterséges intelligencia és Android – kapaszkodj!

Képzeld el, hogy a Google ismét rejtvényen keresztül csempészte be a nagy hírt: május 19–20-án lesz a Google I/O 2026...

MA 10:25

Az este, amikor lefagyott a YouTube – mindenki kiakadt, aztán helyreállt

Oké, azt hiszed, hogy nincs is olyan, hogy totális YouTube-leállás – de b*szusz, közben meg világszerte százezrek szakadtak le a videókról!..

MA 10:17

Az év techfesztje közeleg: megvan a Google I/O 2026 dátuma

🎉 Nem hiszem el, de május 19–20. között végre jön a Google I/O 2026, ráadásul a kaliforniai Mountain View ikonikus Shoreline Amfiteátrumában...