
Rubin GPU: új szint a mesterséges intelligenciában
A Rubin család zászlóshajója a vadonatúj GPU-architektúra, amely ötszörös előrelépést ígér a Blackwell chiphez képest a MI-inferenciában, valamint 3,5-szeres ugrást a tanításban. Egy Rubin GPU-csomagban két, 3 nm-es csíkszélességű lapka dolgozik, összesen 336 milliárd tranzisztorral és akár 288 GB HBM4 memóriával. Ez 22 TB/s memóriasávszélességet eredményez, amely csaknem háromszorosa a Blackwell által kínáltnak. Mindehhez ötvenszeres TFLOPS-teljesítmény igazodik az új NVFP4 formátumban, amely minden eddigi NVIDIA-fejlesztést maga mögé utasít. A Rubin GPU energiahatékonyságban is éllovas: inferenciában nyolcszoros teljesítmény/watt arányt ígér.
Vera CPU és az NVLink 6: gigászi összjáték
A Rubin platform másik kulcsszereplője a Vera elnevezésű új ARM-alapú CPU. Egy Vera 88 Olympus magot foglal magában, amelyek egyszerre akár 176 szál kezelésére képesek, köszönhetően a térbeli többszálú architektúrának. A Vera háromszor annyi, azaz 1,5 TB LPDDR5X memóriát támogat moduláris, cserélhető felépítésben, 1,2 TB/s memóriasávszélességgel. Az architektúra két fő előnye: nyolcszoros titkosítási sebesség és a lehetőség teljes rackméretű, biztonságos számítási tartomány létrehozására.
Az új NVLink 6 kapcsolja össze a Rubin GPU-kat: 3,6 TB/s-sel duplázza meg a korábbi generáció tempóját. Az NVLink 6 Switch minden csatlakozó GPU-nak összesen 28,8 GB/s sávszélességet kínál, amely kizárólag folyadékhűtéssel hűthető.
Hálózat: ConnectX-9, BlueField 4 és Spectrum-6 kapcsoló
A Rubin teljes ipari ökoszisztémát kínál: a ConnectX-9 hálózati kártya 1,6 Tb/s sávszélességet biztosít, a BlueField 4 DPU pedig hatalmas, 64 magos Grace CPU-val és saját ConnectX-9 NIC-cel érkezik, triplázott memóriasávszélességgel és hatszoros számítási teljesítménnyel az elődhöz képest. Mindezt a Spectrum-6 Ethernet kapcsoló fogja össze: a csúcsmodell, az SN6800 512 darab 800G vagy 2048 200G Ethernet portot kínál, 409,6 Tb/s aggregált sebességgel. A kábelezés nagy részét optikai megoldások váltják ki, javítva a megbízhatóságot és ötszörös energiahatékonysággal működve.
Moduláris adatközponti rendszerek: NVL72 és HGX Rubin NVL8
Az új chipgenerációk konkrét rendszerekben landolnak: a Rubin NVL72 rackméretű rendszer 72 Rubin GPU-t (tulajdonképpen 144 lapkát) és 36 Vera CPU-t foglal magában. Ezáltal a teljes rackben elérhető a 3,6 exaFLOPS teljesítmény inferenciára, valamint 2,5 exaFLOPS tanításra. A rugalmasságot tovább növeli az újjátervezett, teljesen kábelmentes tálcás szerkezet, amely a korábbi 100 percről mindössze 6 percre csökkenti egy rack összeszerelését.
Azoknak, akik továbbra is x86-alapú rendszereket használnának, a Rubin 8-way HGX (HGX Rubin NVL8) node-ot ajánlja az NVIDIA.
Kulcsfontosságú szoftveres újítás: Inference Context Memory Storage Platform
A Rubin platform jelentős újítása a kulcs-érték gyorsítótáras rendszer a MI-inferencia optimalizálására. Ennél az NVIDIA hardverpartnerei tárolóként SSD-ket, kapcsolódó hardverként BlueField vagy ConnectX modulokat használhatnak. Ezzel akár ötszörös gyorsulás és energiahatékonyság érhető el a komplex lekérdezéseket végző rendszerekben.
DGX SuperPOD: a Rubin platform csúcsa
Az egész Rubin infrastruktúrát a DGX SuperPOD foglalja keretbe, amely az NVIDIA referencia-szuperszámítógépe. Egyetlen ilyen SuperPOD nyolc NVL72 rackből épül fel, amelyben összesen 576 GPU és 288 CPU, illetve 600 TB memória dolgozik összehangoltan. A rendszer teljes MI-inferencia-teljesítménye eléri a 28,8 exaFLOPS-t NVFP4 pontossággal. Emellett azoknak, akik x86-on maradnak, SuperPOD-ot építhetnek 64 NVL8 node-ból is, amely 512 GPU-ból áll.
Rubin lapkák érkezése és partnerek
A Rubin platformra épülő eszközök 2026 második felében jelennek meg a felhőszolgáltatók kínálatában. Elsők között lesz az AWS, a Google Cloud, a Microsoft és az OCI, amelyek minden eddiginél nagyobb, teljes egészében titkosított és skálázható MI-rendszereket tudnak üzemeltetni a Rubin rendszerek segítségével.
Ennek nyomán az NVIDIA Rubin platform nem csupán a hardverfejlődés következő lépcsője: teljes ökoszisztémát kínál, amely új korszakot nyit az adatközponti MI-rendszerek, felhős szolgáltatások és a szuperszámítógépes teljesítmény világában. A folytatás még ennél is izgalmasabb lesz, hiszen ezzel a fejlesztéssel újraosztják a kártyákat a technológiai versenyben.
