
Új alapokra helyezett architektúra
A TSMC legújabb, 3 nm-es csíkszélességű technológiájával készülő GB10 két fő egységből áll: egy 20 magos CPU rész, amelyet a MediaTek tervezett Arm v9.2 magokkal, valamint egy Nvidia által fejlesztett GPU lapka. Ezeket a chipeket a TSMC fejlett, 2,5D csomagolási megoldásával és az Nvidia saját fejlesztésű, 600 GB/s bidirekcionális sávszélességet biztosító NVLink Chip-to-Chip kapcsolattal kötötték össze.
A GB10 CPU-jában két klaszterben helyezkednek el a magok: X925 és Cortex-A725 típusúak, 32 MB L3 és további 16 MB L4 gyorsítótárral, hogy a kommunikáció a processzor és a grafikus modul között különösen gyors lehessen. A grafikus oldalról körülbelül 1 petaFLOP FP4 (sparsity) vagy 31 teraFLOPS FP32 teljesítmény várható, ami nagyjából egy RTX 5070 (kb. 200 ezer forint) szintjének felel meg. Mindezek ellenére a fogyasztása csupán 140 watt, jóval kevesebb, mint a 250 wattos 5070-nek.
Bőséges VRAM, kompromisszumok árán
A GB10-ben 128 GB LPDDR5x VRAM található — ez lényegesen több, mint a 5070 12 GB-ja. Mivel minden milliárd paraméterhez helyben körülbelül 500 MB tárhely szükséges, ekkora memória valóban fontos fejlett MI-modellek finomhangolásához. Az Nvidia azonban ezúttal nem HBM memóriát választott, hanem a költség- és energiatakarékosság jegyében LPDDR5x-et alkalmazott, 9400 MT/s sebességgel és 256 bites buszon, így a memóriasávszélesség 273–301 GB/s közé esik. Ez kompromisszum a kapacitás javára, hiszen a HBM még gyorsabb lenne, de jóval drágább és energiaigényesebb.
Több, mint helyi gép: fejlesztői játszótér
A GB10-et nem csupán helyi modellek futtatására tervezték. Fejlesztési, prototípus-építő és finomhangoló munkaállomásként is használható: akár 70 milliárd paraméteres modellt is képes finomhangolni, inferálni pedig akár 200 milliárdos modelleket is tud. Ha nem elég a VRAM, két Spark gépet össze lehet kötni 200GbE portokon keresztül, így duplázható a kapacitás. Lényeges, hogy ugyanazokat a technológiákat alkalmazza, mint az Nvidia nagyobb adatközponti rendszerei, így a helyben megépített MI-algoritmusok gond nélkül bevethetők éles környezetben, átalakítás nélkül.
Összegzés: elit játékszer vagy munkagép?
Összességében az Nvidia GB10 minigép elsősorban tehetős fejlesztőknek kínál eddig nem látott rugalmasságot és teljesítményt a helyi MI-fejlesztéshez, miközben kompromisszumot teremt a memória technológia és fogyasztás között. Az ára azonban gondoskodik róla, hogy a legtöbbünk számára inkább elérhetetlen játékszer maradjon.