
Blackwell-architektúra kicsiben – és mégis óriási lehetőségek
A Blackwell nevű grafikus chip most rendhagyó módon, jóval kisebb, kompakt felépítésben érkezik a gépbe, mégis megőrzi minden fontos újdonságát, különösen a 4 bites (FP4) számítási lehetőséget, amit mindenképp ki kell emelni. A GB10 fő alkotóelemei mind a TSMC 3 nm-es gyártástechnológiájával készültek, így ez a legfejlettebb Blackwell-alapú termék eddig.
Az igazi újdonság azonban az, hogy a Blackwell mellé egy MediaTek által fejlesztett CPU chipet (S-die-t) párosítottak, amely 20 darab Arm v9.2-alapú magot rejt két klaszterbe szervezve. Mindkét lapka egy 2.5D interposerre került, így az adatmegosztás hatékony és költséghatékony.
Mit tud a DGX Spark?
A Spark munkaállomás 128 GB LPDDR5X memóriával dolgozik, amely például egy 70 milliárd paraméteres MI modell finomhangolására is elég. Az egész számítógép egy normál hálózati konnektorba csatlakoztatható, szemben az adatközpontok óriási energiaigényével – ez már önmagában is forradalmi.
A ConnectX-7 hálózati vezérlő lehetővé teszi két Spark munkaállomás összekapcsolását, így még komplexebb feladatok is megoldhatók. A háttértár maximum 4 TB SSD lehet, emellett HBM memória is elérhető benne. A grafikus chip 31 TFLOP FP32 vagy 1000 TFLOP FP4 teljesítmény leadására képes, DLSS- és ray tracing-támogatással.
Hardver, amely mindent visz
A processzormagok privát L2 gyorsítótárral rendelkeznek, összesen pedig 24 MB L2 cache található a GPU-n, amely a CPU-GPU koherenciát szolgálja. A 256 bites L5X-9400 memóriainterfész körülbelül 301 GB/s sávszélességet biztosít.
A chip 140 wattos TDP-vel működik, miközben akár 4 kijelzőt is támogat (3 DisplayPort, 1 HDMI 2.1a). SR-IOV, hardveres NVDEC és NVENC videófeldolgozás teszi teljessé a multimédiás lehetőségeket.
Az NVIDIA és a MediaTek partnerségének sikere
Fontos, hogy a memória- és kijelzővezérlés is a MediaTek CPU chipjén fut, az NVIDIA IP-k (pl. C2C link, display controller) integrálásával. A fejlesztés elsőre, már az A0 verzióban hibátlanul működött, ami ebben a kategóriában ritkaság. Ennek eredményeképpen a GB10 a kis mérete ellenére nagy teljesítményű MI-fejlesztések alapja lehet, hatékonyan egészíti ki a DGX ökoszisztémát – a fejlesztők pedig már alig várják, hogy megérkezzen a rendelésük.