Az Nvidia áttörése alapjaiban formálja át az MI-alapú adattárolást

Felmerül a kérdés: miként orvosolható az a probléma, amikor egy MI-ügynök a feladat közben elveszíti a kontextust, mert a hagyományos adattárolás már nem tudja tartani a tempót a gyorsabb következtetésekkel? Ilyenkor nem a gépi tanulási modell, hanem az adattárolás válik szűk keresztmetszetté. Az Nvidia éppen erre hozott megoldást a GTC 2026 konferencián bemutatott BlueField-4 STX-szel: egy új, moduláris architektúrával, amely dedikált kontextusmemória-réteget illeszt a GPU-k és a hagyományos adattárolás közé. Ez ötszörös token-átbocsátási sebességet, négyszeres energiahatékonyságot és kétszeres adatbeolvasási sebességet ígér a hagyományos, CPU-alapú tároláshoz képest.

Konkrétabban: a KV-gyorsítótár mint szűk keresztmetszet

A szűk keresztmetszet, amit az STX céloz, a kulcs–érték-gyorsítótár adatok feldolgozása. A nagy nyelvi modellek köztes számításait és a már feldolgozott lépéseket itt menti le a rendszer, hogy ne kelljen minden egyes következtetési lépésnél újraszámolni az egész kontextust. Ahogy nő a kontextusablak, úgy nő a gyorsítótár mérete is. Ha viszont ennek vissza kell térnie a GPU-hoz a hagyományos adattárolási útvonalon, az komolyan visszaveti a feldolgozást és a hardverkihasználtságot.

Új architektúra GPU-adattárolásra hangolva

Az STX nem közvetlenül megvásárolható termék, hanem referenciaarchitektúra, amelyet az Nvidia a partnerein keresztül juttat el a piacra. Az alapja egy BlueField-4 processzor, amely az Nvidia Vera CPU-ját ötvözi a ConnectX-9 SuperNIC hálózati kártyával. Az egész rendszer Spectrum-X Ethernet-hálózatot használ, és az Nvidia DOCA szoftverplatformján keresztül programozható.

A rackméretű első megvalósítás az Nvidia CMX context memory storage platform. Ez a rendszer a GPU-k memóriáját bővíti ki egy gyors, kifejezetten kulcs–érték-gyorsítótár adatokra optimalizált réteggel, hogy az MI-modellek gyorsan és hatékonyan elérjék azt anélkül, hogy a hagyományos adattárolási rétegen kellene átmenniük.

Széles körű együttműködés, új szoftveres eszközök

Az Nvidia kiterjeszti a DOCA platformot a DOCA Memo nevű új komponenssel, amely a szoftveres oldalon segíti a kontextusra optimalizált tárolást. Az Nvidia partnerei – köztük a Cloudian, DDN, Dell Technologies, Hitachi Vantara, HPE, IBM, MinIO, NetApp, Nutanix, VAST Data és WEKA – közösen tervezik az STX-alapú infrastruktúrát. Gyártópartnerei, mint az AIC, a Supermicro és a Quanta Cloud Technology, már dolgoznak az STX-en.

A felhőszolgáltatók, köztük a CoreWeave, Crusoe, IREN, Lambda, Mistral AI, Nebius, Oracle Cloud Infrastructure és a Vultr, szintén elkötelezték magukat az STX-alapú megoldások mellett.

IBM: kézzelfogható eredmények az adattárolás gyorsításában

Az IBM két szerepben is megjelenik: részt vesz az STX-fejlesztésben, ugyanakkor az Nvidia is a cég Storage Scale System 6000 termékét választotta saját GPU-alapú analitikai infrastruktúrájának alapjául. Az IBM együttműködése az Nvidiával, a watsonx.data és a GPU-s Presto SQL-motor integrációjával a Nestlénél, gyártási környezetben került tesztelésre: egy egyszerűsített adatszolgáltatási ciklus ideje 15 percről 3 percre csökkent, 186 ország és 44 tábla kezelése mellett. Az IBM 83%-os költségmegtakarításról és harmincszoros ár/teljesítmény-javulásról számolt be.

A tárolástól függ az MI-infrastruktúra sikeressége

Az STX megjelenése azt jelzi, hogy az adattárolási réteg ugyanolyan fontossá válik az MI-infrastruktúrák tervezésében, mint a GPU-vásárlás. A jelenleg elterjedt szolgáltatások – például a NAS és az objektumtárolók – nem elég gyorsak a kulcs–érték-gyorsítótár adataihoz. Az ilyen igényekhez a Dell, a HPE és a NetApp, valamint a VAST Data partnerek által már fejlesztés alatt álló STX-alapú rendszerek, továbbá a programozható DOCA szoftverplatform jelentik a jövőt.

Konkrétabban: a teljesítménymérések hagyományos, CPU-alapú rendszerekhez képest történtek, de a pontos kiindulási konfiguráció még nem ismert. Az első STX-alapú platformok 2026 második felétől várhatók, és a nagy tárológyártók közös fejlesztéseinek köszönhetően vállalati szinten is elérhetők lesznek, amikor MI-infrastruktúra-frissítésre kerül sor.

2026, adminboss, venturebeat.com alapján