
Konkrétabban: a KV-gyorsítótár mint szűk keresztmetszet
A szűk keresztmetszet, amit az STX céloz, a kulcs–érték-gyorsítótár adatok feldolgozása. A nagy nyelvi modellek köztes számításait és a már feldolgozott lépéseket itt menti le a rendszer, hogy ne kelljen minden egyes következtetési lépésnél újraszámolni az egész kontextust. Ahogy nő a kontextusablak, úgy nő a gyorsítótár mérete is. Ha viszont ennek vissza kell térnie a GPU-hoz a hagyományos adattárolási útvonalon, az komolyan visszaveti a feldolgozást és a hardverkihasználtságot.
Új architektúra GPU-adattárolásra hangolva
Az STX nem közvetlenül megvásárolható termék, hanem referenciaarchitektúra, amelyet az Nvidia a partnerein keresztül juttat el a piacra. Az alapja egy BlueField-4 processzor, amely az Nvidia Vera CPU-ját ötvözi a ConnectX-9 SuperNIC hálózati kártyával. Az egész rendszer Spectrum-X Ethernet-hálózatot használ, és az Nvidia DOCA szoftverplatformján keresztül programozható.
A rackméretű első megvalósítás az Nvidia CMX context memory storage platform. Ez a rendszer a GPU-k memóriáját bővíti ki egy gyors, kifejezetten kulcs–érték-gyorsítótár adatokra optimalizált réteggel, hogy az MI-modellek gyorsan és hatékonyan elérjék azt anélkül, hogy a hagyományos adattárolási rétegen kellene átmenniük.
Széles körű együttműködés, új szoftveres eszközök
Az Nvidia kiterjeszti a DOCA platformot a DOCA Memo nevű új komponenssel, amely a szoftveres oldalon segíti a kontextusra optimalizált tárolást. Az Nvidia partnerei – köztük a Cloudian, DDN, Dell Technologies, Hitachi Vantara, HPE, IBM, MinIO, NetApp, Nutanix, VAST Data és WEKA – közösen tervezik az STX-alapú infrastruktúrát. Gyártópartnerei, mint az AIC, a Supermicro és a Quanta Cloud Technology, már dolgoznak az STX-en.
A felhőszolgáltatók, köztük a CoreWeave, Crusoe, IREN, Lambda, Mistral AI, Nebius, Oracle Cloud Infrastructure és a Vultr, szintén elkötelezték magukat az STX-alapú megoldások mellett.
IBM: kézzelfogható eredmények az adattárolás gyorsításában
Az IBM két szerepben is megjelenik: részt vesz az STX-fejlesztésben, ugyanakkor az Nvidia is a cég Storage Scale System 6000 termékét választotta saját GPU-alapú analitikai infrastruktúrájának alapjául. Az IBM együttműködése az Nvidiával, a watsonx.data és a GPU-s Presto SQL-motor integrációjával a Nestlénél, gyártási környezetben került tesztelésre: egy egyszerűsített adatszolgáltatási ciklus ideje 15 percről 3 percre csökkent, 186 ország és 44 tábla kezelése mellett. Az IBM 83%-os költségmegtakarításról és harmincszoros ár/teljesítmény-javulásról számolt be.
A tárolástól függ az MI-infrastruktúra sikeressége
Az STX megjelenése azt jelzi, hogy az adattárolási réteg ugyanolyan fontossá válik az MI-infrastruktúrák tervezésében, mint a GPU-vásárlás. A jelenleg elterjedt szolgáltatások – például a NAS és az objektumtárolók – nem elég gyorsak a kulcs–érték-gyorsítótár adataihoz. Az ilyen igényekhez a Dell, a HPE és a NetApp, valamint a VAST Data partnerek által már fejlesztés alatt álló STX-alapú rendszerek, továbbá a programozható DOCA szoftverplatform jelentik a jövőt.
Konkrétabban: a teljesítménymérések hagyományos, CPU-alapú rendszerekhez képest történtek, de a pontos kiindulási konfiguráció még nem ismert. Az első STX-alapú platformok 2026 második felétől várhatók, és a nagy tárológyártók közös fejlesztéseinek köszönhetően vállalati szinten is elérhetők lesznek, amikor MI-infrastruktúra-frissítésre kerül sor.
