csütörtök 18:02

Az MI memóriája: forradalom a tokenkezelésben

Az MI memóriája: forradalom a tokenkezelésben
A fejlett MI-ügynökök lassan kilépnek a laboratóriumokból, és belépve az üzleti életbe, egy alig említett, de annál súlyosabb problémával szembesülnek: a memóriával. Nem a számítási teljesítménnyel, nem a modellekkel – hanem a memóriával. A mai GPU-k memóriája egyszerűen nem tud lépést tartani azokkal a kulcs-érték (KV) gyorsítótárakkal, amelyeket korszerű, hosszan futó MI-eljárások használnak a kontextus megőrzésére. Következésképpen óriási a pazarlás: a GPU-knak újra és újra el kell végezniük olyan műveleteket, amelyeket egyszer már kiszámoltak. Ez jelentős költségnövekedést és teljesítményromlást eredményez, miközben a gyorsítótár telítődése miatt folyamatosan elvesznek korábban feldolgozott adatok.

Miért bukik el az MI a memórián?

A transformer-alapú nyelvi modellek minden egyes feldolgozott token kontextusát egy KV-cache-ben tárolják. Minél nagyobb a párbeszéd vagy a feldolgozandó anyag, annál több memóriát igényel ez a gyorsítótár. Egyetlen 100 000-tokenes szekvencia akár 40 GB GPU-memóriát igényelhet, miközben a legerősebb grafikus kártyák is csak 288 GB HBM-mel rendelkeznek, amelyben azonban a modell is helyet foglal.

Valós környezetben – például többfelhasználós rendszerekben, ahol forráskódot fejlesztenek vagy adóbevallásokat dolgoznak fel – a gyorsítótár kihasználása gyorsan eléri a maximumot. Három vagy négy nagyobb PDF betöltése után a KV-cache máris megtelik, és kénytelen eldobni régi adatokat. Az MI-rendszer így elveszíti a kontextus folytonosságát, nem képes tartós emlékezetet fenntartani.

Az elrejtett költség: az újraszámolási adó

A GPU-k egyre gyakrabban számolnak újra már egyszer elvégzett műveleteket: feltöltik a gyorsítótárat, dekódolnak, kifogynak a tárból, törlik a régi adatokat – majd kezdődik elölről az egész. Ezzel akár 40 százalékos felesleges energia- és számítási igényt generálnak, ami komolyan drágítja az MI-alapú szolgáltatásokat.

A szolgáltatók ezért már arra tanítják a felhasználóikat, hogy a promptjaikat úgy építsék fel, hogy lehetőleg elérjék azt a GPU-t, amelyben már megtalálható a szükséges gyorsítótárazott információ – így kihagyható az időigényes előtöltési fázis, és a rendszer gyorsabban válaszolhat. Ezt követően viszont a probléma lényege – a GPU-memória véges volta – továbbra is megmarad.

Áttörés: a tokenraktározás és a bővített memória

A helyzet megoldásához több út kínálkozik. Egyes cégek a modellek egyszerűsítésével próbálnak takarékoskodni a gyorsítótár által igényelt hellyel, mások a gyorsítótár-hatékonyságot növelik. Gyakori megoldás, hogy a KV-cache-t egy GPU állítja elő, majd megosztják, vagy helyi szerveren tárolják tovább.

A WEKA azonban egy teljesen új szemléletet hoz az Augmented Memory és a token warehousing (tokenraktározás) bevezetésével. Itt a kulcs–érték-gyorsítótár nemcsak a GPU-memóriában, hanem egy gyors, közös raktárban, az úgynevezett NeuralMesh architektúrán belül él tovább. Így a memória már nem szűk keresztmetszet, hanem rugalmasan bővíthető erőforrás lesz – mindezt várakozás vagy többletkésleltetés nélkül.

Ennek eredményeként a cache-találati arány 96–99% is lehet, a GPU-kon előállított tokenek száma pedig 4,2-szeresére nőhet. Vagyis 100 GPU olyan teljesítményt érhet el, mintha 420 GPU dolgozna egyszerre. Következésképpen hatalmas költségcsökkentés is lehetséges: néhány nagyobb szolgáltatónál napi több százmillió forintnyi megtakarítást eredményezhet ez a bővítés.


A folytatás még ennél is izgalmasabb

Az NVIDIA szerint az elkövetkező években akár százszorosára nőhet az MI-inferencia iránti igény. Ez már most leszivárog a legnagyobb szolgáltatóktól a hétköznapi vállalati rendszerekig. Ezt követően azok a cégek kerülnek előnybe, amelyek stratégiai fontosságúnak tekintik a memóriakezelést: költséghatékonyabbak lesznek, miközben javul a szolgáltatás minősége.

A memóriafal tehát nem pénzkérdés – az MI világában ez az első olyan infrastrukturális korlát, amely alapvető szemléletváltásra kényszeríti a piacot. Az elkövetkező MI-forradalom egyik döntő ütközete minden bizonnyal itt, a memóriakezelésben dől el.

2025, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 11:33

A Cisco végre betömte a hetek óta aktívan kihasznált biztonsági rést

🔒 A hálózati óriás, a Cisco végre kiadta a javítást egy kritikus súlyosságú hibára, amelyet hetek óta aktívan kihasználtak kiberbűnözők...

MA 11:17

Az NVLink Fusionnal végre adatközpontokba törnek a RISC-V processzorok

💻 Az NVIDIA újabb nagy lépést tett az MI-alapú adatközpontok világában: a SiFive nevű, nagy teljesítményű RISC-V processzorok fejlesztésére specializálódott cég is csatlakozott az NVLink Fusion ökoszisztémához...

MA 10:57

Az új Gootloader-trükk: ezres ZIP-csapda leselkedik a háttérben

🕵 A Gootloader nevű, 2020 óta aktív kártevő ismét visszatért, és most még trükkösebb módszerrel bújik meg a rendszeren...

MA 10:50

A Grok körüli botrány: perek, szexuális deepfake-ek, botladozó óriás

🔥 Ashley St. Clair, Elon Musk egyik gyermekének édesanyja, pert indított az xAI ellen, mivel szerinte engedélyezte, hogy a felhasználók a Grok MI-vel beleegyezése nélkül készítsenek róla szexuálisan explicit deepfake-képeket...

MA 10:43

Az új Google Pixel 9 tényleg feltörhető egyetlen üzenettel?

Az okostelefonokba beépített MI-alapú funkciók egyre kényelmesebbé teszik az életünket, de csendben tágítják a támadási felületeinket is...

MA 10:36

Az agy takarítói: áttörés az öregedés lassításában?

💡 Az élő sejteknek folyamatosan figyelniük kell saját összetevőiket, hogy időben megszabaduljanak a károsodott fehérjéktől, hibás szervecskéktől vagy behatoló baktériumoktól...

MA 10:29

Az Anthropic Indiában nagyot lép: érkezik a Microsoft-veterán

Az MI gyors térnyerése Indiában újabb fontos fordulatot vett: az amerikai Anthropic a Microsoft India korábbi ügyvezető igazgatóját, Irina Ghose-t nevezte ki helyi vezetőjének...

MA 10:22

Az OpenAI-vezér új startupja agyvezérelt jövőt ígér

Jellemző példa erre, hogy az OpenAI hatalmas befektetései után a mesterséges intelligencia terén most újabb izgalmas terület felé nyit: részesedést szerez a Merge Labsban, amely agy–számítógép-interfészek fejlesztésén dolgozik...

MA 10:15

Az univerzum vérvörös titkai: hogyan születnek a fekete lyukak?

💫 Az elmúlt években a James Webb űrteleszkóp (JWST) felvételein feltűnt furcsa vörös pontok hosszú ideig fejtörést okoztak a csillagászoknak...

MA 10:10

A kikötői friss hal bárhol az asztalon: forradalmi kiolvasztás

🍤 Egy kis forradalom zajlik a halfeldolgozásban: egy újfajta olvasztási módszerrel a fagyasztott hal pontosan olyan friss lesz, mintha egyenesen a kikötőből érkezett volna – akár több ezer kilométerre a tengertől is...

MA 10:02

Az erdők titkos fegyvere: így pörgethető fel a természetes megújulás

🌴 A trópusi erdők képesek akár kétszer olyan gyorsan is visszanőni kivágás után, ha a talajban elegendő nitrogén található – állítja egy friss, nagyszabású kutatás...

MA 09:57

Az Interactive Brokers belép a stabilcoinok világába

💰 Mostantól az Interactive Brokers ügyfelei bármikor, a hét minden napján feltölthetik brókerszámlájukat USDC stabilcoinnal, amelyet perceken belül dollárra váltanak, és jóváírnak a kereskedési számlájukon...

MA 09:50

A beragadt SOS-módból így szabadíthatod ki az iPhone-t

Első pillantásra úgy tűnt, hogy páran csak furcsa kijelzést látnak a telefonjuk tetején, amikor a Verizon szolgáltatása a héten több millió embert meglepetésszerűen hagyott hálózat nélkül...

MA 09:43

A Meta új kudarca: leáldozott a virtuális irodáknak

💼 A Meta ismét rossz híreket közölt a VR-rajongókkal: megszünteti a Horizon Workrooms alkalmazást, amelyet eredetileg vállalati együttműködésre tervezett virtuális térnek szánt...

MA 09:37

A tajvani mentőöv 91 ezer milliárd forinttal menti az amerikai chipgyártást

🌐 Az Egyesült Államok új gazdasági megállapodást kötött Tajvannal, amelynek keretében tajvani félvezetőipari és technológiai cégek 250 milliárd dollár (kb...

MA 09:30

Az öröklött vakság talán mégsem végzet?

👀 Genetikai kutatások évtizedeken át azt sugallták, hogy egyes örökletes génváltozatok szinte minden esetben vaksághoz vezetnek...

MA 09:22

A Nano Banana tarol a neten: ki áll mögötte?

Aki valaha találkozott MI-alapú képgenerátorokkal, nagy eséllyel látott már Nano Banana által készített képet, akár anélkül is, hogy tudta volna...

MA 09:15

Az ősi kannabiszenzimek visszatérnek: új korszak jön az orvoslásban?

🌾 A Wageningeni Egyetem kutatói sikeresen rekonstruálták a kannabisz évmilliókkal ezelőtti enzimjeit, amelyek kulcsszerepet játszottak a jól ismert hatóanyagok – például a THC, CBD és CBC – kialakulásában...

MA 09:08

Az eltitkolt igazság: a Boeing tudott a végzetes UPS-géphibáról

📦 Egy 2023 novemberében, Kentuckyban lezuhant UPS MD-11F teherszállító repülőgépen kritikus szerkezeti hibát találtak a nyomozók, amelynek veszélyeiről a Boeing már 15 évvel korábban tudott hasonló típusoknál...