2026. 01. 15., 18:02

Az MI memóriája: forradalom a tokenkezelésben

Az MI memóriája: forradalom a tokenkezelésben
A fejlett MI-ügynökök lassan kilépnek a laboratóriumokból, és belépve az üzleti életbe, egy alig említett, de annál súlyosabb problémával szembesülnek: a memóriával. Nem a számítási teljesítménnyel, nem a modellekkel – hanem a memóriával. A mai GPU-k memóriája egyszerűen nem tud lépést tartani azokkal a kulcs-érték (KV) gyorsítótárakkal, amelyeket korszerű, hosszan futó MI-eljárások használnak a kontextus megőrzésére. Következésképpen óriási a pazarlás: a GPU-knak újra és újra el kell végezniük olyan műveleteket, amelyeket egyszer már kiszámoltak. Ez jelentős költségnövekedést és teljesítményromlást eredményez, miközben a gyorsítótár telítődése miatt folyamatosan elvesznek korábban feldolgozott adatok.

Miért bukik el az MI a memórián?

A transformer-alapú nyelvi modellek minden egyes feldolgozott token kontextusát egy KV-cache-ben tárolják. Minél nagyobb a párbeszéd vagy a feldolgozandó anyag, annál több memóriát igényel ez a gyorsítótár. Egyetlen 100 000-tokenes szekvencia akár 40 GB GPU-memóriát igényelhet, miközben a legerősebb grafikus kártyák is csak 288 GB HBM-mel rendelkeznek, amelyben azonban a modell is helyet foglal.

Valós környezetben – például többfelhasználós rendszerekben, ahol forráskódot fejlesztenek vagy adóbevallásokat dolgoznak fel – a gyorsítótár kihasználása gyorsan eléri a maximumot. Három vagy négy nagyobb PDF betöltése után a KV-cache máris megtelik, és kénytelen eldobni régi adatokat. Az MI-rendszer így elveszíti a kontextus folytonosságát, nem képes tartós emlékezetet fenntartani.

Az elrejtett költség: az újraszámolási adó

A GPU-k egyre gyakrabban számolnak újra már egyszer elvégzett műveleteket: feltöltik a gyorsítótárat, dekódolnak, kifogynak a tárból, törlik a régi adatokat – majd kezdődik elölről az egész. Ezzel akár 40 százalékos felesleges energia- és számítási igényt generálnak, ami komolyan drágítja az MI-alapú szolgáltatásokat.

A szolgáltatók ezért már arra tanítják a felhasználóikat, hogy a promptjaikat úgy építsék fel, hogy lehetőleg elérjék azt a GPU-t, amelyben már megtalálható a szükséges gyorsítótárazott információ – így kihagyható az időigényes előtöltési fázis, és a rendszer gyorsabban válaszolhat. Ezt követően viszont a probléma lényege – a GPU-memória véges volta – továbbra is megmarad.

Áttörés: a tokenraktározás és a bővített memória

A helyzet megoldásához több út kínálkozik. Egyes cégek a modellek egyszerűsítésével próbálnak takarékoskodni a gyorsítótár által igényelt hellyel, mások a gyorsítótár-hatékonyságot növelik. Gyakori megoldás, hogy a KV-cache-t egy GPU állítja elő, majd megosztják, vagy helyi szerveren tárolják tovább.

A WEKA azonban egy teljesen új szemléletet hoz az Augmented Memory és a token warehousing (tokenraktározás) bevezetésével. Itt a kulcs–érték-gyorsítótár nemcsak a GPU-memóriában, hanem egy gyors, közös raktárban, az úgynevezett NeuralMesh architektúrán belül él tovább. Így a memória már nem szűk keresztmetszet, hanem rugalmasan bővíthető erőforrás lesz – mindezt várakozás vagy többletkésleltetés nélkül.

Ennek eredményeként a cache-találati arány 96–99% is lehet, a GPU-kon előállított tokenek száma pedig 4,2-szeresére nőhet. Vagyis 100 GPU olyan teljesítményt érhet el, mintha 420 GPU dolgozna egyszerre. Következésképpen hatalmas költségcsökkentés is lehetséges: néhány nagyobb szolgáltatónál napi több százmillió forintnyi megtakarítást eredményezhet ez a bővítés.


A folytatás még ennél is izgalmasabb

Az NVIDIA szerint az elkövetkező években akár százszorosára nőhet az MI-inferencia iránti igény. Ez már most leszivárog a legnagyobb szolgáltatóktól a hétköznapi vállalati rendszerekig. Ezt követően azok a cégek kerülnek előnybe, amelyek stratégiai fontosságúnak tekintik a memóriakezelést: költséghatékonyabbak lesznek, miközben javul a szolgáltatás minősége.

A memóriafal tehát nem pénzkérdés – az MI világában ez az első olyan infrastrukturális korlát, amely alapvető szemléletváltásra kényszeríti a piacot. Az elkövetkező MI-forradalom egyik döntő ütközete minden bizonnyal itt, a memóriakezelésben dől el.

2025, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 18:02

A hosszú élet kulcsa a bélflóránkban rejlik?

🌱 Miközben az örök fiatalság titkát egykor a mesés Ifjúság forrásában keresték, a legújabb kutatások szerint a válasz jóval közelebb lehet: a saját bélmikrobáinkban...

MA 17:58

A profi kamerákat is lepipálja az új Vivo X300 Ultra?

A vivo hamarosan bemutatja X300 Ultra csúcstelefonját, amely minden eddiginél ígéretesebb kameratechnológiával érkezik...

MA 17:41

Az égbolt végnapjai: egymillió műhold árnyékában

🌑 A tizenéves korom egyik emlékezetes pillanata volt, amikor először láttam egy műholdat átsuhanni az éjszakai égen...

MA 17:20

Az MI körüli szerzői jogi káosz újabb csúszást okoz

⚠️ Nagy vitát kavart az Egyesült Királyság kormányának terve, hogy az MI-cégek – például a Google vagy az OpenAI – szabadon felhasználhassák szerzői joggal védett tartalmakat MI-modellek tanítására...

MA 17:02

Az új Gmail: itt az MI-asszisztens kora mindenkinek

A Gmail az MI forradalmának élére áll, és 2025-ben új korszakot nyit a mindennapi levelezésben...

MA 16:58

A Samsung böngésző mostantól új néven fut

Erre utal többek között az is, hogy a Samsung Androidos böngészője mostantól nem Internet, hanem egyszerűen csak Browser néven fut a legújabb eszközökön...

MA 13:59

A láthatatlan konyhai ellenség, ami tönkreteszi az öntöttvas serpenyőt

Az öntöttvas edények időtállóságukról, kiváló hőeloszlásukról és a tökéletes pirítási képességükről híresek...

MA 13:39

Az Anthropic beperli a Pentagont a kockázati besorolás miatt

Az Anthropic vezérigazgatója, Dario Amodei bíróságon támadja meg a Védelmi Minisztérium döntését, miután hivatalosan is értesítették a céget az ellátásilánc‑kockázati besorolásról...

MA 13:23

Az MI agyégető kora: amikor már túl sok a gép

Ahogy a munkahelyeken egyre elterjedtebbek az MI-eszközök, sokan tapasztalnak egy új típusú mentális kimerülést...

MA 12:02

A klímakatasztrófák romba döntötték az ókori Kína társadalmát

Háromezer évvel ezelőtt Kína belső területein radikális társadalmi változások és drámai népességcsökkenés következett be, amelyet hosszú ideig talány övezett...

MA 12:01

A mesterséges intelligencia végleg átírja a szoftverlicencek szabályait?

Az elmúlt héten óriási vihart kavart a programozói közösségben a chardet nevű, karakterkódolás-felismerő Python-könyvtár újrakiadása...

MA 11:39

Az eszköz, amely végre tényleg elnémítja a lehallgatókat

Az okostelefonokkal és mindenféle beépített mikrofonnal telített világban egy őszinte beszélgetés szinte lehetetlenné vált – mindenhol ott leselkednek a folyamatosan figyelő eszközök...

MA 11:20

A suli menőinek titkos fegyvere: a ChatGPT

😎 Komolyan mondom, hogy ma már a tini fiúk nem egymásnak súgják, mit írjanak a csajoknak, hanem inkább a ChatGPT-hez rohannak, ha üzenetről vagy az első lépésről van szó...

MA 11:02

Az MI tényleg elveszi a melódat? Egyszerre vicces és para

A nagy MI-pánik újra dübörög, de az igazság az, hogy hiába tanulnak a szoftverek kódolni, mémeket gyártani, csetelni, vagy akár jogi esettanulmányok villámgyors összefoglalására, nem hiszem el, de a laptopos melósok többsége most sem lett munkanélküli...

MA 10:55

A valódi női ellenség nem a fejfájás – ki óvja a szívünket?

❤️ A fiatal nők szívbetegség miatti halálozása egyre nő, miközben sokan fel sem ismerik a vészjeleket...

MA 10:46

Az ausztrál koalák meglepő túlélési trükkje: így verik át a genetikai szűkületet

Az ausztrál koalák példája új reményt ad a veszélyeztetett fajoknak. A tudósok genomikai vizsgálatai szerint még a jelentős genetikai szűkületek sem szükségszerűen okoznak végzetes beltenyésztési depressziót, vagyis egy állatfaj nem feltétlenül hal ki a genetikai változatosság csökkenése miatt...

MA 10:38

A szuperszonikus elektronkilövés átírhatja a napelemek szabályait

⚡ Fontos kérdés, hogyan lehetne a napenergiát hatékonyabban átalakítani villamos energiává. Nemrégiben a Cambridge-i Egyetem tudósai olyan elképesztően gyors elektronmozgást figyeltek meg, amely teljesen átírhatja a napenergiával kapcsolatos elgondolásokat: az elektronok mindössze 18 femtoszekundum – vagyis kevesebb mint 20 billiárdod másodperc – alatt száguldottak át a napelemekben használt anyagon, egyetlen molekularezgés alatt...

MA 10:30

Az okostávcső, amelytől minden csillaglesőnek leesik az álla

A SeeStar S50 forradalmasítja az asztrofotózást azzal, hogy kompakt méretével és elérhető árával bárki számára lehetővé teszi az univerzum csodáinak megörökítését...

MA 10:20

Az okosszemüvegek botránya: Végleg búcsút inthetünk a magánszférának?

👀 Egy lényeges szempont, hogy a Meta Ray-Ban okosszemüvegeit használók magánpillanatait külső cégek munkatársai is megfigyelhették...

MA 10:01

Az X most pénzért árulja a tweetek végét – komolyan?

Vadiúj frissítéssel rukkolt elő az X (a régi Twitter, amely már nem akar ránk hallgatni), és mostantól nemcsak az influenszered bugyijába, hanem a tweetjeibe is pénzt kell dobni, hogy lásd, mi a vége!..

MA 09:57

Az elképesztően ellenálló baktérium, amely a Marson is túlélhet

👽 A lassított felvételen két acéllemez ütközését láthatjuk, amelyek közé mikrobákat szorítottak – a pusztító ütközést követően ezeknek a parányi élőlényeknek mégis sikerült túlélniük azt, amit a kísérleti berendezés már nem bírt ki...

MA 09:46

Az első kereskedelmi Natrium-reaktor zöld utat kapott, de még nem indulhat

⚡ Többek között Bill Gates támogatásával a TerraPower évek óta azon dolgozik, hogy megépítse saját Natrium típusú, nátriummal hűtött nukleáris reaktorát az amerikai Wyoming államban, Kemmerer városában...

MA 09:37

Az első Sony 200 MP-es szenzoros mobil: megérkezett a Vivo X300 Ultra

📸 A Vivo X300 Ultra hamarosan új korszakot nyithat a mobilfotózásban, ugyanis ebbe a telefonba építik be először a Sony vadonatúj, 200 megapixeles LYTIA 901 szenzorát...

MA 09:30

A forradalmi OpenAI GPT-5.4 már a gépeden fut

A mesterséges intelligencia fejlődésének új mérföldkövét hozta el az OpenAI a GPT-5...

MA 09:20

A kozmikus lepel fellebben: végre látható a Tejútrendszer

🛰 Érdemes megvizsgálni, miért távolodik a legtöbb közeli galaxis a Tejútrendszertől, amikor annak gravitációjának elvileg magához kellene vonzania őket...

MA 09:10

Az AWS mesterséges intelligenciával forradalmasítja az egészségügyet

🩺 Az Amazon Web Services bejelentette az Amazon Connect Health nevű új platformot, amely mesterséges intelligenciával segíti az egészségügyi szervezeteket a mindennapi adminisztrációs terhek csökkentésében...

MA 09:02

Egy önmagát terjesztő kártevő letarolta a Wikipédiát

A Wikimédia Alapítvány a napokban egy gyorsan terjedő JavaScript-féreggel nézett szembe, amely felhasználói szkripteket módosított és vandalizmust okozott a Meta-Wiki oldalain...

MA 08:55

Az új kínai kémprogramcsomag a távközlési szolgáltatókat veszi célba

Latin-Amerika távközlési szolgáltatóit 2024 óta veszik célba azok a kínai államhoz köthető hackerek, akiket UAT-9244 fedőnéven azonosítottak...

MA 08:47

Az Apple új MacBook Neo végre megfizethető áron

Véget ért a várakozás, mostantól bárki megfizethető áron juthat MacBookhoz, aki eddig csak vágyakozott a drágább modellek után...