MA 08:37

A 0,12%-os trükk, amitől az MI tényleg emlékezik

A 0,12%-os trükk, amitől az MI tényleg emlékezik
Amikor a mesterségesintelligencia-ügynökök egy korábbi hibakeresést elfelejtenek, vagy egy adatelemző rendszer újra ugyanazzal a kontextussal dolgozik, mindez lelassítja a működést, növeli a költségeket, és törékennyé teszi a folyamatokat. Az iparág eddig két fő megoldással kísérletezett: folyamatosan bővítette a kontextusablakot, vagy egyre több dokumentumot hívott be külső adatforrásokból (visszakereséssel támogatott szöveggenerálás, azaz retrieval-augmented generation, RAG). Ezek drágulnak, mégsem vezetnek megbízható eredményhez. Nem hagyható figyelmen kívül, hogy a Mind Lab kutatói és több egyetem csapata egy új eljárást javasolt: egy apró, a modellhez képest mindössze 0,12 százaléknyi plusz paraméterrel dolgozó modult, amely dinamikusan sűríti a rendszer múltbeli információit egy frissíthető mátrixba, anélkül, hogy magát az MI-t kellene módosítani. Ez az úgynevezett delta-mem felülmúlja a riválisokat, mivel minimális többletköltséggel képes a történeti adatok folyamatos feldolgozására és újrahasznosítására. Ez jelentősen csökkenti a végtelenül tág kontextusablakok, valamint a nehézkes, külső hivatkozási rendszerek szükségességét.

Az MI emlékezete: eddigi zsákutcák

Bár triviálisnak tűnik mindent a kontextusablakba önteni, valójában a mai rendszerek csak kontextusmenedzsmenttel próbálkoznak: vagy egyre bővítik az ablakot, vagy több dokumentumot szállítanak be külső forrásból. Ezek azonban gyorsan költségessé, lassúvá és törékennyé válnak, ha az MI-ügynököknek hosszú interakciókon kell helytállniuk, ráadásul ezek a megoldások nem hasonlítanak az emberi memóriára – egyszerű keresgélés történik, nem igazi emlékezés.

A fő gond az, hogy a vállalati modelleknek nemcsak hozzáférniük kell a múlthoz, hanem azt hatékonyan, folyamatosan kell újrahasznosítaniuk késleltetés nélkül. Az alapértelmezett „figyelem” eljárás számításigénye a szekvenciák növekedésével négyzetesen nő. Ráadásul a hatalmas kontextusablak sem garantálja, hogy a rendszer jól fog emlékezni, hiszen az túl gyorsan túlterhelődik, információvesztés és kontextusromlás lép fel, még akkor is, ha elméletileg egymillió token támogatott.

Korábbi próbálkozások három fő irányban mozognak:
– Textuális memória: a történetet szövegként fűzi a kontextushoz, de az ablak mérete szab határt, és tömörítéskor adatvesztés jön.
– Külső csatorna (RAG): külső modulba kódol, és onnan hív vissza információt, ami késleltetést, bonyolult integrációt és eltéréseket okozhat.
– Parametrikus: a memóriát adaptereken keresztül a modell súlyaiba kódolják, viszont utólag már nem tanulhat új dolgokat online, csak statikusan.

Mi zajlik a delta-mem belsejében?

A delta-mem lényege, hogy az ügynök előző interakcióit egy fix méretű (például 8×8-as) mátrixba tömöríti, így mindig fennmarad egy frissíthető, asszociatív emlékállapot (OSAM). A háttér MI-modellt (például Qwen3-4B-Instruct vagy SmolLM3-3B) közben egyáltalán nem kell módosítani – a hozzáadott memória gyakorlatilag minden paraméterből csak törtrésznyi többlet.

Ez különösen előnyös azoknál a vállalati folyamatsoroknál, ahol az MI-nek érdemes emlékezni projektszokásokra, feltárt hibákra, felhasználói igényekre, vagy olyan döntésekre, amelyek később relevánsak lesznek. Ahelyett, hogy újra és újra elő kellene hívni és újratömöríteni teljes szegmenseket, a delta-mem modul minden egyes előrehaladásnál egy, a kontextus szempontjából releváns korrekciós jelet nyer ki, amit numerikus módosítások formájában bevisz a számításba. Így vezeti az MI gondolkodását anélkül, hogy annak belső paramétereit fizikailag kicserélné.

A memória folyamatosan frissül egy delta-szabály szerinti tanulással: az új esemény alapján a rendszer megpróbálja előre jelezni, hogyan változik a figyelem, majd az eltérés alapján módosítja a mátrixot. Ezt egy „kapuzott delta-szabály” (gated delta-rule) vezérli: szabályozható, mennyi korábbi emléket tartson meg, és mennyit engedjen át az új ingerből. Ez az irányított felejtés lehetővé teszi, hogy az igazán lényeges múltbeli kapcsolatok tartósak maradjanak, a pillanatnyi zavaró jelek viszont kiszűrhetők.

Delta-mem eredmények: teszteken, valódi helyzetekben

A delta-mem modult három LLM-en is letesztelték (Qwen3-8B, Qwen3-4B-Instruct, SmolLM3-3B) 8×8-as mátrixokkal. Tesztelték általános képességet vizsgáló teszteken (pl. HotpotQA, GPQA-Diamond, IFEval), de extrém memóriaigényes feladatokon is: LoCoMo (hosszú beszélgetési emlékezet), Memory Agent Bench (megtartás, visszahívás, szelektív felejtés, teszt alatti tanulás).

Az új megoldás minden eddigi modellt felülmúlt. Például Qwen3-4B-Instruct alapokon a tokenállapot-írás átlagosan 51,66 százalékos pontosságot produkált, szemben az alapverzió 46,79 százalékával és a legjobbnak számító rivális 44,9 százalékával. Memóriafókuszú teszten a pontszám majdnem duplázódott: 26,1 százalékról 50,5-re emelkedett. Kiemelendő, hogy explicit kontextus nélkül, amikor a rendszer múltbeli szöveget nem kapott vissza, a delta-mem képes volt több lépcsős gondolatmenetek során is a helyes bizonyítékot visszanyerni – mindezt mindössze 4,87 millió plusz tanulható paraméterrel, ami a nagy, többmilliárd paraméteres alapok (például MLP Memory) igényeinek töredéke.

A különféle frissítési stratégiák eltérő modelleken különböző haszonnal járnak: az erősebb modelleken (Qwen3-8B) a szekvenciaszintű írás, kisebbeken (SmolLM3-3B) a többállapotú szétválasztás javítja az eredményeket.


Bevezetés a való világban és korlátok

A delta-mem teljes, nyílt forráskódú implementációja már letölthető. Bevezetni egy létező, utasításérzékeny MI-alapra rendkívül egyszerű: csak adaptermodult kell csatlakoztatni a figyelmi rétegekhez, majd némi célszerű tanítással (régi beszélgetések, workflow-adatok) már online, élesben is alkalmazható. Nem kell többé hatalmas előtanító adathalmazokat betáplálni, csak célzott, releváns memóriamintázatra van szükség.

Meg kell azonban jegyezni, hogy a mátrixos összegzés sosem lesz veszteségmentes. Ha egymással versengő emlékeket kell osztoztatni egy kompakt állapottéren, szükségszerűen előfordul keveredés – ezért ténybeli ellenőrzésre, auditálhatóságra, vagy például orvosi információtárolásra továbbra is a hagyományos RAG és vektoralapú keresés lesz a nyerő.

Egyértelmű, hogy a jövőben a legjobb vállalati architektúra hibrid lesz: a delta-mem a gyors, rövid távú működési memóriát biztosítja, a RAG és más explicit visszahívási rendszerek adják a hosszú távú, pontos tárhelyet. Így a rendszer mindig az optimális helyről emlékezik vissza, és csak azt tartja „fejben”, amire a munkafolyamat miatt valóban szükség van.

2026, adminboss, venturebeat.com alapján

  • Te szerinted miért fontos, hogy az MI rendszerek jól emlékezzenek a múltra?
  • Te a hagyományos vagy az új emlékezeti megoldást választanád hasonló helyzetben?


Legfrissebb posztok

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/22

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad)A Planetary Hours alkalmazás lehetővé teszi, hogy mindennapi tevékenységeinket a kozmikus ciklusokhoz igazítsuk...

MA 09:10

Az amerikaiak nem ismerik fel a deepfake-eket – nemcsak fogyasztói baj, üzleti válság

💁 Az interneten terjedő hamisított tartalmak már nem csupán a hétköznapi emberek tájékozódását nehezítik meg, hanem komoly üzleti kockázatot is jelentenek...

MA 09:01

A Bitcoin 77,7 ezernél; az elemzők a 75 ezres támaszt lesik

💰 A Bitcoin árfolyama a 77 700 dolláros (kb. 28,2 millió forint) szinten stabilizálódott egy gyors lejtmenet után, amely rövid időre 76 685 dollárig (kb...

MA 08:55

Az új tengeri T. rex: koponyazúzó harapású texasi rém

Több évtizedes tévedésre derült fény, amikor tudósok rájöttek, egy Texasban előkerült óriás tengeri ragadozó nem az volt, aminek eddig hitték...

MA 08:46

Az elveszett bitcoin-milliárdok megúszhatják a kvantumtámadásokat?

A digitális vagyonok biztonsága új fordulatot vesz, miután előtérbe került egy új védelmi megoldás, amely képes lehet megóvni a legnagyobb veszélyben lévő bitcoinokat – köztük Satoshi Nakamoto legendás, 1,1 millió darabos készletét is...

MA 08:28

A „zombi” sejtek nem mindig rosszak – forradalom az öregedésgátlásban

A tudományos világ egyre intenzívebben kutatja az öregedés folyamatát, és most új fényt vetnek az úgynevezett „zombi sejtek” szerepére...

MA 08:19

A James Webb-űrtávcső ritka óriásbolygót talált, meglepően földszerű hőmérséklettel

Egy eddig példátlanul részletes kutatással vizsgálták meg az univerzum egyik legritkább óriásbolygóját – amelynek hőmérséklete meglepően közel áll a Földön megszokotthoz...

MA 07:47

Az MSI Roamii BE Pro: megfizethető, villámgyors Wi‑Fi 7 mesh rendszer

🖥 Az MSI Roamii BE Pro már első pillantásra kitűnik a mezőnyből: a fehér, prizmaszerű dizájn és az alsó RGB-világítás elegáns, modern megjelenést ad az eszköznek...

MA 07:37

Az MFA beenged, de utána bármi megtörténhet

A legtöbb cég biztonsági rendszere megnyugtatóan zöld: minden belépési ellenőrzés rendben, a multifaktoros azonosítás (MFA) hibátlanul működik, és minden felhasználó szabályosan lépett be...

MA 07:18

A Radiohead szólt, amikor Harry Styles elvesztette a szüzességét

Arra a kérdésre, hogy milyen zenét hallgatnak az emberek életük jelentős pillanataiban, Harry Styles most elárulta, hogy első szexuális élménye során a Radiohead szólt a háttérben...

MA 07:11

A rádiócsillagászok biztosak benne: az idegen kapcsolat csak idő kérdése

Öt évtizeddel ezelőtt Frank Drake, a híres csillagász és rádiócsillagász, merész lépést tett...

MA 07:01

A Destiny 3 egyelőre parkolópályán, leépítések a Bungie-nál – Bloomberg szerint

Bár sokan remélték, hogy a Destiny 2 lezárása után rögtön elkezdődik a következő epizód fejlesztése, erre most biztosan hosszú ideig nem kerül sor...

MA 06:55

A 800 éves ölelkező csontvázak: genetikailag igazolt, Lengyelország egyetlen középkori nő–nő párossírja

🕊 Nyolcszáz évvel ezelőtt két embert temettek el szorosan egymás mellett egy lengyelországi templom falánál...

MA 06:37

Az Ethereum identitásválsága mélyül: agyelszívás frusztrálja a közösséget

😕 Az Ethereum körül egyre nagyobb a bizonytalanság, mióta kulcsfontosságú szereplők távoztak az Ethereum Alapítványból...

MA 06:28

Az atomok elárulták: a negatív idő tényleg létezik

🔮 Fény és némi kvantumvarázslat: tudósok nem mindennapi kísérlettel igazolták, hogy a fény valóban képes „negatív időt” tölteni egy atomfelhőben...

MA 06:18

A milliárdos Mark Cuban kiábrándulva eladta bitcoinjainak többségét

💸 Milliárdos befektetőként Mark Cuban eddig a Bitcoin egyik nagy híve volt, de most jelentős fordulatot vett: a legtöbb Bitcoint eladta, mert csalódott a kriptovaluta válság idején menekülőeszközként betöltött szerepében...

MA 06:05

Történelmi események a mai napon (Május 22.)

Viharos nap a történelemben: a valaha mért legerősebb földrengés Chilében, modern terrortámadások Európában, és mérföldkövek a technika és jog történetében...

MA 06:01

A fényt foglyul ejtő egyszarvú hullámok a tudomány határain túl

Kutatók évtizedek óta küszködnek azzal, hogy a fényalapú eszközöket olyan kicsire zsugorítsák, mint az elektronikus áramköröket...

csütörtök 21:56

Egy hétköznapi asztmagyógyszer lehet a makacs, agresszív rákok új ellensége

💉 Régi ismerős kerülhet új szerepbe a daganatos kezelések világában: egy közismert asztmagyógyszer, a montelukaszt lehet a kulcs a nehezen kezelhető rákok, például az agresszív, hármas negatív emlődaganat leküzdésében...

csütörtök 21:45

Az Assassin’s Creed IV: Black Flag példamutató felújítást kapott

Fontos kérdés, hogy mennyit változhat egy legendás játék, miközben hű marad az emlékeinkhez...

csütörtök 21:34

MoonPay új banki platformmal tör be a tokenizált eszközök és DeFi piacára

💰 A MoonPay eddig főként kriptopénzes fizetésekkel foglalkozott, de most nagyot lép előre: elindította a MoonPay Trade nevű platformot, amely lehetővé teszi, hogy a bankok, fintech cégek és nagyvállalatok egyetlen integráción keresztül férjenek hozzá tokenizált eszközökhöz, decentralizált pénzügyi (DeFi) protokollokhoz és stabilcoin-likviditáshoz, több mint 200 blokklánc-hálózaton...

csütörtök 21:25

Az MI-kódolás őrülete tönkreteszi az éles rendszereket – jön a megoldás

A fejlesztői világ óriási átalakuláson megy keresztül, mióta az MI-eszközök képesek emberi sebességgel kódot írni...

csütörtök 21:11

Az Ozempic-szerű fogyókúrás szerek csökkentik a szívinfarktus és a stroke kockázatát

A legújabb kutatás jelentős áttörést hozott az elhízás és a szív- és érrendszeri betegségek elleni küzdelemben...

csütörtök 21:01

Az MI önkannibalizálása megfékezhető – a tudósok megoldást találtak

A mesterséges intelligencia fejlődése megállíthatatlan, de egyre nagyobb aggodalom övezi, hogy a nagy nyelvi modellek hamarosan kifogynak a hiteles, ember által készült adatokból...

csütörtök 20:56

A Variational 50 milliót vont be, a kört a Dragonfly vezeti

A Variational nevű, a Kajmán-szigeteken bejegyzett digitális piactér 50 millió dollárból, vagyis mintegy 18,5 milliárd forintból fejlesztheti tovább peer-to-peer kereskedési rendszerét...

csütörtök 20:45

Az Artemis ügynökplatformmal a Kore.ai kihívja a Microsoftot és a Salesforce-t

A Kore.ai alaposan felforgatja a vállalati MI-ügynökök piacát az új Artemis platform bemutatásával, amellyel forradalmian gyorssá és egyszerűvé válik az ügynökök fejlesztése, menedzselése és optimalizálása...

csütörtök 20:23

Az Overwatchban egy játékos zseniális trükkel tesz rendet a meccseken

Egy kreatív Overwatch-játékos egy merőben új ötlettel állt elő, amellyel rávenné a társakat a játék alapjainak betartására...

csütörtök 20:12

Az igazi kínai Átalakuló: négy lábon száguldó, két lábon lépő óriásrobot

Kínai mérnökök megalkották a GD01 nevű óriásrobotot, amely néhány másodperc alatt képes átváltani a kétlábon járásról a négy lábon való futásra...

csütörtök 20:01

A hétköznapi rovarirtó rejtett agykárosodást okozhat

A magzati korban elszenvedett klórpirifosz (CPF) nevű vegyszernek való kitettség hosszú távú agyi elváltozásokat és romló mozgáskészségeket idéz elő a gyerekeknél – erre jutottak a Columbia Egyetem, a Los Angeles-i Gyermekkórház és a USC Keck Orvosi Kar kutatói 270 gyermek bevonásával...