
A MI-ügynökök emlékezete: jelenlegi állapot
Az MI-infrastruktúrában az ügynökök memóriája az egyik leggyorsabban fejlődő terület. Újabb és újabb nyílt forráskódú könyvtárak, szolgáltatások, kutatási prototípusok jelennek meg, amelyek mind másféleképp tárolnak, keresnek vissza emlékeket, és különböző célokra születtek. A gond azonban az, hogy ahogy növekszik a kontextusablak mérete (akár több mint 1 millió tokenig), úgy válik egyre nehezebbé az információk hosszú távú észszerű kezelése.
A jelenlegi megoldások között vannak háttérben dolgozó, menedzselt szolgáltatások, valamint teljesen önállóan futtatott emlékezetrendszerek is. Egyesek szigorúan szabályozott API-n keresztül működnek, kizárva a közvetlen memóriakezelést az ügynök fő logikájából, mások a modellt engedik, hogy közvetlenül adatbázishoz férjen, és ezáltal értékes kontextustokeneket pazarolnak tárolásra és keresésre.
Az Agent Memory a menedzselt, visszakeresés-alapú architektúrában hisz, amely API-n keresztül működik, így optimalizálva a költséget, teljesítményt és logikai komplexitást valódi, hosszú távú MI-projekteknél. Itt az emlékek strukturáltan, elérhetően, de elkülönítve élnek: így az ügynökök nem terhelik feleslegesen a kontextust, és jobban boldogulnak az összetett feladatokkal.
A használat folyamata
Az Agent Memory minden egységét egy profil azonosítja, amelyben a felhasználó tárolhatja, visszahívhatja, listázhatja és törölheti az emlékeket, akár komplett beszélgetésekből, akár kiragadott információkból. Tipikus műveletek: beszélgetések tömeges feldolgozása, konkrét emlékek eltárolása, kérdésekre válaszadás az emlékekből.
Használható közvetlenül bármilyen Cloudflare Workerből kötésen keresztül, vagy REST API-hoz kapcsolva, így azok az ügynökök is hozzáférnek, amelyek nem Workers-környezetben futnak.
Mire jó az Agent Memory?
A szolgáltatás rugalmassága miatt szinte bármilyen MI-ügynök (legyen az Claude Code, OpenCode vagy egyedi fejlesztés) megszerezheti vele az állandó, konzisztens memóriát, anélkül, hogy az ügynök logikáját módosítani kellene. De nem csak egyéni ügynökök profitálnak: fejlesztői csapatok közös profilt oszthatnak meg, így az egyik tag programozóügynöke által tanultak a többiek számára is elérhetők lesznek – legyen szó kódolási szokásokról, döntésekről vagy rejtett, egy-egy ember fejében élő tudásról. Még a kódreview-botok és programozóügynökök is megoszthatják memóriájukat, hogy a visszajelzéseik hosszú távon formálják a generált kódok minőségét.
Az emlékek tényleg a tiéd maradnak
Az MI-ügynökök által felhalmozott emlékek valós szervezeti tudást képviselhetnek, ezért nem mindegy, hogy ezeket mennyire egyszerű más helyre átköltöztetni. Az Agent Memory menedzselt szolgáltatás, de minden adat bármikor exportálható. A Cloudflare elkötelezte magát amellett, hogy a szerzett tudást később is ki lehessen menteni, ha a felhasználó más platformra váltana.
Hogyan működik a rendszer?
Az MI-ügynök három fő részből áll: a harness (amely kezeli a modellhívásokat, az eszközhasználatot és az állapotot), maga a modell (amely választ ad), valamint az állapot, amely tartalmazza az aktuális kontextust, a beszélgetéstörténetet, a fájlokat és a memóriát.
Az Agent Memory két fő ponton kapcsolódik az életciklushoz:
– tömeges beszélgetésfeldolgozásnál: amikor a harness tömöríti a kontextust, az Agent Memory kinyeri és deduplikálja a tényeket, eseményeket, instrukciókat és aktuális feladatokat, majd későbbi visszakeresésre eltárolja őket;
– a modell közvetlenül is képes fontos dolgokat emlékezetbe vésni, visszahívni, listázni vagy törölni.
Kiemelkedő feldolgozás, gyors keresés
Az Agent Memory memóriaszerkesztése és -keresése több lépésből áll: minden üzenet egyedi hash-t kap, majd párhuzamos feldolgozással értelmezi a beszélgetés részleteit, az időhöz kötött információkat, és strukturálja a szereplőket, feladatokat, utasításokat. Ellenőrzi a kivont emlékeket, majd tény, esemény, instrukció vagy feladat típus szerint rendezi őket. A kulccsal azonosított tények verzióláncba szerveződnek; ha új információ érkezik ugyanazzal a kulccsal, az újabb felülírja a régit.
Kereséskor ötféle csatorna fut egyszerre: kulcsszavas keresés, konkrét tényazonosító-egyezés, teljes szöveges keresés, vektoralapú beágyazásos keresés, illetve olyan keresés, amely elképzeli a lehetséges választ, így absztrakt kérdésekre is jó eredményt ad. Ezek eredményeit egyesítve, az újdonság súlyozásával, valamint a leginkább releváns tények előtérbe helyezésével ad válaszokat.
Mire használja ezt maga a Cloudflare?
A Cloudflare saját fejlesztésű MI-eszközeiben is élesben használja az Agent Memoryt – például az OpenCode pluginban, ügynöki kódreview-hoz vagy vállalati chatbotban, ami képes előző beszélgetésekből válaszokat adni. A tapasztalat azt mutatja, hogy nemcsak okosabbak lettek az ügynökök, hanem kevésbé „zavarnak” a korábban már megbeszélt, elvetett dolgokkal – ez növeli az együttműködés hatékonyságát.
Fejlesztések, jövőkép
A cég folyamatosan fejleszti a szolgáltatást, egyre pontosabb kinyerő- és keresőalgoritmusokat fejlesztve, valamint gyorsabb háttérfeldolgozást, aszinkron tanulási funkciókat vezet be – ahogyan az emberi agy is az alvás alatt rendezi emlékeit. Hamarosan a nyilvánosság számára is elérhető lesz az Agent Memory. Akik mihamarabb kipróbálnák, jelentkezhetnek a várólistára.
