MA 06:57

Az MI-ügynök önállósodik: érkezik az önjavító kód

Az MI-ügynök önállósodik: érkezik az önjavító kód
A jelenlegi autonóm MI-ügynökök legnagyobb kihívásai közé tartozik, hogy miként tudnak alkalmazkodni a folyamatosan változó környezetükhöz anélkül, hogy minden alkalommal újra kellene tanítani a mögöttes nagy nyelvi modellt. Erre jelent áttörő megoldást a Memento-Skills nevű új keretrendszer, amelyet több egyetem kutatói fejlesztettek ki: ezzel az ügynökök már képesek maguk fejleszteni és módosítani a készségeiket — anélkül, hogy bármilyen alapvető modellparamétert újratanítanának.

Önjavító MI-ügynök: hogyan működik?

A Memento-Skills lényegében folyamatosan fejlődő külső memóriaként szolgál az MI-ügynök számára. Minden képesség egy strukturált markdown-fájl, amely deklaratív leírást (mit és hogyan tud a készség), speciális promptokat és végrehajtható kódot is tartalmaz. Az ügynök – amikor új feladatot kap – nem a korábbi szövegalapú keresésekből dolgozik, hanem egy speciális készségirányító segítségével kiválasztja az adott szituációhoz legrelevánsabb képességet, végrehajtja azt, majd azonnal értékeli az eredményt és visszacsatol.

Jelentős, hogy a hagyományos ügynökrendszerekhez képest a Memento-Skills nem csupán „visszakeres” egy régi útmutatót vagy szkriptet: ha a megoldás nem működik, az orchestrátor – vagyis az irányító alrendszer – módosítja az adott készséget, vagy akár teljesen újat hoz létre. A rendszer minden módosítást automatikus egységteszttel ellenőriz, így elkerülhető a hibás vagy veszélyes kódok bevezetése. A folyamatos tanulás a Read-Write Reflective Learning (Olvasás–Írás alapú reflektív tanulás) mechanizmuson keresztül történik, amely a memória frissítését aktív policy-iterációként értelmezi, nem puszta naplózási folyamatként.

Miért fontos az önfejlesztő MI?

A mai nagy nyelvi modellek (például a GPT-4o) telepítés után „lefagynak”: minden bennük rejlő tudás csak a tanítási időszakból származik, és amit éppen most látnak, azt csak átmenetileg képesek kezelni. Ráadásul ha új készséget szeretnénk beépíteni, eddig vagy fáradságos finomhangolásra, vagy külön prompt-alkotásra volt szükség.

A Memento-Skills ezeket a hiányosságokat hidalja át azzal, hogy a készségkönyvtár saját magát bővíti, amikor az ügynök visszajelzéseket kap a végrehajtott feladatokról. Ez nemcsak jelentős működési költségeket takarít meg a vállalatoknak, de az adaptív tanulást is felgyorsítja.

Milyen feladatokban bizonyított?

A rendszer két szigorú teszten mutatta meg erejét. Az első, a GAIA-teszt, összetett, többlépcsős problémamegoldást, webes böngészést és többféle eszközhasználatot igényelt. A második, a Human-Level Exams (HLE), nyolc különböző egyetemi tantárgy szakértői szintű kihívásait állította az MI elé. Minden esetben egy „lefagyasztott” GPT-4o modell alkotta az alapot.

A Memento-Skills öntanuló mechanizmusa mindkét tesztben messze túlszárnyalta a csak statikus készségtárra támaszkodó, egyszerű Read-Write megoldást. A GAIA-teszten 13,7 százalékponttal nagyobb pontosságot ért el (66% a 52,3%-kal szemben), míg a HLE-ben — ahol a készségek átvihetők voltak különböző tárgyak között — több mint duplázta az eredményt (38,7% a korábbi 17,9%-hoz képest). A speciális készségkiválasztó eljárásnak köszönhetően a hibás találatok aránya is jelentősen csökkent: az end-to-end feladatelvégzési sikerességi ráta 80%-ra emelkedett, szemben a korábban tipikus 50%-kal.

Látható volt, hogy a rendszer az első öt magkészségből – például webes keresés, terminálműveletek – a GAIA feladatsoron 41, míg a HLE-teszten dinamikusan 235 különálló, új készséget generált és integrált.


Meddig érdemes alkalmazni a rendszert üzleti környezetben?

Jelentős, hogy a Memento-Skills kódja már nyilvánosan elérhető, viszont a gyakorlati értéke attól függ, mennyire hasonló, egymásra épülő feladatokról van szó. Amennyiben az ügynökök elszigetelt, egymástól független problémákat oldanak meg, a tapasztalatok átvitele korlátozott. Ha viszont a feladatok szerkezetileg rokonok, vagyis munkafolyamat-szerűen kapcsolódnak, akkor a tanulás sebessége és hatékonysága is megsokszorozódik.

Ebből kifolyólag a legkézenfekvőbb felhasználás a strukturált munkafolyamatok területe: itt a készségek komponálhatók, kiértékelhetők, és folyamatosan tökéletesíthetők. Fizikai robotok vagy hosszú, előre tervezett feladatsorok esetén ugyanakkor szükség lehet még továbbfejlesztett, akár több ügynököt koordináló MI-megoldásokra is.

Amint az MI-ügynökök maguk írják át produkciós kódjukat, a biztonság és a kontroll minden eddiginél fontosabbá válik. A Memento-Skills már alkalmaz automata teszteket, de az ipari bevezetéshez elengedhetetlen lesz egy átfogóbb, „ítész” rendszer, amely képes a teljesítmény reális értékelésére és az irányított, biztonságos önfejlesztés kereteinek szabályozására.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 10:01

Az Ozempic és társai: fogyás, hányinger, gének – mi számít?

A népszerű fogyókúrás gyógyszerek, az Ozempic, a Wegovy vagy a Zepbound mégsem működnek egyformán mindenkinél, hiába robbantak be a köztudatba...

MA 09:58

A nagy adatvédelmi botrány: titokban pásztázza böngésződet a LinkedIn

Különösen igaz ez akkor, ha egy olyan technológiai óriás kerül reflektorfénybe, mint a LinkedIn, amelyet most két jelentős csoportos per is célba vett...

MA 09:50

A Meta új MI-elméje: megérkezett a Muse Spark

A világot meghódító MI-fejlesztési verseny legújabb szereplője a Meta Superintelligence Lab első nyilvános modellje, a Muse Spark...

MA 09:44

Az élelmiszerár-robbanás új réme: közeleg a szuper El Niño

🌵 Egymásra tornyosulnak a kockázatok a világ élelmiszer-ellátásában, miközben a meteorológusok egy soha nem látott erejű, úgynevezett szuper El Niño kialakulására figyelmeztetnek az év végére...

MA 09:36

A váratlan holdkráter felfedezése mindenkit megdöbbentett

🕶 A Hold felszíne régóta ismert számunkra, mégis időről időre új és látványos változásokon megy keresztül...

MA 09:30

Az igazi márkaerő: így csinál pénzt a vevők véleménye

Ha a vevőkről van szó, gyakran felmerül a kérdés: miért ragaszkodnak egyesek annyira egy márkához, hogy akár jelentős pénzösszeg fejében sem válnának meg tőle?..

MA 09:15

Az iráni hekkerek megbénítik az amerikai infrastruktúrát

⚠ Az utóbbi hetekben jelentősen megszaporodtak azok a támadások, amelyek Iránhoz köthető hekkercsoportokra vezethetők vissza, és az Egyesült Államok kritikus infrastruktúráját veszik célba...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/9

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     KR8-0 Drum Machine (iPhone/iPad)A KR8-0 egy élő fellépésekhez tervezett drum machine...

MA 09:01

Az új hekkercsoport a Zendeskből halássza az ügyféladatokat

🕵 A legújabb támadások célpontjai az üzleti folyamatokat támogató szolgáltatók (BPO-k), ahol a hekkercsoport, az UNC6783, a vállalatok támogatási rendszerébe bejutva érzékeny adatokat szerez meg...

MA 08:44

Az RGB LED tévék kavarják a piacot, trónon maradhat az OLED

💡 Az utóbbi években egyre nagyobb várakozás övezte az RGB háttérvilágítású tévéket...

MA 08:36

Az új Galaxy S25 Ultra: vízálló, de sós vízben nem

💧 A Galaxy S25 Ultra mostantól Ocean móddal vadonatúj, víz alatti fotózási élményt hoz, amit eleinte csak korallzátonyokon búvárkodó óceánkutatók használhattak...

MA 08:29

Itt az első valóban kvantumbiztos Bitcoin-pénztárca-mentő prototípus

A Bitcoin egyik vezető fejlesztője, Olaoluwa „Roasbeef” Osuntokun most először bemutatott egy működő prototípust, amely vészhelyzeti frissítés esetén megmentheti a felhasználók pénztárcáit, ha a hálózatot valaha kvantumszámítógépes támadás ellen kellene védeni...

MA 08:22

Az elit sprinterek titka: tényleg nem a technika a kulcs?

🏃 Évtizedeken át azt hittük, hogy a villámgyors sprinterek sikerének kulcsa egyetlen, tökéletes futótechnika követése...

MA 08:15

A Meta új csodafegyvere: megérkezett a Muse Spark MI

Naná, hogy a Meta nem bírta ki, muszáj volt valami ütőssel villantania az MI-parádén...

MA 08:01

A legújabb kártyalopási trükk: láthatatlan SVG-vel csapnak le a csalók

Érdekes fejlemény, hogy az utóbbi hetekben közel száz, Magento-alapú webáruház vált áldozatává egy látványosan ügyes hekkertámadásnak...

MA 07:57

Az újonnan felfedezett sejttípus nyithatja meg az anya–magzat titkát

👶 Tudósok most először készítettek részletes térképet a méhlepény és a méh felépítéséről, amely megmutatja, miként alakulnak át ezek a szövetek a terhesség során, hogy a fejlődő embriót támogassák...

MA 07:49

Az Amazon végleg lekapcsolja a régi Kindle-t – itt a váltás ideje?

Május 20-tól az Amazon a 2012 előtt gyártott Kindle-olvasókat jegeli: ezekkel a kütyükkel többé nem lehet új könyvet vásárolni, kölcsönözni vagy akár letölteni...

MA 07:43

Az új Google-integráció: egyesül a Gemini és a NotebookLM tudása

Érdemes tudni, hogy a Google két legerősebb MI-szolgáltatása, a Gemini és a NotebookLM mostantól egy új, közös funkcióval bővültek...

MA 07:29

Megérkezett az első kvantumbiztos mentőöv a Bitcoin-pénztárcákhoz

A Bitcoin egyik vezető fejlesztője, Olaoluwa “Roasbeef” Osuntokun különleges mentőeszközt készített, amely végső védelmet nyújthat, ha a Bitcoin közösségének valaha is kvantumszámítógépekkel kellene szembenéznie...

MA 07:22

A szégyenlistának annyi: érkezik az Xbox achievement-szépítés

Na most kapaszkodj, mert hamarosan rejtetté teheted azokat a játékokat az Xbox achievement-listádban, amikre már nem vagy büszke, vagy csak félig sikerült kipörgetned...

MA 07:15

Az új kínai nátriumakku végleg leszámol a tűzveszéllyel

⚡ A modern akkumulátorok egyik legnagyobb veszélye a túlmelegedés, ami könnyen tűzhöz, gázképződéshez vagy akár robbanáshoz is vezethet...

MA 07:08

Az új Dyson HushJet Mini Cool: menő, de drága mulatság

Oké, minden, amit eddig gondoltál a kézi ventilátorokról, mehet a kukába – a Dyson bemutatta a HushJet Mini Cool nevű újdonságát, aminek brutális, 65 000-es fordulatszámú motorja van...

MA 07:01

Az égből érkezik a burritó: drónnal szállít a DoorDash Atlantában

🌮 A DoorDash és a Wing vadonatúj, mindent felrázó együttműködésbe kezdett Atlantában, aminek lényege, hogy mostantól drónnal szállítják ki a kaját!..

MA 06:50

Az Artemis II nagy visszatérése: hazaút a világűrből

Tipikus eset, amikor néhány különleges ember napokra elhagyja a Földet, és az egész emberiség együtt izgul velük...

MA 06:45

A nagy áttörés: az MI önállóan vadássza a súlyos szoftverhibákat

⚡ Az MI legújabb fejlesztése, a Claude Mythos Preview, képességeivel alapjaiban forgatja fel a kiberbiztonság világát...

MA 06:36

Az iPhone Fold-videó kamu – így bukik le a trükk

Többek között az Apple hajlítható mobilja körül is pezsegnek a pletykák, nem véletlenül: ahogy közeledik a szeptemberi bemutató, a netet elárasztják a látványos hamisítványok – köztük egy videó, amelyen mintha a régóta várt iPhone Fold bontására kerülne sor...

MA 06:30

A Muse Spark érkezik: a Meta nekimegy az MI-elitnek

Noha a generatív MI korszakában a Meta eddig az Llama-modellekkel hódította meg a fejlesztőket és kutatókat, a vállalat most teljesen új irányt vesz: bejelentette Muse Spark nevű, saját fejlesztésű, zárt mesterségesintelligencia-modelljét, amely ígérete szerint mindent újrakezd a digitalizációban...

MA 06:22

A csalók már a Script Editort is használják: vigyázz, mit indítasz!

⚠ Érdemes megérteni, hogy az Atomic Stealer nevű kártékony szoftver új trükkel támadja a Mac-felhasználókat...

MA 06:08

Az a nap, amikor a Microsoft tiltólistára tette a VeraCryptet

Na most kapaszkodj, mert a Microsoft gondolt egy nagyot, és egyik napról a másikra megszüntette a VeraCrypt fejlesztői fiókját...