MA 21:23

Az MI-ügynökök forradalma: amikor a kód önmagát írja át

A mesterséges intelligencia fejlesztésének egyik legfőbb kihívása, hogy olyan autonóm ügynökök épüljenek, amelyek képesek alkalmazkodni a környezet változásaihoz anélkül, hogy az alapul szolgáló nagy nyelvi modellt újra kellene tanítani. A Memento-Skills névre keresztelt új keretrendszer most épp ezt a problémát oldja meg: lehetővé teszi, hogy az ügynökök önállóan fejlesszék és bővítsék képességeiket, minden modell-újraképzés nélkül. A technológia ezzel jelentős előnyt kínál azoknak a vállalatoknak, amelyek éles környezetben futtatják MI-ügynökeiket.

Az önfejlődő MI-ügynökök kihívásai

A jelenleg használt nyelvi modellekkel az a legfőbb gond, hogy miután bevezetik őket, paramétereik rögzülnek—tehát csak a betanítás során megtanult tudást, illetve az aktuális kontextusablakban elférő információkat tudják használni. Emiatt – ha egy új, ismeretlen feladattal találkoznak – nem tudnak hatékonyan fejlődni, kivéve, ha a háttérmodellt teljes körűen újra kell tanítani, ami hatalmas idő- és költségigénnyel jár. Léteznek módok bizonyos képességek külön dokumentumokba vagy „skill”-fájlokba mentésére, de ezek eddig többnyire csak szöveges dokumentációként szolgáltak, nem igazi végrehajtható tudásként.

A szokásos keresőmotorokon és szöveghasonlóságon alapuló rendszerek gyakran félrevezetnek, mert egy „jelszó-visszaállítás” feladathoz például könnyen előhozhatnak egy „visszatérítési igénylés” munkafolyamatot, mivel közös kulcsszavakat tartalmaznak – viszont a megoldásuk teljesen eltér.

Memento-Skills: memória, ami tanul és változik

A Memento-Skills érdemi újítása, hogy a szükséges készségeket jól strukturált markdown-fájlokban tárolja, melyek az MI-ügynök „külső memóriáját” alkotják, és lépésről lépésre bővíthetők, módosíthatók. Egy ilyen skill három komponensből áll: egy deklaratív specifikációból (mi a skill és mire használható), célzott utasításokból, valamint valós, végrehajtható kódból, segédszkriptekkel.

A tanulási folyamat aktív—nemcsak naplózza, mi történt, hanem ha egy feladat sikertelen, az orkesztrátor elemzi a hibanyomvonalat, és szükség esetén kijavítja vagy teljesen újraírja a skilleket. Ha kell, teljesen új skill születik. Minden változtatás előtt automatikus egységteszt fut le, hogy ne fordulhasson elő visszalépés vagy működési zavar. A skillkiválasztó útválasztó is fejlődik: a rendszer nem csupán szövegazonosság alapján választ, hanem végrehajtási visszacsatolás, azaz megerősítéses tanulás (reinforcement learning) segítségével állapítja meg, melyik skillt érdemes használni.

Valódi tesztek a gyakorlatban

A keretrendszert két szigorú mércén is tesztelték: az egyik a GAIA benchmark, amely összetett, több lépéses feladatmegoldást, multimodális adatkezelést, webböngészést és eszközhasználatot is igényel. A másik a Human-Level Exams (HLE), különböző egyetemi szintű tantárgyakban: matematikában, biológiában és így tovább. Mindkét teszthez a GPT-4o volt az alapmodell, amelyet a Memento-Skills egyáltalán nem módosított.

Az eredmények lenyűgözők: a GAIA teszten a rendszer 52,3%-ról 66%-ra növelte a pontosságot—a különbség 13,7 százalékpont. Az expert szintű HLE teszten még szembetűnőbb a fejlődés: 17,9%-ról 38,7%-ra ugrott a teljesítmény. Eközben a klasszikus keresési módszerek csupán 50%-os sikeraránnyal működtek, míg a Memento-Skills 80%-ot ért el.

A rendszer teljesen organikusan fejlődik: mindkét benchmark kezdetben csak 5 alapskillel indult (pl. alap webböngészés, terminálkezelés), de a GAIA-ban 41, az expert HLE-ben pedig már 235 különböző skillt hozott létre önállóan, az adott feladatstruktúrákhoz igazodva.

Vállalati alkalmazás és korlátok

Nem zárható ki annak a lehetősége, hogy a Memento-Skills minden üzleti területen hasznosítható, de legideálisabb ott, ahol a feladatok szorosan egymásra épülő munkafolyamatokban jelentkeznek. Ilyen környezetben a tanult skillek közvetlenül vagy kis módosítással újrahasználhatók, ezáltal jelentősen gyorsítják a tanulást és a problémamegoldást.

Ezzel szemben ha a feladatok teljesen elszigeteltek, a rendszer kevésbé tud a korábbi tapasztalatokra építeni. Mindezt figyelembe véve a döntéshozóknak érdemes mérlegelni, hol vezetik be az ilyen fejlett MI-t; inkább ismétlődő, strukturált munkafolyamatokban, nem pedig ritka vagy egyedi problémáknál.

Megfontolandó, hogy fizikai robotok vagy hosszabb döntési láncokat igénylő MI-rendszerek esetén a Memento-Skills még nem elég kiforrott – ilyen komplex, több ügynököt igénylő alkalmazásokhoz további kutatás szükséges.

Biztonságos önfejlesztés: a jövő MI-ügynökei

A kód automatikus átírása komoly biztonsági és irányítási kérdéseket vet fel, főképp nagyvállalati környezetben. Bár a Memento-Skills automatikus egységtesztekkel és alapvető védelmi mechanizmusokkal működik, átfogóbb szabályozásra lesz szükség a jövőben, hogy a rendszerek valóban megbízhatóan és biztonságosan fejleszthessék magukat.

Mindezt figyelembe véve hamarosan egyre több olyan MI-ügynökkel találkozhatunk, amelyek maguk írják és frissítik saját tudásbázisukat, kódjukat—de hogy mindez mennyire válik mindennapossá, végső soron a gyakorlati bevezetési környezetek és a megfelelő irányítás szabják meg.

2026, adminboss, venturebeat.com alapján

Share on Social Media

filózó

Te szívesen dolgoznál együtt olyan MI-vel, ami önállóan fejleszti magát?
Szerinted milyen szabályokat vezetnél be, hogy biztonságosabb legyen ez a technológia?

Legfrissebb posztok

Gaming

MA 21:35

A Hades 2 berobban – durva újdonságok az Xbox Game Passben

Áprilisban igazán izgalmas időszak vár az Xbox Game Pass előfizetőire: díjnyertes folytatások, zseniális új független címek, klasszikusok ráncfelvarrott kiadásai és persze jó néhány addiktív gyöngyszem kerül fel a platformra...

Színes

MA 21:13

Az új T‑Mobile csomagok közül melyik a legjobb 2026-ban?

A T-Mobile 2026-ot egy váratlan új csomag bejelentésével indította, amely minden eddigi várakozást felülmúlt...

Az Antarktisz bajban: már a császárpingvin is veszélyeztetett

Tudomány

MA 21:02

Az Antarktisz bajban: már a császárpingvin is veszélyeztetett

🐧 Érdemes megvizsgálni, hogy az Antarktisz két ikonikus állata, a császárpingvin és az antarktiszi (délsarki) medvefóka drámai helyzetbe kerültek...

Az új Lyme-vakcina áttörést ígér – de kérik-e majd?

Tudomány

MA 20:56

Az új Lyme-vakcina áttörést ígér – de kérik-e majd?

💉 Míg az elmúlt években a Lyme-kór egyre komolyabb egészségügyi problémává nőtte ki magát, most új remény villant fel: a Pfizer és a Valneva közös fejlesztése révén egy hatékony vakcina kerülhet a piacra, amely segíthet megfékezni ezt a kullancsok által terjesztett betegséget...

A bölcs vezetők pénteken nem döntenek – így kerüld el a kiégést

Színes

MA 20:45

A bölcs vezetők pénteken nem döntenek – így kerüld el a kiégést

Ami először apróságnak tűnt, könnyen válhat sorsfordító hibává egy hosszú, megerőltető munkahét végén...

A Kia új pickupja 2030-ra letarolja Amerikát

Színes

MA 20:34

A Kia új pickupja 2030-ra letarolja Amerikát

A következő években merész lépésre készül a dél-koreai Kia: az amerikai autópiacra szán egy teljesen új pickup-modellt...

Az offline MI végre megérkezett: a Gemma 4 a zsebedben

MI Hírek

MA 20:23

Az offline MI végre megérkezett: a Gemma 4 a zsebedben

📱 A Google a napokban elérhetővé tette új alkalmazását, az AI Edge Gallery-t, ami letölthető a Google Play Áruházból és az Apple App Store-ból is...

Gaming

MA 20:12

A nyugalmadért kapcsold ki végre a Spotify-videókat!

🔊 Mondták már, hogy retró zenelejátszó-élményt szeretnél egy ekkora appban? Most már lehet!..

Színes

MA 20:01

Az új One UI 9 hoz heti időjárás-előrejelzést?

☀️ Úgy tűnik, a Samsung most komolyan fejleszti a Now Brief funkcióját: a kiszivárgott képernyőfotók alapján már nemcsak az aktuális nap időjárását mutatja majd, hanem egy teljes, hétnapos előrejelzést is, részletesen megadva a napi maximumokat és minimumokat, valamint ikonokkal illusztrálva a várható időjárást...

Az amerikai álom az Applenél továbbra is csak díszlet

Színes

MA 19:56

Az amerikai álom az Applenél továbbra is csak díszlet

Az Apple ismét bővíti úgynevezett amerikai gyártási programját, de az iPhone-ok továbbra sem készülnek az Egyesült Államokban...

Az Artemis II visszatérésének küszöbén: űrhősök a nagy finálé előtt

Tudomány

MA 19:45

Az Artemis II visszatérésének küszöbén: űrhősök a nagy finálé előtt

Közel tíz nap kaland után az Artemis II legénysége már az ablakukon át látja a Földet, a hazatérésük célját...

Az édesítőszerek könnyen átverik az agyadat

Tudomány

MA 19:34

Az édesítőszerek könnyen átverik az agyadat

Érdekes felvetés, hogy nemcsak az számít, mi van a poharunkban, hanem az is, mit gondolunk róla...

Gaming

MA 19:23

Az Xbox-kontrollerek akku nélkül érkeztek – ingyenes csere indul

🔋 Több Xbox-játékos vette észre, hogy az utóbbi hónapokban vásárolt vezeték nélküli Xbox-kontrollerükből hiányzott a mellékelt elem...

Színes

MA 19:12

Az Eurail-adatlopás 300 ezret érint: cseréld a jelszavad, ha Euraillel utaztál

🔒 A kontinens legnagyobb vasúti utazásait szervező Eurail kénytelen volt elismerni, hogy tavaly december végén hackerek több mint 300 ezer ügyfél személyes adataihoz jutottak hozzá...

Színes

MA 18:34

Az új Pixel 11-széria a kijelzőmániások álma

Pár hónap múlva már a Pixel 11 szériát foghatjuk kézbe – és bármilyen hihetetlen, de ezek a telefonok lehetnek az elsők, amelyek megkapják a Samsung vadonatúj M16 OLED paneljét...

A YouTube Shorts-ot elárasztják az MI-avatárok

MI Hírek

MA 18:23

A YouTube Shorts-ot elárasztják az MI-avatárok

A YouTube mostantól lehetőséget ad arra, hogy saját képmásoddal szerepelj a Shorts-videókban, még ha éppen nincs is kamerád kéznél...

Az új Gemini-asszisztens megőrjíti a Google Home felhasználóit

MI Hírek

MA 18:01

Az új Gemini-asszisztens megőrjíti a Google Home felhasználóit

🤯 Emellett a Google Home felhasználói egyre nagyobb számban tapasztalnak komoly problémákat a Gemini nevű, frissített hangalapú asszisztenssel, amelyet már 16 új országban vezetik be...

MI Hírek

MA 17:45

Az OpenAI parkolópályára tette a Stargate UK-t: szabályozás, energiaárak

⚠ Az OpenAI felfüggesztette az Egyesült Királyságba tervezett Stargate nagyléptékű MI-infrastruktúra kiépítését, miután makacs energiaár-emelkedés és bizonytalan szabályozási környezet húzta keresztbe a számításaikat...

Kriptó

MA 17:34

A Bithumb gigászi melléfogása: tévedésből 40 milliárd dollárnyi bitcoint

Jól mutatja, hogy egyetlen elütés is okozhat milliárdos kárt: a második legnagyobb dél-koreai kriptotőzsde, a Bithumb munkatársai februárban tévedésből egy promóció során „BTC”-t írtak „KRW” helyett, így 249 nyertesnek nem 620 000 forintnyi összeget, hanem fejenként 620 000 bitcoint, összesen több mint 40 milliárd dollárt (14 320 milliárd forintot) írtak jóvá belső rendszerükben...

A konyha rejtett fegyvere: hétköznapi fűszerek, százszoros gyulladáscsökkentés

Tudomány

MA 17:12

A konyha rejtett fegyvere: hétköznapi fűszerek, százszoros gyulladáscsökkentés

🥗 Ez a jelenség jól illusztrálható azzal, hogy a látszólag hétköznapi fűszernövények – mint a menta, az eukaliptusz és a csilipaprika – természetes vegyületei elképesztő erővel léphetnek fel a szervezet gyulladásos folyamatai ellen, főleg, ha bizonyos kombinációkban találkoznak az immunrendszer sejtjeiben...

Az MI újabb bakija: fejlesztők letiltva, megállnak a nagy szoftverek

MI Hírek

MA 17:02

Az MI újabb bakija: fejlesztők letiltva, megállnak a nagy szoftverek

Érdekes felvetés, hogy néhány kulcsfontosságú, nyílt forráskódú program fejlesztői napok óta nem tudják frissíteni alkalmazásaikat Windowsra, mert a Microsoft egyik pillanatról a másikra, érdemi figyelmeztetés nélkül felfüggesztette a fejlesztői fiókjaikat...

Tudomány

MA 16:56

A belek rejthetik az ALS és a demencia kulcsát

A Case Western Reserve Egyetem kutatói egy meglepő összefüggésre derítettek fényt: a bélben élő baktériumok által termelt káros cukrok jelentős szerepet játszhatnak a rendkívül pusztító agyi betegségek, például az ALS (amiotrófiás laterálszklerózis) és a frontotemporális demencia kialakulásában...

Színes

MA 16:34

A rejtélyesen eltűnt rendszergazda pokollá teszi a Samsungosok életét

A Galaxy S22 Ultra-tulajdonosok egy része teljesen váratlan akadályba ütközik, amikor a gyári beállítások visszaállítása után az általuk legálisan vásárolt telefont egyszer csak zárolják — ráadásul nem is ők, hanem egy ismeretlen, gyanús szervezet, a Numero LLC neve jelenik meg a készüléken...

A JBL új fejhallgatói: finom előrelépés, bosszantó hibákkal

Gaming

MA 16:02

A JBL új fejhallgatói: finom előrelépés, bosszantó hibákkal

A JBL két új modellje, a Live 780NC és a Live 680NC csábító ígérettel érkezett, hogy a középkategóriás vezeték nélküli, zajszűrős fejhallgatók élmezőnyébe törjön...

Tudomány

MA 15:47

Az Artemis II után: Megváltozott, amit a Holdról tudunk?

🚲 Egy újabb történelmi kört zárt a NASA, amikor az Orion űrhajó tizenhárom évnyi előkészület után négyfős személyzettel kerülte meg a Holdat és indult vissza a Föld felé...

MI Hírek

MA 15:34

A Google új trükkje: jegyzetelj okosabban, lustábban!

📝 Komolyan mondom, végre egy kis ész a digitális káoszban! A Google beolvasztotta a NotebookLM nevű mesterségesintelligencia-alapú kutatósegédjét a Gemini csevegőjébe, így mostantól már nem kell ezer ablak között vergődve kezelni a jegyzeteidet...

Az új Muse Spark: a Meta MI-forradalma újraindul

MI Hírek

MA 15:23

Az új Muse Spark: a Meta MI-forradalma újraindul

Érdemes megvizsgálni, hogy a Meta legutóbbi MI-modellje, a Muse Spark képes-e új alapokra helyezni a cég mesterségesintelligencia-stratégiáját, miután a Llama 4 csalódást keltő fogadtatásban részesült...

MI Hírek

MA 15:12

A Meta új modellje: totális zártság, nyitottság sehol

Mark Zuckerberg, aki korábban a nyílt forráskódú MI élharcosaként tündökölt, most meglepő fordulattal egészen eltérő irányt vett...

Színes

MA 15:02

A magánszféra otthoni védelmének 7 egyszerű, mégis ütős módja

Nemcsak a közösségi média vagy a kéretlen telefonhívások jelenthetnek veszélyt az adatainkra – az otthonunkban lévő technológia is komoly kockázati forrás lehet...