MA 21:23

Az MI-ügynökök forradalma: amikor a kód önmagát írja át

Az MI-ügynökök forradalma: amikor a kód önmagát írja át
A mesterséges intelligencia fejlesztésének egyik legfőbb kihívása, hogy olyan autonóm ügynökök épüljenek, amelyek képesek alkalmazkodni a környezet változásaihoz anélkül, hogy az alapul szolgáló nagy nyelvi modellt újra kellene tanítani. A Memento-Skills névre keresztelt új keretrendszer most épp ezt a problémát oldja meg: lehetővé teszi, hogy az ügynökök önállóan fejlesszék és bővítsék képességeiket, minden modell-újraképzés nélkül. A technológia ezzel jelentős előnyt kínál azoknak a vállalatoknak, amelyek éles környezetben futtatják MI-ügynökeiket.

Az önfejlődő MI-ügynökök kihívásai

A jelenleg használt nyelvi modellekkel az a legfőbb gond, hogy miután bevezetik őket, paramétereik rögzülnek—tehát csak a betanítás során megtanult tudást, illetve az aktuális kontextusablakban elférő információkat tudják használni. Emiatt – ha egy új, ismeretlen feladattal találkoznak – nem tudnak hatékonyan fejlődni, kivéve, ha a háttérmodellt teljes körűen újra kell tanítani, ami hatalmas idő- és költségigénnyel jár. Léteznek módok bizonyos képességek külön dokumentumokba vagy „skill”-fájlokba mentésére, de ezek eddig többnyire csak szöveges dokumentációként szolgáltak, nem igazi végrehajtható tudásként.

A szokásos keresőmotorokon és szöveghasonlóságon alapuló rendszerek gyakran félrevezetnek, mert egy „jelszó-visszaállítás” feladathoz például könnyen előhozhatnak egy „visszatérítési igénylés” munkafolyamatot, mivel közös kulcsszavakat tartalmaznak – viszont a megoldásuk teljesen eltér.

Memento-Skills: memória, ami tanul és változik

A Memento-Skills érdemi újítása, hogy a szükséges készségeket jól strukturált markdown-fájlokban tárolja, melyek az MI-ügynök „külső memóriáját” alkotják, és lépésről lépésre bővíthetők, módosíthatók. Egy ilyen skill három komponensből áll: egy deklaratív specifikációból (mi a skill és mire használható), célzott utasításokból, valamint valós, végrehajtható kódból, segédszkriptekkel.

A tanulási folyamat aktív—nemcsak naplózza, mi történt, hanem ha egy feladat sikertelen, az orkesztrátor elemzi a hibanyomvonalat, és szükség esetén kijavítja vagy teljesen újraírja a skilleket. Ha kell, teljesen új skill születik. Minden változtatás előtt automatikus egységteszt fut le, hogy ne fordulhasson elő visszalépés vagy működési zavar. A skillkiválasztó útválasztó is fejlődik: a rendszer nem csupán szövegazonosság alapján választ, hanem végrehajtási visszacsatolás, azaz megerősítéses tanulás (reinforcement learning) segítségével állapítja meg, melyik skillt érdemes használni.

Valódi tesztek a gyakorlatban

A keretrendszert két szigorú mércén is tesztelték: az egyik a GAIA benchmark, amely összetett, több lépéses feladatmegoldást, multimodális adatkezelést, webböngészést és eszközhasználatot is igényel. A másik a Human-Level Exams (HLE), különböző egyetemi szintű tantárgyakban: matematikában, biológiában és így tovább. Mindkét teszthez a GPT-4o volt az alapmodell, amelyet a Memento-Skills egyáltalán nem módosított.

Az eredmények lenyűgözők: a GAIA teszten a rendszer 52,3%-ról 66%-ra növelte a pontosságot—a különbség 13,7 százalékpont. Az expert szintű HLE teszten még szembetűnőbb a fejlődés: 17,9%-ról 38,7%-ra ugrott a teljesítmény. Eközben a klasszikus keresési módszerek csupán 50%-os sikeraránnyal működtek, míg a Memento-Skills 80%-ot ért el.

A rendszer teljesen organikusan fejlődik: mindkét benchmark kezdetben csak 5 alapskillel indult (pl. alap webböngészés, terminálkezelés), de a GAIA-ban 41, az expert HLE-ben pedig már 235 különböző skillt hozott létre önállóan, az adott feladatstruktúrákhoz igazodva.


Vállalati alkalmazás és korlátok

Nem zárható ki annak a lehetősége, hogy a Memento-Skills minden üzleti területen hasznosítható, de legideálisabb ott, ahol a feladatok szorosan egymásra épülő munkafolyamatokban jelentkeznek. Ilyen környezetben a tanult skillek közvetlenül vagy kis módosítással újrahasználhatók, ezáltal jelentősen gyorsítják a tanulást és a problémamegoldást.

Ezzel szemben ha a feladatok teljesen elszigeteltek, a rendszer kevésbé tud a korábbi tapasztalatokra építeni. Mindezt figyelembe véve a döntéshozóknak érdemes mérlegelni, hol vezetik be az ilyen fejlett MI-t; inkább ismétlődő, strukturált munkafolyamatokban, nem pedig ritka vagy egyedi problémáknál.

Megfontolandó, hogy fizikai robotok vagy hosszabb döntési láncokat igénylő MI-rendszerek esetén a Memento-Skills még nem elég kiforrott – ilyen komplex, több ügynököt igénylő alkalmazásokhoz további kutatás szükséges.

Biztonságos önfejlesztés: a jövő MI-ügynökei

A kód automatikus átírása komoly biztonsági és irányítási kérdéseket vet fel, főképp nagyvállalati környezetben. Bár a Memento-Skills automatikus egységtesztekkel és alapvető védelmi mechanizmusokkal működik, átfogóbb szabályozásra lesz szükség a jövőben, hogy a rendszerek valóban megbízhatóan és biztonságosan fejleszthessék magukat.

Mindezt figyelembe véve hamarosan egyre több olyan MI-ügynökkel találkozhatunk, amelyek maguk írják és frissítik saját tudásbázisukat, kódjukat—de hogy mindez mennyire válik mindennapossá, végső soron a gyakorlati bevezetési környezetek és a megfelelő irányítás szabják meg.

2026, adminboss, venturebeat.com alapján

  • Te szívesen dolgoznál együtt olyan MI-vel, ami önállóan fejleszti magát?
  • Szerinted milyen szabályokat vezetnél be, hogy biztonságosabb legyen ez a technológia?


Legfrissebb posztok

MA 21:35

A Hades 2 berobban – durva újdonságok az Xbox Game Passben

Áprilisban igazán izgalmas időszak vár az Xbox Game Pass előfizetőire: díjnyertes folytatások, zseniális új független címek, klasszikusok ráncfelvarrott kiadásai és persze jó néhány addiktív gyöngyszem kerül fel a platformra...

MA 21:13

Az új T‑Mobile csomagok közül melyik a legjobb 2026-ban?

A T-Mobile 2026-ot egy váratlan új csomag bejelentésével indította, amely minden eddigi várakozást felülmúlt...

MA 21:02

Az Antarktisz bajban: már a császárpingvin is veszélyeztetett

🐧 Érdemes megvizsgálni, hogy az Antarktisz két ikonikus állata, a császárpingvin és az antarktiszi (délsarki) medvefóka drámai helyzetbe kerültek...

MA 20:56

Az új Lyme-vakcina áttörést ígér – de kérik-e majd?

💉 Míg az elmúlt években a Lyme-kór egyre komolyabb egészségügyi problémává nőtte ki magát, most új remény villant fel: a Pfizer és a Valneva közös fejlesztése révén egy hatékony vakcina kerülhet a piacra, amely segíthet megfékezni ezt a kullancsok által terjesztett betegséget...

MA 20:45

A bölcs vezetők pénteken nem döntenek – így kerüld el a kiégést

Ami először apróságnak tűnt, könnyen válhat sorsfordító hibává egy hosszú, megerőltető munkahét végén...

MA 20:34

A Kia új pickupja 2030-ra letarolja Amerikát

A következő években merész lépésre készül a dél-koreai Kia: az amerikai autópiacra szán egy teljesen új pickup-modellt...

MA 20:23

Az offline MI végre megérkezett: a Gemma 4 a zsebedben

📱 A Google a napokban elérhetővé tette új alkalmazását, az AI Edge Gallery-t, ami letölthető a Google Play Áruházból és az Apple App Store-ból is...

MA 20:12

A nyugalmadért kapcsold ki végre a Spotify-videókat!

🔊 Mondták már, hogy retró zenelejátszó-élményt szeretnél egy ekkora appban? Most már lehet!..

MA 20:01

Az új One UI 9 hoz heti időjárás-előrejelzést?

☀️ Úgy tűnik, a Samsung most komolyan fejleszti a Now Brief funkcióját: a kiszivárgott képernyőfotók alapján már nemcsak az aktuális nap időjárását mutatja majd, hanem egy teljes, hétnapos előrejelzést is, részletesen megadva a napi maximumokat és minimumokat, valamint ikonokkal illusztrálva a várható időjárást...

MA 19:56

Az amerikai álom az Applenél továbbra is csak díszlet

Az Apple ismét bővíti úgynevezett amerikai gyártási programját, de az iPhone-ok továbbra sem készülnek az Egyesült Államokban...

MA 19:45

Az Artemis II visszatérésének küszöbén: űrhősök a nagy finálé előtt

Közel tíz nap kaland után az Artemis II legénysége már az ablakukon át látja a Földet, a hazatérésük célját...

MA 19:34

Az édesítőszerek könnyen átverik az agyadat

Érdekes felvetés, hogy nemcsak az számít, mi van a poharunkban, hanem az is, mit gondolunk róla...

MA 19:23

Az Xbox-kontrollerek akku nélkül érkeztek – ingyenes csere indul

🔋 Több Xbox-játékos vette észre, hogy az utóbbi hónapokban vásárolt vezeték nélküli Xbox-kontrollerükből hiányzott a mellékelt elem...

MA 19:12

Az Eurail-adatlopás 300 ezret érint: cseréld a jelszavad, ha Euraillel utaztál

🔒 A kontinens legnagyobb vasúti utazásait szervező Eurail kénytelen volt elismerni, hogy tavaly december végén hackerek több mint 300 ezer ügyfél személyes adataihoz jutottak hozzá...

MA 18:34

Az új Pixel 11-széria a kijelzőmániások álma

Pár hónap múlva már a Pixel 11 szériát foghatjuk kézbe – és bármilyen hihetetlen, de ezek a telefonok lehetnek az elsők, amelyek megkapják a Samsung vadonatúj M16 OLED paneljét...

MA 18:23

A YouTube Shorts-ot elárasztják az MI-avatárok

A YouTube mostantól lehetőséget ad arra, hogy saját képmásoddal szerepelj a Shorts-videókban, még ha éppen nincs is kamerád kéznél...

MA 18:01

Az új Gemini-asszisztens megőrjíti a Google Home felhasználóit

🤯 Emellett a Google Home felhasználói egyre nagyobb számban tapasztalnak komoly problémákat a Gemini nevű, frissített hangalapú asszisztenssel, amelyet már 16 új országban vezetik be...

MA 17:45

Az OpenAI parkolópályára tette a Stargate UK-t: szabályozás, energiaárak

⚠ Az OpenAI felfüggesztette az Egyesült Királyságba tervezett Stargate nagyléptékű MI-infrastruktúra kiépítését, miután makacs energiaár-emelkedés és bizonytalan szabályozási környezet húzta keresztbe a számításaikat...

MA 17:34

A Bithumb gigászi melléfogása: tévedésből 40 milliárd dollárnyi bitcoint

Jól mutatja, hogy egyetlen elütés is okozhat milliárdos kárt: a második legnagyobb dél-koreai kriptotőzsde, a Bithumb munkatársai februárban tévedésből egy promóció során „BTC”-t írtak „KRW” helyett, így 249 nyertesnek nem 620 000 forintnyi összeget, hanem fejenként 620 000 bitcoint, összesen több mint 40 milliárd dollárt (14 320 milliárd forintot) írtak jóvá belső rendszerükben...

MA 17:12

A konyha rejtett fegyvere: hétköznapi fűszerek, százszoros gyulladáscsökkentés

🥗 Ez a jelenség jól illusztrálható azzal, hogy a látszólag hétköznapi fűszernövények – mint a menta, az eukaliptusz és a csilipaprika – természetes vegyületei elképesztő erővel léphetnek fel a szervezet gyulladásos folyamatai ellen, főleg, ha bizonyos kombinációkban találkoznak az immunrendszer sejtjeiben...

MA 17:02

Az MI újabb bakija: fejlesztők letiltva, megállnak a nagy szoftverek

Érdekes felvetés, hogy néhány kulcsfontosságú, nyílt forráskódú program fejlesztői napok óta nem tudják frissíteni alkalmazásaikat Windowsra, mert a Microsoft egyik pillanatról a másikra, érdemi figyelmeztetés nélkül felfüggesztette a fejlesztői fiókjaikat...

MA 16:56

A belek rejthetik az ALS és a demencia kulcsát

A Case Western Reserve Egyetem kutatói egy meglepő összefüggésre derítettek fényt: a bélben élő baktériumok által termelt káros cukrok jelentős szerepet játszhatnak a rendkívül pusztító agyi betegségek, például az ALS (amiotrófiás laterálszklerózis) és a frontotemporális demencia kialakulásában...

MA 16:34

A rejtélyesen eltűnt rendszergazda pokollá teszi a Samsungosok életét

A Galaxy S22 Ultra-tulajdonosok egy része teljesen váratlan akadályba ütközik, amikor a gyári beállítások visszaállítása után az általuk legálisan vásárolt telefont egyszer csak zárolják — ráadásul nem is ők, hanem egy ismeretlen, gyanús szervezet, a Numero LLC neve jelenik meg a készüléken...

MA 16:02

A JBL új fejhallgatói: finom előrelépés, bosszantó hibákkal

A JBL két új modellje, a Live 780NC és a Live 680NC csábító ígérettel érkezett, hogy a középkategóriás vezeték nélküli, zajszűrős fejhallgatók élmezőnyébe törjön...

MA 15:47

Az Artemis II után: Megváltozott, amit a Holdról tudunk?

🚲 Egy újabb történelmi kört zárt a NASA, amikor az Orion űrhajó tizenhárom évnyi előkészület után négyfős személyzettel kerülte meg a Holdat és indult vissza a Föld felé...

MA 15:34

A Google új trükkje: jegyzetelj okosabban, lustábban!

📝 Komolyan mondom, végre egy kis ész a digitális káoszban! A Google beolvasztotta a NotebookLM nevű mesterségesintelligencia-alapú kutatósegédjét a Gemini csevegőjébe, így mostantól már nem kell ezer ablak között vergődve kezelni a jegyzeteidet...

MA 15:23

Az új Muse Spark: a Meta MI-forradalma újraindul

Érdemes megvizsgálni, hogy a Meta legutóbbi MI-modellje, a Muse Spark képes-e új alapokra helyezni a cég mesterségesintelligencia-stratégiáját, miután a Llama 4 csalódást keltő fogadtatásban részesült...

MA 15:12

A Meta új modellje: totális zártság, nyitottság sehol

Mark Zuckerberg, aki korábban a nyílt forráskódú MI élharcosaként tündökölt, most meglepő fordulattal egészen eltérő irányt vett...

MA 15:02

A magánszféra otthoni védelmének 7 egyszerű, mégis ütős módja

Nemcsak a közösségi média vagy a kéretlen telefonhívások jelenthetnek veszélyt az adatainkra – az otthonunkban lévő technológia is komoly kockázati forrás lehet...