2026. 06. 12., 08:37

A Microsoft nyílt forrású SkillOptja súlyokhoz nyúlás nélkül turbózza az MI-ügynököket

A modern MI-ügynökök számtalan vállalati területen dolgoznak: összetett munkafolyamatokat hangolnak össze, segítenek adatokat elemezni és a mindennapi folyamatokat automatizálni. Ezek az ügynökök azonban gyakran szöveges „skill”-dokumentumokat használnak – egyszerű Markdown (.md) fájlokban, amelyekben lépésről lépésre leírták, hogyan viselkedjenek bizonyos helyzetekben. Eddig ennek optimalizálása gyerekcipőben járt: a fejlesztők kézzel javítgatták, kísérletezgetve, mi lehet hatékonyabb. Most azonban új megoldás jelent meg.

Ekkor következett be a fordulat

A Microsoft nyílt forráskódú SkillOpt keretrendszere teljesen új módszert kínál: lehetővé teszi, hogy egy MI-ügynök a saját skill-dokumentációját automatikusan optimalizálja, méghozzá anélkül, hogy a mögöttes modell súlyaihoz nyúlna. A SkillOpt úgy működik, hogy a skill-dokumentumokat „tanítható objektumként” kezeli, és folyamatosan javít rajtuk a teljesítmény visszacsatolásai alapján. Mindezt a mélytanulásból ismert optimalizálási technikákkal teszi, miközben a modell paraméterei változatlanok maradnak.

Számos ipari teszten már bizonyított: a GPT-5.5-höz és a Qwenhez hasonló modellek pontosságát jelentősen növelte, egyszerűen azzal, hogy a skill-dokumentumot okosabban szerkesztette. Az eredmény: karcsú, jól hordozható tudáscsomagok, melyek lehetővé teszik az MI-ügynökök számára, hogy új területeken is gyorsan bevethetők legyenek.

Az MI-skillek optimalizálásának problémái

A skill-dokumentumok a procedurális tudást természetes nyelven fogalmazzák meg: tartalmazzák a szükséges domain-specifikus szabályokat, eszközhasználati elveket, kimeneti formátumokat és ismert hibákat. Ezek nélkülözhetetlenek ahhoz, hogy egy MI-ügynök egyedi vállalati igényekhez igazodjon. Mivel ezek csak szöveges fájlok, könnyen frissíthetők – papíron. A gyakorlatban viszont a kézi szerkesztés lassú, nehézkes, és szinte lehetetlen őket matematikai alapokra építve, stabilan és megbízhatóan optimalizálni.

A fő gond, hogy senki sem tudja garantálni, hogy az új változat tényleg javít a teljesítményen, vagy csak lelassítja, esetleg félrevezeti az MI-t. Gyakran nincs kontroll a lépések nagyságán, nincs megbízható validáció, és az elrontott módosítások újra és újra előbukkannak.

A matematikai fegyelem: a SkillOpt működése

A SkillOpt teljesen új szemléletet hoz: a szöveges dokumentumot úgy alakítja, mintha az egy tanítható paraméter lenne. Először lefuttat egy „befagyasztott” ügynökmodellel egy mintafeladatot, és az eredményekből szétválogatja a sikereket és a kudarcokat. Ezután a minták alapján javaslatokat tesz a dokumentum szerkesztésére (hozzáad, töröl, lecserél részeket), és rangsorolja a módosításokat. Egyszerre csak korlátozott számú változtatást engedélyez, hogy ne távolodjon el az előző, bizonyítottan működő állapottól: ez a lépésméret vagy „tanulási ráta”. Az új skilleket validációs mintán leteszteli, és ha hoznak javulást, elfogadja, ellenkező esetben a módosítás megy a „hibás szerkesztések” tárolóba. Az egész folyamat szigorúan visszacsatolt, kontrollált, és minden döntést számszerűsített teljesítmény alapján hoz meg.

Időszakonként a SkillOpt lassú, de stabil frissítést végez, amely összeveti a régi és az új skillek alapján lefuttatott feladatokat, így hosszú távon is megőrzi a ténylegesen értékes fejlesztéseket.

SkillOpt: gyakorlatban és eredmények

A SkillOptot számos eltérő modellel és végrehajtási környezettel tesztelték – a csúcskategóriás GPT-5.5-től a közepes GPT-5.4-mini és Qwen3.5-4B modellekig, egyszerű csevegéstől a komplex kódgenerálásig (Codex CLI, Claude Code). Az értékelések során kérdés–válasz, eszközhasználatot igénylő programírás és multimodális dokumentumelemzés is szerepelt.

Mindenhol kimagasló eredményt ért el: 52 különböző konfigurációban átlagosan 23,5 ponttal javított a GPT-5.5 alapértelmezett, skill nélküli teljesítményéhez képest. Különösen jól működött a kis modelleknél is – például a GPT-5.4-nano háromszoros pontszámot ért el bizonyos területeken a SkillOpttal.

Az MI-ügynökök így például szerződésekből, számlákból az adott adatokat pontosan képesek kinyerni, a formátumok következetesek, és a hibák auditálhatók. Bár nem egyértelmű, lehetséges, hogy a legnagyobb ugrás a többlépéses, komplex feladatoknál jött, ahol a vállalatok eddig alig tudtak automatizálni.

Ráadásul a SkillOpt könnyen beépíthető bármely MI-infrastruktúrába, és minden skill-dokumentum rövid, átlátható (legfeljebb 2 000 token, átlagosan 920).

Vállalati kihívások, hatékonyság, jövőkép

Az MI-vezetők számára fontos kérdés a költség és az integráció – milyen erőforrást igényel ez a fejlesztés? Az ipari felhasználásban a tipikus tanítási költség átlagosan 5 400 forint egy adott feladatra, mivel a nagytömegű tesztelés felesleges a gyakorlatban. Az egyetlen feltétel: legyen néhány tucat reprezentatív példa és sablonos visszacsatolás; nem ajánlott a SkillOptot szubjektív, objektíven nem értékelhető területekre használni.

Az implementáció kéz a kézben haladhat más MI-keretrendszerekkel. Az olyan MI-pipeline compiler rendszerek mellett, mint a DSPy, egymást kiegészítve dolgozik. A fejlesztők egy rendszerre betanított skillt gond nélkül átköltöztethetnek egy másikba, akár eltérő méretű modellekhez is, miközben a tudás átvihető marad.

A nyílt forráskódnak köszönhetően már elindultak az első automatizált, önmagukat javító MI-ügynökök, amelyek rendszeresen visszanézik a korábbi feladataikat, és a SkillOpttal magukat optimalizálják.

A jövő így már nemcsak a súlyok módosításáról, hanem arról szólhat, hogyan tanulja meg a modell automatikusan fejleszteni a saját eljárásait, minden felhasználói igényhez alkalmazkodva.

2026, adminboss, venturebeat.com alapján

filózó

Te szerinted jó, ha egy MI magát javítja, vagy inkább maradjon emberi ellenőrzés alatt?
Te bevezetnéd ezt a cégedben, vagy inkább várnál még a technológia fejlődésére?

Legfrissebb posztok

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

Tudomány

MA 09:49

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

💨 A Microsoft károsanyag-kibocsátása tavaly 25%-kal nőtt, ami főleg az adatközpontok gyors terjeszkedésének köszönhető...

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

MI Hírek

MA 09:37

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

📱 A Google ismét újat mutat a Pixel okostelefonok világában – mostantól az eszközökön futó mesterséges intelligencia még erősebbé teszi a mobilokat, úgy, hogy közben védi a felhasználók adatait...

APP

MA 09:11

APPok, Amik Ingyenesek MA, 7/15

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Between Dates Calendar Math (iPhone/iPad)A Between Days alkalmazás egyszerű és gyors megoldást kínál két dátum közötti napok kiszámítására...

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Színes

MA 09:01

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Az Észak-Minnesotában pusztító erdőtüzek füstje hamarosan elérheti az Egyesült Államok északkeleti nagyvárosait, többek között Detroitot, Milwaukee-t, Clevelandet, Philadelphiát és New Yorkot...

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

Tudomány

MA 08:49

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

A Minnesotai Egyetem laboratóriumában újszerű biológiai eredmény született: egy aprócska SpudCell nevű képződmény képes táplálkozni, növekedni, versengeni, osztódni és lemásolni önmagát – vagyis szinte mindent tud, amit egy élő sejt is...

MI Hírek

MA 08:36

Az új Google Képek Pinterest-szerű, felfedezésre kihegyezett átalakítást kapott

A Google Képek (Google Images) megújult külsőt kapott: mostantól személyre szabott galériákat kínál a felhasználóknak, így még könnyebben fedezhetik fel az őket érdeklő képeket...

MI Hírek

MA 08:12

A Google DeepMind az USA-t tenné az MI-szabványok élére

A Google DeepMind vezére, Demis Hassabis szerint az új generációs mesterséges intelligencia egyre komolyabb veszélyeket rejt magában, például a kiberbiztonság és a biológiai fenyegetések terén...

Tudomány

MA 08:01

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

💊 Fontos kérdés, hogy meg lehet-e állítani vagy lassítani az Alzheimer-kór lefolyását, hiszen a demencia legfőbb oka, az Alzheimer-kór, világszerte rengeteg embert érint...

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

Tudomány

MA 07:49

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

🚀 Sikeresen megérkezett kedden a Nemzetközi Űrállomásra egy amerikai–orosz személyzet, miután a kazahsztáni Bajkonurból indultak a Roszkoszmosz által üzemeltetett Szojuz MS-29 fedélzetén...

Tudomány

MA 07:37

A Microsoft Secure Bootja tíz éve lyukas, észre sem vették

🔒 Az informatika egyik legfontosabb biztonsági eleme, a Secure Boot, már csaknem tíz éve lényegében védtelenné vált – és ezt eddig senki sem vette észre...

A csípős paprika növelheti egy halálos rák kockázatát?

Tudomány

MA 07:24

A csípős paprika növelheti egy halálos rák kockázatát?

Bár a csípős paprika számos kultúra elválaszthatatlan része, és egyes laboratóriumi kísérletek a bennük található vegyületeket, például a kapszaicint gyulladáscsökkentőnek vagy akár daganatellenesnek mutatják, az utóbbi évek humán kutatásai nem ennyire egyértelműek...

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Tudomány

MA 07:02

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Április 6-án négy űrhajós indult el az Artemis II misszió keretében az Orion űrhajóval, és körülbelül 40 percig teljesen eltűntek a Föld látóteréből...

Színes

MA 06:38

A Microsoft rekordméretű javításözöne: 570 hiba és 3 zero-day

🔧 Szinte példátlanul nagy frissítési csomagot adott ki a Microsoft a 2026...

A volt dolgozók részrehajló MI-t sejtenek a leépítések mögött – perelik a Metát

MI Hírek

MA 06:25

A volt dolgozók részrehajló MI-t sejtenek a leépítések mögött – perelik a Metát

💼 Májusban a Meta megvált dolgozóinak 10 százalékától, közel 8 000 alkalmazottat küldött el, ami jelentős átszervezéssel járt a vállalat MI-re és adatközpontokra irányuló fejlesztései miatt...

HistoryToday

MA 06:05

Történelmi események a mai napon (Július 15.)

Időutazás egyetlen napon: Jeruzsálem falainak áttörésétől 🏰 a Rosetta-kő 🗿 megtalálásán és Napoleon 🚢 megadásán át a Grunwaldnál vívott döntő ütközetig ⚔️, sőt a modern korszakban a törökországi puccskísérletig 🇹🇷 és a Mozilla alapításáig 🦊...

Tudomány

kedd 18:31

Az Ozempic és a Wegovy tényleg lassíthatják a biológiai öregedést?

Tipikus eset, amikor egy ismert gyógyszer egészen váratlan előnyöket kínál. A GLP-1 típusú szerek, mint az Ozempic, a Wegovy vagy a Rybelsus, eredetileg a fogyás, a jobb vércukorszint-szabályozás és a szívbetegségek kockázatának csökkentése miatt váltak népszerűvé...

Tudomány

kedd 17:30

Az indiai tudósok megalkották az emberi agytörzs eddigi legrészletesebb 3D-atlaszát

Indiai kutatók a világ eddigi legrészletesebb, háromdimenziós agytörzs-atlaszát hozták létre, amelyben MRI-felvételeket több mint 500 mikroszkópos szövetrészlettel kapcsoltak össze...

Tudomány

kedd 17:01

A Tejútrendszer mélyén cukrot találtak a kutatók

Többek között különleges eredményre jutottak a kutatók: a Tejútrendszer középpontjához közel egy óriási gázfelhőben felfedeztek egy ritka cukorfélét, az eritrózt, amely nemcsak málnában, hanem barnító krémekben is megtalálható...

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Kriptó

kedd 16:01

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Ami kezdetben ártalmatlannak tűnt, végül az IBM történetének egyik legsötétebb napjához vezetett a tőzsdén...

Tudomány

kedd 15:01

A NASA Perseverance-je célba ért: megvan a marsi maraton

🚀 Történelmi teljesítmény született a Marson: a Perseverance marsjáró öt év és négy hónap után elérte a 42,195 kilométeres maratoni távot...

Színes

kedd 12:01

A régi T‑Mobile-csomagoknak vége: kényszerváltás már ezen a héten

Ami kezdetben ártalmatlannak tűnt, most minden régi T-Mobile-előfizető számára valódi változás: a társaság e héttől kezdve automatikusan átsorolja a 10–15 éves tarifákat – például a Simple Choice, T-Mobile One, One Plus, a Magenta családhoz tartozó, valamint a Sprintből áthozott régi csomagokat – modernebb tarifákra...

Az inflációs adat előtt megroggyan a Bitcoin

Kriptó

kedd 11:31

Az inflációs adat előtt megroggyan a Bitcoin

A legnagyobb kriptovaluták teljesítménye az elmúlt 24 órában jelentősen visszaesett, miután egyre többen valószínűsítik, hogy az amerikai jegybank akár már júliusban kamatemelés mellett dönt...

Az analóg fotózás visszatér: a fiatalok újra tekercsre lőnek

Színes

kedd 11:02

Az analóg fotózás visszatér: a fiatalok újra tekercsre lőnek

Az elmúlt pár évben váratlan fordulat történt a fotózás világában: a fiatal generáció újra felfedezte a filmes fényképezőgépeket...

MI Hírek

kedd 10:49

A Turing-mítosz vége: lehet, hogy tévedett a mesterséges intelligenciáról?

🤔 A mesterséges intelligencia kutatása 75 éve követi Alan Turing útmutatását, aki két alapvető feltételezést tett: az intelligencia létrehozható szoftverből, függetlenül a testtől, és hogy egy gép intelligensnek számít, ha sikerrel utánozni tudja az embert, például egy beszélgetés során...

Az MI átírja a marketinget: a régi szabályoknak befellegzett

MI Hírek

kedd 10:37

Az MI átírja a marketinget: a régi szabályoknak befellegzett

💡 A Fortune 500 cégek vezető marketingesei kénytelenek szembenézni azzal a ténnyel, hogy a korábbi, jól bevált módszerek egyszerűen elavultak...

A júliusi Google-frissítés felturbózza a Play Áruházat, Wear OS-t és a Térképet

Színes

kedd 10:25

A júliusi Google-frissítés felturbózza a Play Áruházat, Wear OS-t és a Térképet

🚀 A legújabb Google System-frissítés idén nyáron ismét ráncfelvarrást hoz az Android-felhasználóknak...

Végre itt a hideg vízzel elkészíthető Cup Noodles!

Színes

kedd 10:01

Végre itt a hideg vízzel elkészíthető Cup Noodles!

🍹 Lényeges szempont, hogy az instant tészták villámgyors megoldást kínálnak, legyen szó egyetemista vacsoráról vagy gyors munkahelyi ebédről...

Színes

kedd 09:48

A Pixel frissítése végre kézre álló csengőhang-, ébresztő- és értesítéskezelést ad

A Google a Pixel telefonokon jelentősen megkönnyíti a csengőhangok, az ébresztők és az értesítések hangerejének szabályozását...

Színes

kedd 09:37

A legnagyobb japán taxitársaság leállította rendszereit kibertámadás után

Felmerül a kérdés, hogy mi történik egy nagyvállalattal, ha leáll a teljes informatikai rendszere?..