
Ekkor következett be a fordulat
A Microsoft nyílt forráskódú SkillOpt keretrendszere teljesen új módszert kínál: lehetővé teszi, hogy egy MI-ügynök a saját skill-dokumentációját automatikusan optimalizálja, méghozzá anélkül, hogy a mögöttes modell súlyaihoz nyúlna. A SkillOpt úgy működik, hogy a skill-dokumentumokat „tanítható objektumként” kezeli, és folyamatosan javít rajtuk a teljesítmény visszacsatolásai alapján. Mindezt a mélytanulásból ismert optimalizálási technikákkal teszi, miközben a modell paraméterei változatlanok maradnak.
Számos ipari teszten már bizonyított: a GPT-5.5-höz és a Qwenhez hasonló modellek pontosságát jelentősen növelte, egyszerűen azzal, hogy a skill-dokumentumot okosabban szerkesztette. Az eredmény: karcsú, jól hordozható tudáscsomagok, melyek lehetővé teszik az MI-ügynökök számára, hogy új területeken is gyorsan bevethetők legyenek.
Az MI-skillek optimalizálásának problémái
A skill-dokumentumok a procedurális tudást természetes nyelven fogalmazzák meg: tartalmazzák a szükséges domain-specifikus szabályokat, eszközhasználati elveket, kimeneti formátumokat és ismert hibákat. Ezek nélkülözhetetlenek ahhoz, hogy egy MI-ügynök egyedi vállalati igényekhez igazodjon. Mivel ezek csak szöveges fájlok, könnyen frissíthetők – papíron. A gyakorlatban viszont a kézi szerkesztés lassú, nehézkes, és szinte lehetetlen őket matematikai alapokra építve, stabilan és megbízhatóan optimalizálni.
A fő gond, hogy senki sem tudja garantálni, hogy az új változat tényleg javít a teljesítményen, vagy csak lelassítja, esetleg félrevezeti az MI-t. Gyakran nincs kontroll a lépések nagyságán, nincs megbízható validáció, és az elrontott módosítások újra és újra előbukkannak.
A matematikai fegyelem: a SkillOpt működése
A SkillOpt teljesen új szemléletet hoz: a szöveges dokumentumot úgy alakítja, mintha az egy tanítható paraméter lenne. Először lefuttat egy „befagyasztott” ügynökmodellel egy mintafeladatot, és az eredményekből szétválogatja a sikereket és a kudarcokat. Ezután a minták alapján javaslatokat tesz a dokumentum szerkesztésére (hozzáad, töröl, lecserél részeket), és rangsorolja a módosításokat. Egyszerre csak korlátozott számú változtatást engedélyez, hogy ne távolodjon el az előző, bizonyítottan működő állapottól: ez a lépésméret vagy „tanulási ráta”. Az új skilleket validációs mintán leteszteli, és ha hoznak javulást, elfogadja, ellenkező esetben a módosítás megy a „hibás szerkesztések” tárolóba. Az egész folyamat szigorúan visszacsatolt, kontrollált, és minden döntést számszerűsített teljesítmény alapján hoz meg.
Időszakonként a SkillOpt lassú, de stabil frissítést végez, amely összeveti a régi és az új skillek alapján lefuttatott feladatokat, így hosszú távon is megőrzi a ténylegesen értékes fejlesztéseket.
SkillOpt: gyakorlatban és eredmények
A SkillOptot számos eltérő modellel és végrehajtási környezettel tesztelték – a csúcskategóriás GPT-5.5-től a közepes GPT-5.4-mini és Qwen3.5-4B modellekig, egyszerű csevegéstől a komplex kódgenerálásig (Codex CLI, Claude Code). Az értékelések során kérdés–válasz, eszközhasználatot igénylő programírás és multimodális dokumentumelemzés is szerepelt.
Mindenhol kimagasló eredményt ért el: 52 különböző konfigurációban átlagosan 23,5 ponttal javított a GPT-5.5 alapértelmezett, skill nélküli teljesítményéhez képest. Különösen jól működött a kis modelleknél is – például a GPT-5.4-nano háromszoros pontszámot ért el bizonyos területeken a SkillOpttal.
Az MI-ügynökök így például szerződésekből, számlákból az adott adatokat pontosan képesek kinyerni, a formátumok következetesek, és a hibák auditálhatók. Bár nem egyértelmű, lehetséges, hogy a legnagyobb ugrás a többlépéses, komplex feladatoknál jött, ahol a vállalatok eddig alig tudtak automatizálni.
Ráadásul a SkillOpt könnyen beépíthető bármely MI-infrastruktúrába, és minden skill-dokumentum rövid, átlátható (legfeljebb 2 000 token, átlagosan 920).
Vállalati kihívások, hatékonyság, jövőkép
Az MI-vezetők számára fontos kérdés a költség és az integráció – milyen erőforrást igényel ez a fejlesztés? Az ipari felhasználásban a tipikus tanítási költség átlagosan 5 400 forint egy adott feladatra, mivel a nagytömegű tesztelés felesleges a gyakorlatban. Az egyetlen feltétel: legyen néhány tucat reprezentatív példa és sablonos visszacsatolás; nem ajánlott a SkillOptot szubjektív, objektíven nem értékelhető területekre használni.
Az implementáció kéz a kézben haladhat más MI-keretrendszerekkel. Az olyan MI-pipeline compiler rendszerek mellett, mint a DSPy, egymást kiegészítve dolgozik. A fejlesztők egy rendszerre betanított skillt gond nélkül átköltöztethetnek egy másikba, akár eltérő méretű modellekhez is, miközben a tudás átvihető marad.
A nyílt forráskódnak köszönhetően már elindultak az első automatizált, önmagukat javító MI-ügynökök, amelyek rendszeresen visszanézik a korábbi feladataikat, és a SkillOpttal magukat optimalizálják.
A jövő így már nemcsak a súlyok módosításáról, hanem arról szólhat, hogyan tanulja meg a modell automatikusan fejleszteni a saját eljárásait, minden felhasználói igényhez alkalmazkodva.
