Az MI-ügynökök élesbe mennek – nem csak jobb modellekkel

Ahogy a modern MI-modellek egyre okosabbak és sokoldalúbbak lesznek, nem elég csak a mesterséges intelligencia fejlődésére építeni – a köré épített eszközöket, úgynevezett harnesseket is fejleszteni kell. Ezek a rendszerek korábban elsősorban abban segítettek, hogy a modelleket ne tudják végtelen ciklusban futtatni, vagy csak korlátozottan tudjanak külső eszközöket használni. Ma már azonban célzottan MI-ügynökökre szabott harnessek készülnek, amelyek lehetővé teszik, hogy az ügynökök önállóan, hosszabb ideig tartó, összetettebb feladatokat is elvégezhessenek.

Hosszabb futás, önálló döntések

Lényeges hangsúlyozni, hogy egy MI-ügynöknek már nemcsak azt kell meghatározni, mit lát és mire képes, hanem azt is, hogyan válik egyre autonómabbá. A felhasznált nagy nyelvi modellek (LLM-ek) immár nemcsak végrehajthatnak feladatokat, hanem saját maguk dönthetnek arról is, mely információkra van szükségük, és melyeket szűrnek ki. Ez a megközelítés lehetővé teszi, hogy a fejlesztők ne előre kódolják be az összes szükséges eszközt és információt, hanem az ügynök csak akkor töltse be a számára fontos tudást, amikor valóban szüksége van rá.

Az összefüggés megőrzése: Deep Agents és LangChain

Eddig a modellek gyakran nem voltak elég fejlettek ahhoz, hogy megbízhatóan futtassák őket visszatérő ciklusokban, ezért körülményes grafikus vagy láncolt rendszereket alkalmaztak. Az AutoGPT például – ami egy időre a leggyorsabban növekvő GitHub-projekt lett – éppen ezért hanyatlott le gyorsan: a modell még nem bírta el a hosszabb futást. Mostanra azonban ezt a küszöböt is átlépték.

A LangChain egy újgenerációs megoldást, a Deep Agents-t kínálja: ezek testreszabható MI-ügynökök, amelyek képesek több szakaszon keresztül tervezni, fájlrendszerekhez hozzáférni, kódokat futtatni, feladatokat delegálni és párhuzamosítani, sőt a részfeladatok kontextusát is automatikusan tömörítik annak érdekében, hogy minél kevesebb memóriát használjanak.

Jókora rugalmasság, hatékonyabb hibakezelés

Amikor az MI-ügynökök hozzáférnek kódfuttató, Bash- vagy más rendszerszintű eszközökhöz, jelentősen nő a működésük rugalmassága. Ha a specializált részfeladatokra csak akkor töltik be a szükséges ismereteket, amikor valóban kell, azzal elkerülhető, hogy mindent egyszerre töltsenek be, ami átláthatatlanná tenné a munkát.

A fejlesztők már képesek úgy fejleszteni ezeket az ügynököket, hogy pontosan tudják követni, éppen milyen lépésnél tartanak a folyamatban, és ha hibáznak, gyorsabban visszafejthető, hogy miért nem voltak képesek megfelelően végrehajtani a feladatot: általában hiányzott a kontextus, vagy nem kaptak megfelelő információt a megfelelő pillanatban.

Ma már több kell, mint csupán jó modell

A fejlemények minden várakozást felülmúltak: a leghatékonyabb MI-ügynököket azok a harnessek támogatják, amelyek lehetőséget adnak hosszabb folyamatok koherens lebonyolítására, sőt saját döntési jogköröket is adnak a modellnek, hogy mikor és mit tömörítsen, illetve mely részfeladatokat vonjon össze. Az ügynökök fejlesztésénél így már nemcsak egyre jobb modellekre, hanem új generációs rendszerarchitektúrákra és minden részletre kiterjedő kontextusmenedzsmentre is szükség van.

2025, adminboss, venturebeat.com alapján

Share on Social Media