
Hosszabb futás, önálló döntések
Lényeges hangsúlyozni, hogy egy MI-ügynöknek már nemcsak azt kell meghatározni, mit lát és mire képes, hanem azt is, hogyan válik egyre autonómabbá. A felhasznált nagy nyelvi modellek (LLM-ek) immár nemcsak végrehajthatnak feladatokat, hanem saját maguk dönthetnek arról is, mely információkra van szükségük, és melyeket szűrnek ki. Ez a megközelítés lehetővé teszi, hogy a fejlesztők ne előre kódolják be az összes szükséges eszközt és információt, hanem az ügynök csak akkor töltse be a számára fontos tudást, amikor valóban szüksége van rá.
Az összefüggés megőrzése: Deep Agents és LangChain
Eddig a modellek gyakran nem voltak elég fejlettek ahhoz, hogy megbízhatóan futtassák őket visszatérő ciklusokban, ezért körülményes grafikus vagy láncolt rendszereket alkalmaztak. Az AutoGPT például – ami egy időre a leggyorsabban növekvő GitHub-projekt lett – éppen ezért hanyatlott le gyorsan: a modell még nem bírta el a hosszabb futást. Mostanra azonban ezt a küszöböt is átlépték.
A LangChain egy újgenerációs megoldást, a Deep Agents-t kínálja: ezek testreszabható MI-ügynökök, amelyek képesek több szakaszon keresztül tervezni, fájlrendszerekhez hozzáférni, kódokat futtatni, feladatokat delegálni és párhuzamosítani, sőt a részfeladatok kontextusát is automatikusan tömörítik annak érdekében, hogy minél kevesebb memóriát használjanak.
Jókora rugalmasság, hatékonyabb hibakezelés
Amikor az MI-ügynökök hozzáférnek kódfuttató, Bash- vagy más rendszerszintű eszközökhöz, jelentősen nő a működésük rugalmassága. Ha a specializált részfeladatokra csak akkor töltik be a szükséges ismereteket, amikor valóban kell, azzal elkerülhető, hogy mindent egyszerre töltsenek be, ami átláthatatlanná tenné a munkát.
A fejlesztők már képesek úgy fejleszteni ezeket az ügynököket, hogy pontosan tudják követni, éppen milyen lépésnél tartanak a folyamatban, és ha hibáznak, gyorsabban visszafejthető, hogy miért nem voltak képesek megfelelően végrehajtani a feladatot: általában hiányzott a kontextus, vagy nem kaptak megfelelő információt a megfelelő pillanatban.
Ma már több kell, mint csupán jó modell
A fejlemények minden várakozást felülmúltak: a leghatékonyabb MI-ügynököket azok a harnessek támogatják, amelyek lehetőséget adnak hosszabb folyamatok koherens lebonyolítására, sőt saját döntési jogköröket is adnak a modellnek, hogy mikor és mit tömörítsen, illetve mely részfeladatokat vonjon össze. Az ügynökök fejlesztésénél így már nemcsak egyre jobb modellekre, hanem új generációs rendszerarchitektúrákra és minden részletre kiterjedő kontextusmenedzsmentre is szükség van.
