
Sikerek és nehézségek az MI automatizálásban
A CUGA a gyakorlatban jelenleg 62%-os sikerrel teljesíti a webes feladatokat, és mintegy 48%-os eredményt ér el az API-feladatok esetében. Fontos megjegyezni, hogy ezek a teljesítmények a hasonló MI-ügynökök között kiemelkedőnek számítanak, annak ellenére, hogy egy emberi dolgozónál ezek az arányok könnyen elbocsátáshoz vezetnének. Mégis a vállalati MI-projektek közel 40%-át várhatóan törlik 2027-ig, mert nem hoznak valódi üzleti értéket.
Ez azonban csak a jéghegy csúcsa
A vállalati folyamatok gyakran egyszerre tucatnyi szabályt és irányelvet követelnek meg. Az IBM saját tesztjein a korábbi ügynökök átlagosan csak 24%-os sikert értek el, míg a szabálykövető megoldások mindössze 15%-ban voltak eredményesek. Amikor öt vagy több szabályt kellett egyszerre követni, az ügynökök eredményessége már csak 7% volt. Ez komoly figyelmeztetés: a nyers teljesítmény mellett a szabálykövetés is kiemelt jelentőségű kell, hogy legyen.
Hogyan működik a CUGA?
A CUGA egy chatszerű réteggel kezdi a munkát, ahol igyekszik értelmezni a felhasználói utasításokat – például a digitális értékesítési adatok lekérését és megjelenítését egy CRM-rendszerben. A feladatokat részfeladatokra bontja, és egy dinamikus feladatnaplóban követi nyomon. A részfeladatokat speciális ügynökök végzik, mint például az API-ügynök, amely biztonságos környezetben generál és futtat pszeudokódot. A rendszer képes rugalmasan újratervezni, ha valami elsőre nem sikerül.
Rugalmasság, de nem tökéletesség
A CUGA támogatja a többféle nyílt MI-modellt, például a gpt-oss-120b-t vagy a Llama-4-Maverick-17B-t, és együttműködik a low-code MI-alkalmazásokat támogató AgentStudio platformmal. Fontos kiemelni, hogy a CUGA jelenleg is fejlesztés alatt áll; néha például előfordul, hogy a feladatlánc végén nem sikerül kilépnie. Mégis a CUGA jelentős lépés a vállalati MI-automatizálás fejlődésében, még ha a teljes önjáróság attól még messze van.
