
Az MI-s asszisztens felügyelője: egymást ellenőrző MI-ügynökök
A Netflix vezető UI-architektora saját tapasztalatait osztotta meg: amint elkészül egy MI-ügynök, amely automatizál egy munkafolyamatot, rögtön szükség lesz egy második ügynökre is, amely ellenőrzi az első eredményeit. Nem kizárt, hogy idővel több ügynök is párhuzamosan fut, így egyfajta adverzariális kódellenőrzés (adversarial code review) valósul meg, ahol mindegyik más szakterületre koncentrál. Fontos, hogy egy harmadik ügynök irányítsa az együttműködésüket és koordinálja a lépéseiket.
Így a fejlesztő lényegében önmagát sokszorozza meg: miközben egy MI-ügynök egy új funkció kódolásán dolgozik, egy másik már az előkészületekkel foglalkozik a következő feladathoz. Ez a párhuzamosítás fárasztó lehet, főleg amikor a fejlesztő egész nap MI-vel kommunikál.
Kifogyhatatlan étvágy: az MI és a kontextusrendszer problémája
A Meta fejlesztői tapasztalata szerint az MI olyan, mint egy lelkes, de gyakorlatlan junior fejlesztő: sosem fárad el, végtelen mennyiségű információval bombázhatjuk – legalábbis ameddig a tokenkorlátok engedik. Ez azonban oda vezet, hogy az MI kontextusrothadással küzd: minél több adatot adunk neki, annál kevésbé koncentráltak az eredmények, könnyebben téveszt, rossz döntéseket hoz.
Az információk előkészítése, azaz a kontextusmérnökség önálló művészetté nőtte ki magát az MI-s fejlesztésben. Célszerű előre szabályok, eszközök, feladatlisták formájában előkészíteni mindent az MI számára. A jól definiált prompt chaining, amikor lépésről lépésre meghatározzuk, mit várunk a rendszertől, sok felesleges utómunkától kímél meg. Így a fejlesztő egyre inkább egy ügynökhálózat karmestere lesz, miközben egy egyszerű markdown fájlban követi az elvégzett munkákat, nehogy az MI elfelejtse a célt.
Fontos, hogy az MI általában legfeljebb egy-egy feladat 80 százalékát tudja elvégezni. A maradék 20 százalékhoz ismét aránytalanul sok emberi, majd újra MI-munka szükséges – ezzel végtelen munkaspirált alkotva.
Az MI-varázslás határai: a valódi felelősség a kérdésfeltevésen múlik
Nem az MI hibája, ha nem pontosan azt adja, amit szeretnénk – hanem a felhasználóé, aki nem bontotta eléggé részekre a problémát. Az úgynevezett wishful prompting, vagyis reménykedve, varázsigéket írva bízni abban, hogy minden működik majd, nem vezet célra. A profi fejlesztő inkább felosztja a problémát apró, jól meghatározható feladatokra.
Ez maga a mérnöki gondolkodás: a komplex rendszert elemekre bontjuk, aztán minden részhez kijelölünk specialistát – vagy MI-ügynököt. Nem célszerű csak ömleszteni az információkat egy nagy nyelvi modellhez (LLM), hanem fegyelmezetten, funkciók szerint definiált darabokban adagolni. Az IBM egy frissen elérhető, nyílt forráskódú könyvtára, a Tooling Library segít az LLM-eket konkrét, Python-alapú utasításokkal irányítani (például követelmények hozzáadása, káros kimenetek felismerése, strukturált válaszadás).
Fontos fejlemény, hogy az MI-ügynökök hamarosan képesek lehetnek „agyat váltani” – tehát feladatra specializált, kisebb LLM-re váltani egy nagy, univerzális modell helyett. Az IBM eredményei szerint a szűkebb témájú, lassabban, de célzottan dolgozó modellek gyakran felülmúlják a nagyokat.
Az előkészítés ára: explicit útmutatók, szigorú korlátok
A szakértők szerint a kimondatlan elvárások technikai adósságot jelentenek: amit egyértelműnek gondolunk, az az MI számára nem az. Nem elég utasításokat adni, helyette konkrét, szigorú szabályokat és korlátozásokat kell meghatározni, mert a modellek szabadon értelmezik az instrukciókat – a tilalmakat viszont betartják. Ha például egy LLM-nek megtiltod a HTML használatát, azt be fogja tartani. Ennél is biztosabb, ha egyszerűen nem engedélyezel hozzáférést például a GitHubhoz, mert így esélytelen, hogy a rendszer ott dolgozzon.
Az MI-vel való együttműködés ma még messze nem egycsapásra működő varázspálca: az előkészítésbe, ellenőrzésbe, finomhangolásba fektetett energia lesz végül a kulcsa annak, hogy a fejlesztő hasznos, megbízható eredményt kapjon.
Vissza az alapokhoz: egy új programozói univerzum kezdete
Nem kizárt, hogy az MI-technológiák fejlesztőit most az A Galaxis útikalauz stopposoknak (The Hitchhiker’s Guide to the Galaxy) világa várja: az MI nem veszi át helyettünk a munkát, hanem bevezet az előkészületek végtelen országútjára. Az MI-eszközök minden ígéretük ellenére egyre több tervezéssel, ellenőrzéssel, előírással járnak – így bár a kódolás gyorsabb lehet, a valódi eredményhez egyelőre több, precíz mérnöki munka szükséges, mint korábban bármikor.
