
Miért más az ALE-Agent szemlélete?
Az AHC058 verseny feladata egy, a tényleges vállalati folyamatokhoz hasonló géppark irányítása volt – gépek almákat termelnek, más gépek pedig az almatermelő gépeket építik. Az volt a cél, hogy adott lépésszám alatt a lehető legnagyobb teljesítményt érjék el. A hagyományos vállalati problémákban általában egy domain szakértő meghatározza a célfüggvényt (azaz: pontozó (scorer)), majd mérnökök fejlesztenek optimalizáló algoritmusokat hozzá – ez gyakran időigényes és nehezen általánosítható feladat.
Emberi oldalról a jól bevált stratégiák közé tartozik a „mohó” (greedy) módszer (lépésről lépésre a legjobbnak tűnő lehetőséget választják), majd a „szimulált hűtés” (simulated annealing), ahol a már meglévő terven apró, véletlen változtatásokat próbálnak ki. Azonban, ha az első terv alapja hibás, ezek a próbálkozások sem képesek jelentős eredményre. Ebből adódóan az ALE-Agent újítása abban rejlik, hogy a statikus indítás helyett dinamikus újjáépítést végez: saját maga alakít ki egy „vitalitás” fogalmát, értéket rendel a még üzemképtelen komponensekhez is, vagyis előre is képes reagálni, és a jövőbeni potenciált már most számításba veszi. Így nemcsak a jelenlegi lehetőségekre, hanem a jövőbeli értékek halmozódására alapozza döntéseit. Ez lényegében a kamatos kamat hatásának hasznosítása a gépi optimalizációban.
Ezenfelül az ügynök folyamatosan reflektál a próbálkozásaira: szöveges „felismeréseket” generál minden új körben, így képes emlékezni a hibás irányokra, elkerülni a korábbi zsákutcákat, és hosszabb távon is következetes stratégiát követni. A mohó módszert nem szüntette meg, hanem közvetlenül beépítette a szimulált hűtés fázisába is, és így kerüli el, hogy helyi maximumokban ragadjon.
Új korszak kezdete a vállalati optimalizációban
Ez a megközelítés szinte készen átültethető a vállalati informatikába, ahol az ügyfelek már rendelkeznek világos célfüggvényekkel. Ma még ritka, hogy egy cég saját mérnökei képesek ilyen bonyolult optimalizációt programozni, de az ALE-Agent demonstrálja, mire képes az MI: az ember meghatározza a célt, az MI pedig mindent hozzáigazít. A hangsúly már nem a fejlesztőkapacitáson, hanem a pontos, mérhető célokon van. Ha a vállalat meg tudja mérni, mit akar, az MI optimalizálja azt – legyen szó útvonaltervezésről, szerverterhelés-elosztásról vagy erőforrás-allokációról.
A Sakana AI szerint ez valóban demokratizálja az optimalizációt: a nem technikai hátterű ügyfelek is könnyedén variálhatják a feltételeket, amíg ideális eredményt nem kapnak. Maga az ALE-Agent azonban még fejlesztés alatt áll, jelenleg csak belső projektek és pilot-együttműködések részese, a cég nem tervezi széles körű megosztását.
Az igazi áttörést azonban a jövő MI-ügynökei jelenthetik, amelyek már saját maguk alakítják ki a célfüggvényeiket is. Ez különösen ott lehet hasznos, ahol az emberek sem tudják könnyen meghatározni az ideális kiindulópontot.
Mennyi az intelligencia ára?
Az ALE-Agent négyórás futtatása hozzávetőleg 470 ezer forintnyi (1 300 USD) számítási költséget igényelt, több mint 4 000, MI-modelleken végrehajtott gondolkodási művelettel. Bár egyszeri feladatra ez soknak tűnhet, valójában egy-egy sikeres optimalizáció akár több millió forintnyi éves megtakarítást hozhat, tehát az arányok rendkívül kedvezőek lehetnek.
Lényeges hangsúlyozni, hogy miközben a tokenek ára csökken, a teljes vállalati költés mégis nőhet – a cégek ugyanis inkább elmélyítik a keresést, hogy a legjobb eredményt kapják meg. A sikerhez tehát nemcsak az MI-k okosodása, hanem a gondolkodási keretek bővítése és a hosszabb „tervezési idő” biztosítása is elengedhetetlen. Ez adja meg a lehetőséget arra, hogy az MI tényleg felvegye a versenyt az emberi szakértelemmel.
