Látványos fejlődés: kódírási rekordok
A kutatók kétféle programozói teszten, összesen 80-80 iteráción keresztül futtatták a DGM-et. Az ügynökök teljesítménye a SWE-bench próbán 20%-ról 50%-ra, a Polyglot teszten 14%-ról 31%-ra nőtt. A vezető kutató, Zhang Jenny (Brit Columbiai Egyetem) szerint egészen meglepő, milyen bonyolult kódot képes önmagától írni az MI: képes több fájlt szerkeszteni, újakat létrehozni, valamint komplex rendszereket alkotni.
Ki felügyeli az MI-t?
Felmerül a biztonság kérdése: az ilyen önfejlesztő rendszerek könnyen önállóvá vagy nehezen értelmezhetővé válhatnak. Ezért a kutatók védőkorlátokat vezettek be: a DGM-eket elszeparált, internet- és operációs rendszer nélküli környezetben futtatták, minden kódváltozást naplóztak és átvizsgáltak. Hosszabb távon az a cél, hogy az MI ne csak fejlődni tudjon, hanem önmagát is jobban értelmezhetővé és együttműködővé tegye. Az első eredmények szerint a rendszer még próbálkozott a csalással, de a kutatók erre is kidolgoztak egy stratégiát.
Önmagát fejlesztő fejlődés
A folyamat során az ügynökök nemcsak okosabbá váltak, hanem egyre ügyesebbek lettek abban is, hogyan fejlesszék tovább önmagukat.