
Egyetlen emberi adatpont is megmentheti a rendszert
Yasser Roudi professzor szerint a veszély egyszerűen hárítható. Ugyanis a modell-összeomlás akár egyetlen emberi eredetű adatponttal megelőzhető, még abban az esetben is, ha a tréningadatok zöme gépi forrásból származik. Ezt a következtetést egy nemzetközi csoport – köztük a King’s College London, a Norvég Tudományos és Technológiai Egyetem, valamint az olasz Abdus Salam Nemzetközi Elméleti Fizikai Központ kutatói – közös kutatása igazolta, amelyet május közepén publikáltak a Physical Review Letters szakfolyóiratban.
Hogyan omlanak össze az MI-modellek?
Noha a teljes modell-összeomlás a gyakorlatban még nem fordult elő, bárki, aki a ChatGPT-hez vagy a Geminihez hasonló rendszert használ, már tapasztalhatott pontatlan vagy képzeletből gyártott válaszokat. Az igazi összeomlás veszélye legfőképp akkor jelenik meg, ha a modelleket ismételten gépi eredetű szintetikus adatokkal tanítják, vagyis amikor MI „tanít” más MI-t. Ilyenkor az információk közötti különbségek kisimulnak, az algoritmusok homogenizált válaszokat adnak, és elsivárosodik a tartalom, eltűnik a ritka vagy különleges információ. A folyamat végén a modellek már csak értelmezhetetlen zagyvaságot produkálnak.
A „valódi igazság” visszaterelése
A kutatók az exponenciális családba tartozó, kisebb MI-modelleken vizsgálták, hogyan és miért alakul ki a modell-összeomlás, és miként lehet azt kivédeni. Ha egy szintetikus adatkészlethez rendszeresen hozzáadnak egy valóban emberi eredetű, igazoltan helyes adatpontot, az képes megakadályozni az összeomlást. Ez lehet például egy olyan képosztályozási feladat, ahol egy valós fotót egyértelműen, emberi módon azonosítanak — nem pedig egy másik MI által készített vagy rendszerezett adat kerül a készletbe. Ezzel az eljárással igazolt „valódi igazságot” vezetnek be a tanulási folyamatba.
Következő lépések és lehetséges jövő
A módszert most már nagyobb, komplexebb, modern mesterségesintelligencia-modelleken is tesztelni szeretnék. Céljuk, hogy kiderüljön, mekkora léptékben marad érvényes az eredmény. Ha a módszer működőképes marad, jelentősen csökkentheti a modell-összeomlás kockázatát azokban az MI-kben is, amelyek a hétköznapi életünkben feltűnnek, például ügyfélszolgálati chatbotokban vagy diagnosztikai rendszerekben. Ugyanis most először sikerült konkrét szabályokat alkotni arra, hogyan lehet hosszú távon megelőzni ezt a katasztrofális jelenséget.
