
Az MI-ügynök új korszakot nyit – és sebezhetővé válik
A hagyományos chatbotok, például a ChatGPT, csak beszélgetnek: tippeket adnak, magyaráznak. Az MI-ügynök azonban aktívan cselekszik, ablakokat nyit meg, űrlapokat tölt ki, gombokat nyom meg, sőt, akár foglalásokat is intéz. Lényeges hangsúlyozni, hogy ekkor már nem csak egy rossz válasz a tét, hanem az egész digitális világod, hiszen ha feltörik, akár minden online adatodhoz hozzáférhetnek.
Most az Oxfordi Egyetem kutatói bemutatták, hogy teljesen ártalmatlannak tűnő képek – legyen az háttérkép, reklám, vagy akár egy aranyos macskás poszt – rejtett, szemmel nem látható utasításokat tartalmazhatnak, amelyek MI-ügynökökön keresztül átvehetik a géped felett az irányítást. Például egy Twitteren megjelenő, módosított Taylor Swift-fotó átveheti az ügynököd felett az uralmat, titokban ellophatja a jelszavaidat, majd továbbszórhatja a képet az ismerőseidnek, hogy az ő gépüket is megfertőzze.
Képek, amelyek észrevétlenül támadnak
Az új kutatás szerint egyelőre nincs bizonyított esete ennek a módszernek a való világban, de az MI-ügynökök elterjedésével gyorsan aktuális veszélyforrássá válhat. Ha nem használsz MI-ügynököt, nem kell aggódnod, pusztán egy trükkös képtől önmagában nem történik semmi. Azonban az MI-ügynökök rohamos fejlődésével és terjedésével egyre nő a kockázat.
Ezek a támadások elsősorban azokra az MI-ügynökökre jelentenek veszélyt, amelyek nyílt forráskódú MI-rendszerekre épülnek. Ezeknél bárki hozzáférhet a program logikájához, így könnyedén tesztelheti, hogy a beszúrt képpontokra (pixelekre) hogyan reagál a gépi látás. A támadók apró pixelmódosításokat rejtenek el a képeken, amit az emberi szem nem vesz észre, de az ügynök felismeri, és elindítja a rosszindulatú utasításokat.
Hogyan lát a számítógép?
Az ember képet lát, a gép számokat. Egy kutyafotón az agyunk a lógó füleket, nedves orrot nézi, de az MI csak számhalmazokat, színértékeket elemez. Ha néhány pixel értéke megváltozik, az egész rendszert félrevihetik: hiába van a képen kutya, az MI akár macskát is láthat. Ugyanígy, apró, rejtett módosításokkal bármilyen képet utasítássá lehet alakítani az ügynök számára. Fontos, hogy ehhez még csak szöveg sem kell, elég maga a kép.
A háttérképed mindent megmutat az MI-nek
Az MI-ügynökök nem tudják közvetlenül érzékelni a képernyőt, ezért rendszeresen képernyőképeket készítenek, hogy eligazodjanak rajtuk. Így bármilyen tartalom, ami folyamatosan jelen van a monitorodon – például a háttérkép –, könnyedén becsaphatja az ügynököt. Elég, ha akár egy kis sarokban elbújik a rejtett parancs, az MI-ügynök azt olvassa és végrehajtja. Még átméretezés vagy képkomprimálás esetén is felismerhető marad a kódolt üzenet.
A rejtett parancs akár egészen rövid is lehet, például megnyittathat egy adott weboldalt, ahol egy újabb fertőzött kép várja az ügynököt. Így láncolhatók a támadások, szinte végtelen lehetőséget adva a támadóknak, hogy további utasításokat adjanak a gépnek.
Felkészülés a veszélyre – szükség van védelemre
A kutatók remélik, hogy eredményeikkel még időben figyelmeztethetik az MI-ügynökök fejlesztőit, és így a technológia tömeges elterjedése előtt be tudnak vezetni védelmi mechanizmusokat. Az egyik lehetséges módszer a modellek újratanítása, hogy az apró, kódolt parancsok ne tudjanak félrevezetni egy MI-ügynököt.
Ennek ellenére azt is fontos látni, hogy a zárt forráskódú MI-rendszerek sem sebezhetetlenek csak azért, mert működésük nem nyilvános. Ha nem tudjuk, hogyan működnek a háttérben, a sebezhetőségeket sem tudjuk igazán feltárni.
Következmények és jövőkép
Mindezek alapján megállapítható, hogy az MI-ügynökök időszaka hamarosan eljön, s könnyen lehet, hogy a következő két évben már teljesen megszokottnak számítanak majd. Azonban a fejlesztők és a felhasználók csak most kezdik felismerni, mennyire sebezhetőek lehetnek ezek a rendszerek. Hamarosan tehát nem csak az lesz a kérdés, képes-e az MI segíteni, hanem az is, hogyan védhetjük meg magunkat a digitális háttérből támadó, szinte láthatatlan veszélyekkel szemben – még akkor is, ha Taylor Swift mosolyog vissza ránk a monitorról.