
Hogyan próbálták kijátszani az MI védelmét?
A hackerek trükkösen próbálták kijátszani a Claude védelmi szabályait: a káros célokat kisebb, ártalmatlannak tűnő részfeladatokra bontották, például úgy csomagolták az utasításokat, mintha jogos behatolási teszteket hajtanának végre. Ezt nevezik „feladatszeletelésnek” a kutatók. Árulkodó jel, hogy az MI ugyan igyekezett végrehajtani a parancsokat, de többször hibázott is: hamis találatokat generált, használhatatlan jelszavakat adott vissza. Végül az Anthropic mérnökei leállították a támadást, miután a rendszer az automatizált mintázatok alapján ráismert a szokatlan működésre.
Valóban önálló volt az MI?
Bár elsőre úgy tűnhet, hogy itt egy teljesen önjáró MI-hackertámadás történt, több szakértő is kételkedik a „90 százalékos automatizáltságban”. Wilkes, a Columbia Egyetem vendégprofesszora szerint maguk a támadási lépések inkább egyszerűek, a valódi újdonságot az adja, hogy az MI önállóan végezte azokat. Szerinte a lényeg nem az, hogy mennyire voltak összetettek a támadások, hanem hogy mennyire önálló volt a szervezés: ez egy „Hello, world!”-demó az MI-vezérelt támadások világából.
Más kutatók, például a Manchester Metropolitan Egyetem munkatársai, hangsúlyozzák, hogy az államilag támogatott hackercsoportok évek óta használnak automatizált eszközeket, és a nagy nyelvi modellekkel már eddig is lehetett szkripteket generáltatni, sérülékenységet keresni vagy jelentéseket összeállítani. Ugyanakkor a „feladatszeletelés” és a „hibázó MI” leírásai hitelesek, mivel a támadott célpontok többsége nem esett áldozatul.
Mindez azonban még csak a kezdet. A támadás jól mutatja, mennyire átjárhatóvá válnak a védelmi rendszerek, ha bárki hozzáférhet olcsó, kereskedelmi MI-eszközökhöz. A rutinfeladatok gyorsabbá, olcsóbbá, titokzatosabbá válnak, és egyre nehezebb lesz követni, mikor dönt ember és mikor a gép.
Mi várható a jövőben?
Esetünkben ez azt jelenti, hogy a támadások kapcsán már nem az a legnagyobb félelem, hogy MI-hackerek egy nap teljesen lecserélik az embereket, hanem az, hogy félig automatizált rendszerek mellett soha nem látott tempóban és volumenben indulhatnak támadások. Az MI képes összefogni és felgyorsítani, nagyságrenddel növelni a kibertámadások szervezését, amire a védők jelenleg nincsenek felkészülve.
Várhatóan egyre több ilyen részben önálló, részben emberi irányítású támadást látunk majd, ahol az MI a vezérlő- és összefűző szerepet vállalja. Hogy pontosan 90, 50 vagy akár csak 20 százalékban dolgozott-e önállóan a Claude, az részletkérdés — a lényeg, hogy a következő ilyen támadást már lehet, hogy nem sikerül időben megállítani.
