
Kijátszható védelmi vonalak
A módszer lényege, hogy a tiltott szavakat HTML-címkék közé rejtik, így az MI-nek nem tűnik fel, mit is kellene elrejtenie. Az egész kérést „találós játékként” állítják be, ettől a rendszer valós, védett adatokat is kiadhat – egyes esetekben még konkrét, bankhoz tartozó kulcsokat is. A végső trükk a „Feladom” mondat volt: erre a ChatGPT parancs szerint mindent elárult, amit addig rejtegetett.
Komoly következmények
Bár a kipréselt kódok nem voltak egyediek – többet már online fórumokon is megosztottak –, a módszer veszélyességét az mutatja, hogy bármilyen érzékeny adat vagy akár káros URL is megszerezhető lehet így. Mindez arra világít rá, hogy az MI-t fejlesztőknek nemcsak egyszerű kulcsszűrőkkel, hanem intelligensebb, logikai védelmi rendszerekkel is számolniuk kell. A társadalmi manipuláció elleni védekezést is meg kellene valósítaniuk – különben az MI továbbra is támadható marad.