
Pszeudonimitás: már csak illúzió?
Korábban inkább csak a legelszántabb adatvadászok tudták felderíteni, ki rejtőzik egy-egy felhasználónév mögött — ehhez komoly technikai tudás és automatizált adatgyűjtés kellett. Az MI viszont néhány kattintással 68%-os sikerrel képes megfejteni a rejtett személyazonosságokat, és akár 90%-os pontossággal azonosítja a konkrét neveket. Ez a fejlődés a privát véleményalkotás szabadságát, a kíváncsi tekintetek elől való bujkálást is veszélyezteti. Mostantól könnyebbé válik a rágalmazás, a zaklatás vagy akár a személyre szabott reklámcélzás azok számára, akik eddig azt hitték, a pszeudonimitás megfelelő védelmet nyújt.
Hogyan csinálják?
A kutatók nyilvános fórumok, például a Hacker News és a LinkedIn, valamint a Netflix adatbázisai és a Reddit-posztok segítségével dolgoztak. Az azonosítás egyik eszközeként a különböző platformokon talált profilokat egymáshoz kapcsolták, majd eltávolították az egyértelmű azonosítók minden nyomát. Ezután az MI feladata volt, hogy a posztok szövegéből kikövetkeztessen minden lehetséges személyes vonást — pontosabban, hogy megállapítsa, ugyanaz az ember írta-e a különböző üzeneteket.
Egy másik vizsgálat során a Netflix felhasználói szokásait, politikai preferenciáit és egyéb személyes adatait elemezték az MI segítségével — hasonló módszert alkalmaztak a Reddit-felhasználóknál is. Itt egyenként szétválogatták a válaszokat, majd a puszta szöveg alapján próbálták visszavezetni az adott személyhez. Az eredmények szerint minél több információt oszt meg valaki, annál könnyebb felismerni. Elég volt, ha valaki több mint tíz filmet említett a r/movies vagy kisebb filmes fórumokon, és máris 48,1%-os eséllyel azonosították az illetőt; sőt, a 99%-os pontossággal történő azonosítás aránya is 17%-ra ugrott.
Az MI az anonimitás ellensége
Az MI nemcsak gyorsabban és hatékonyabban dolgozik, mint a régi, manuális vagy félautomatizált eszközök, hanem sokkal rugalmasabb is. Képes weboldalakat böngészni, logikai következtetéseket levonni, és a legapróbb összefüggéseket is észrevenni. Az igazán megdöbbentő, hogy már egy rövid, személyes kérdőív alapján is 7%-os sikeres azonosítást értek el — ez elsőre kicsinek tűnhet, de laikusok számára is világos, hogy az MI fejlődésével ezt az arányt drámaian növelni lehet.
Az MI-vel támogatott támadások messze meghaladják a Netflix-díj (Netflix Prize) versenyben vagy egyéb klasszikus technikákkal elért sikerszázalékokat. Míg a régi módszerek gyorsan elveszítik pontosságukat, az MI-alapú kísérletek még a legalacsonyabb találati arány mellett is sokszor megsokszorozzák az azonosításhoz felhasználható információ mennyiségét.
Van még esély az anonimitásra?
A szakértők szerint az egyetlen valódi megoldás az lenne, ha az online platformok visszafognák az MI számára hozzáférhető adatokat: szigorúbb API-korlátokat, az automatikus letöltések tiltását, illetve a tömeges adatletöltés megakadályozását említik. Az MI-modellek fejlesztőinek is lépniük kellene, például megtagadni a deanonimizáló lekérdezéseket.
Ennek ellenére a legtöbb felhasználónak már csak annyi marad, hogy kevesebbet tesz közzé, vagy rendszeresen törli régi hozzászólásait. Sőt, ha az MI képességei tovább fejlődnek, nem kizárt, hogy kormányok leplezhetnek le anonim véleménynyilvánítókat, cégek pedig szinte tökéletes reklámprofilt készíthetnek rólunk.
Az MI ereje egyértelműen új kihívás elé állítja az adatvédelmet — az anonimitás világa lassan a múlté.
