Hogyan leplezd le: Így árulja el a chatbot a szövegben saját magát
Egyre növekszik a szakadék azok között, akik generatív MI chatbotokat használnak szövegek észrevétlen előállítására, és azok között, akik megpróbálják leleplezni őket. Sokan úgy vélik, ismerik az árulkodó jeleket, de egyre nehezebb eldönteni, mit írt ember és mit írt a MI.
Négy amerikai egyetem kutatói azonban előrelépést értek el olyan nyelvi ujjlenyomatok azonosításában, amelyek kiderítik, melyik nagy nyelvi modell (LLM) állított elő egy adott szöveget.
“Minden nap újabb chatbotok jelennek meg, és mi interakcióba lépünk velük, de valójában nem értjük a köztük lévő különbségeket,” mondja Mingjie Sun, a Carnegie Mellon Egyetem kutatója és a tanulmány vezető szerzője. “Azzal, hogy betanítunk egy gépi tanulási osztályozót erre a feladatra, és megvizsgáljuk ennek az osztályozónak a teljesítményét, felmérhetjük a különböző LLM-ek közötti eltéréseket.”
Árulkodó nyelvi jelek
Sun és kollégái egy olyan gépi tanulási modellt fejlesztettek ki, amely öt népszerű LLM kimenetét elemezte, és 97,1%-os pontossággal tudta megkülönböztetni őket egymástól. A gépi tanulási modelljük minden egyes LLM-re jellemző egyedi nyelvi furcsaságokat tárt fel.
A ChatGPT modellje például hajlamosabb a “hasznosít” szó használatára, mint más modellek. A Google modellje előszeretettel mondja azt, hogy “bizonyosan”. A Google modellje gyakran vezeti be következtetéseit az “alapvetően” szóval, míg az Anthropic modellje túlzottan használja az olyan kifejezéseket, mint a “… szerint” és “a szöveg szerint”, amikor forrásaira hivatkozik.
Egyedi stílusjegyek
Az xAI modellje kitűnik azzal, hogy diskurzívabb és didaktikusabb, gyakran emlékezteti a felhasználókat, hogy “emlékezzenek” a kulcspontokra, miközben végigvezeti őket az érveken olyan kifejezésekkel, mint “nemcsak” és “hanem … is”.
“Az írás, a szóválasztás, a formázás mind különböző,” mondja Yida Yin, a Kaliforniai Egyetem (Berkeley) kutatója és a tanulmány társszerzője. “Nem csak azt lehet megállapítani nagy biztonsággal, hogy MI-írta-e a szöveget, de azt is, hogy melyik MI.”
💸 India újabb lépést tett, hogy a világ technológiai központjává váljon, és 20 évig tartó adómentességet kínál azoknak a külföldi cégeknek, amelyek Indiából kiszolgálva nyújtanak felhőalapú adatokat a világ bármely más országába...
💸 Az Oracle részvényei 5%-ot emelkedtek a hétfői kereskedésben, miután a vállalat bejelentette, hogy 2026-ban 16 500–18 300 milliárd forintnyi tőkét tervez bevonni adósság és részvénykibocsátás útján...
🔮 A tudomány világát új áttörések rázzák fel: az MI végre közelebb vihet minket a DNS titkainak megfejtéséhez, eközben orvosok először tartottak életben beteget mesterséges tüdővel, és egy egzotikus növény látványosan cáfolja az evolúció klasszikus elméleteit...
📱 A Google nemrég visszavonta a Gonosz témacsomagot (Wicked) a Pixel telefonokról, amelyet a Gonosz: Mindörökké (Wicked: For Good) című film bemutatója alkalmából indítottak Ariana Grande közreműködésével...
A Microsoft fejlesztői már hónapok óta összevetik az Anthropic-féle Claude Code, az Anysphere Cursor és a GitHub Copilot előnyeit és hátrányait, keresve a legjobb MI-kódoló eszközt...
Nem mindegy, mennyi ideig húzza egy akkumulátorról a kültéri, vezeték nélküli biztonsági kamerád – főleg, ha a cél az, hogy szinte teljesen megfeledkezhess arról, mikor kell majd töltened...
👍 A Pixel 10a első pillantásra egyetlen izgalmat sem tartogat: a dizájn szinte ugyanaz, a hardver szintén, a fejlesztések inkább kozmetikaiak, mint forradalmiak...
💸 Hirtelen bizonytalanság: a szuperciklus lekerült a napirendről Changpeng Zhao, vagyis CZ, a Binance korábbi vezetője még hetekkel ezelőtt is arról beszélt, hogy soha nem látott kripto-szuperciklus jöhet a tömeges intézményi befektetések és a kriptóbarát szabályozás miatt...
🐻 A mormota (Marmota monax) régóta a legnépszerűbb időjárás-jósló állat Észak-Amerikában, de a valóságban megbízhatatlan, ha előrejelzésekről van szó...
🔑 Kevesen gondolnak rá, mégis a vállalati MI-rendszerekben már nem az okos válasz, hanem a mögöttes visszakeresési mechanizmus lett a legérzékenyebb pont...
🕵 A közkedvelt Notepad++ szövegszerkesztő frissítési rendszerét 2025-ben állami támogatású hackerek támadták meg: hónapokon át képesek voltak rosszindulatú szoftvert kínálni a felhasználóknak, miután sikeresen kompromittálták a Notepad++ hivatalos szerverét...
Tipikus eset, amikor a technológia fejlődése oda vezet, hogy már az állásinterjúkon is deepfake csalók próbálnak meg átverni valódi cégeket – akár olyanokat is, amelyek maguk is MI-biztonsággal foglalkoznak...