2025. 03. 04., 10:29

Hogyan leplezd le: Így árulja el a chatbot a szövegben saját magát

Hogyan leplezd le: Így árulja el a chatbot a szövegben saját magát
Egyre növekszik a szakadék azok között, akik generatív MI chatbotokat használnak szövegek észrevétlen előállítására, és azok között, akik megpróbálják leleplezni őket. Sokan úgy vélik, ismerik az árulkodó jeleket, de egyre nehezebb eldönteni, mit írt ember és mit írt a MI. Négy amerikai egyetem kutatói azonban előrelépést értek el olyan nyelvi ujjlenyomatok azonosításában, amelyek kiderítik, melyik nagy nyelvi modell (LLM) állított elő egy adott szöveget. “Minden nap újabb chatbotok jelennek meg, és mi interakcióba lépünk velük, de valójában nem értjük a köztük lévő különbségeket,” mondja Mingjie Sun, a Carnegie Mellon Egyetem kutatója és a tanulmány vezető szerzője. “Azzal, hogy betanítunk egy gépi tanulási osztályozót erre a feladatra, és megvizsgáljuk ennek az osztályozónak a teljesítményét, felmérhetjük a különböző LLM-ek közötti eltéréseket.”

Árulkodó nyelvi jelek

Sun és kollégái egy olyan gépi tanulási modellt fejlesztettek ki, amely öt népszerű LLM kimenetét elemezte, és 97,1%-os pontossággal tudta megkülönböztetni őket egymástól. A gépi tanulási modelljük minden egyes LLM-re jellemző egyedi nyelvi furcsaságokat tárt fel.

A ChatGPT modellje például hajlamosabb a “hasznosít” szó használatára, mint más modellek. A Google modellje előszeretettel mondja azt, hogy “bizonyosan”. A Google modellje gyakran vezeti be következtetéseit az “alapvetően” szóval, míg az Anthropic modellje túlzottan használja az olyan kifejezéseket, mint a “… szerint” és “a szöveg szerint”, amikor forrásaira hivatkozik.

Egyedi stílusjegyek

Az xAI modellje kitűnik azzal, hogy diskurzívabb és didaktikusabb, gyakran emlékezteti a felhasználókat, hogy “emlékezzenek” a kulcspontokra, miközben végigvezeti őket az érveken olyan kifejezésekkel, mint “nemcsak” és “hanem … is”.

“Az írás, a szóválasztás, a formázás mind különböző,” mondja Yida Yin, a Kaliforniai Egyetem (Berkeley) kutatója és a tanulmány társszerzője. “Nem csak azt lehet megállapítani nagy biztonsággal, hogy MI-írta-e a szöveget, de azt is, hogy melyik MI.”

Legfrissebb posztok

MA 12:55

Az OpenAI mostantól megtippeli, hány éves vagy

🕵 Az OpenAI új korfelismerő modellt vezet be a ChatGPT-be, amely képes megtippelni, hány éves a felhasználója, és szükség esetén biztonsági korlátozásokat alkalmazhat, hogy megakadályozza a tinédzserek általi visszaéléseket...

MA 12:37

Az új csodabeton a levegőből szívja ki a szén-dioxidot

🌧 Az építőipar forradalmát hozhatja el a Worcester Polytechnic Institute fejlesztése: az új anyag, az Enzimatikus Szerkezeti Anyag, röviden ESM (Enzymatic Structural Material), erősebb, tartósabb és tisztább, mint a hagyományos beton – miközben nem szennyezi a levegőt, hanem épp ellenkezőleg: kivonja belőle a szén-dioxidot...

MA 12:19

A ChatGPT bekeményít: szigorú szűrés a kiskorúak védelmében

A ChatGPT új védelmi rendszert vezet be világszerte, amelynek célja, hogy a 18 év alatti felhasználók minél kevesebb káros vagy érzékeny tartalomhoz férjenek hozzá...

MA 12:01

Az internet új réme: veszélyben a telnet-hitelesítés

💻 Óvatlan telnet-beállítás – mindenki támadhatóvá vált Meglepő, de még ma is vannak rendszerek, amelyek hálózatról elérhető telnetszolgáltatást futtatnak – jóllehet ezt a korszerű rendszergazdák már évtizedekkel ezelőtt leállították...

MA 11:56

A fogyó népesség Kína gazdasági felemelkedésének vethet véget

Kína gazdasága 2025-ben elérte a kormányzat által kitűzött növekedési célt, de a felszín alatt komoly gondok kezdenek kibontakozni...

MA 11:36

A Föld vízválságban: idáig juttatta az emberiség

Az ENSZ jelentése szerint az emberiség olyan mértékben használja a vízkészleteket, hogy a Föld már nem képes lépést tartani az igényekkel...

MA 11:20

Az új napkitörések titka: elszabadult mágneses lavina

Érdemes megvizsgálni, hogyan zajlik le egy napkitörés, mert ezek az események nemcsak látványosak, hanem a Földön is súlyos következményekkel járhatnak...

MA 11:01

Az utolsó pillanatban mentették meg a Stadia Bluetooth-kontrollert

A héten a Google végleg leállította a Stadia hivatalos Bluetooth-átalakító eszközét, amellyel a korábbi Stadia kontrollereket lehetett kompatibilissé tenni más platformokkal, például a Steammel...

MA 10:57

Az FTC nem enged: folytatja a harcot a Meta ellen

Az Amerikai Szövetségi Kereskedelmi Bizottság (FTC) hiába vesztette el korábban a Meta elleni versenyjogi pert, újabb fellebbezéssel próbálja meg felborítani Mark Zuckerberg birodalmát...

MA 10:50

A húsevő parazita legyek lerohanják Mexikót

🐞 A rettegett húsevő légy, az úgynevezett újvilági csavarlegy újra felbukkant Mexikóban, és egyre több állat esik áldozatául, ráadásul már az USA határához közelít...

MA 10:42

Az árnyalat ára: késhet a hólyagrák felismerése

🧪 A színtévesztés észrevétlenül befolyásolhatja a hólyagrák túlélési esélyeit – erre a következtetésre jutott egy friss, még előzetes vizsgálat...

MA 10:34

Az apró implantátum, amely véget vet a legsúlyosabb depressziónak

💡 Manapság rengetegen küzdenek depresszióval, de a legsúlyosabb esetekben a hagyományos kezelések gyakran csődöt mondanak...

MA 10:25

Az ultramobil szenzáció: 300 mm-es teleobjektívet kap az Oppo

Az Oppo várhatóan márciusban mutatja be legújabb csúcsmobilját, a Find X9 Ultra-t, amelyet, a kiszivárgott prototípus alapján, egészen elképesztő kameratechnológia jellemez...

MA 10:17

Az új Google Gemini-trükk miatt borulhat a naptárad, szivároghatnak az adataid

A Gemini MI legutóbbi frissítésével a Google Naptár (Google Calendar) okosabb lett: már nemcsak az elsődlegest, hanem az összes naptárat is képes kezelni, sőt, természetes nyelven lehet tőle eseményekről kérdezni vagy azokat létrehozni...

MA 10:03

Az artritisz végóráit jelentheti az új porcregeneráló eljárás

💉 Az időskori porckopás és ízületi gyulladás sokak életét keseríti meg, a térd- és csípőprotézisek pedig millióknak jelentenek végső megoldást...

MA 09:58

Az Egyesült Államokban ismét kitörhet a kanyarójárvány

😷 Egy éve tart az Egyesült Államok történetének egyik legsúlyosabb kanyarójárványa, amely elsősorban Nyugat-Texasban kezdődött, de mára az egész országot, valamint Mexikót és Kanadát is érinti...

MA 09:50

A század leglátványosabb sarki fénye: napvihar rázta meg a Földet

🌈 Az elmúlt éjszaka a Föld mágneses mezejét az elmúlt 23 év egyik legerősebb napvihara érte el, amely élénk sarki fényeket váltott ki az Egyesült Államokban, sőt egészen Dél-Kaliforniáig is eljutott az égi látványosság...

MA 09:41

Megérkezett a VoidLink: a mesterséges intelligencia már kártevőt is ír

A VoidLink nevű, frissen felfedezett felhőalapú kártevő-keretrendszer fejlesztése mögött egyetlen embert sejtenek, aki MI-modellel gyorsította fel a munkát...

MA 09:33

A védvonalon rés tátong: kritikus hiba a Cloudflare WAF-ban

⚠ A Cloudflare szakemberei egy komoly biztonsági hibát javítottak ki a cég webalkalmazás-tűzfalában (WAF), amely lehetőséget adott támadóknak arra, hogy megkerüljék a tűzfalat, és közvetlenül elérjék az eredeti szervereket...