Hogyan leplezd le: Így árulja el a chatbot a szövegben saját magát

Hogyan leplezd le: Így árulja el a chatbot a szövegben saját magát
Egyre növekszik a szakadék azok között, akik generatív MI chatbotokat használnak szövegek észrevétlen előállítására, és azok között, akik megpróbálják leleplezni őket. Sokan úgy vélik, ismerik az árulkodó jeleket, de egyre nehezebb eldönteni, mit írt ember és mit írt a MI. Négy amerikai egyetem kutatói azonban előrelépést értek el olyan nyelvi ujjlenyomatok azonosításában, amelyek kiderítik, melyik nagy nyelvi modell (LLM) állított elő egy adott szöveget. “Minden nap újabb chatbotok jelennek meg, és mi interakcióba lépünk velük, de valójában nem értjük a köztük lévő különbségeket,” mondja Mingjie Sun, a Carnegie Mellon Egyetem kutatója és a tanulmány vezető szerzője. “Azzal, hogy betanítunk egy gépi tanulási osztályozót erre a feladatra, és megvizsgáljuk ennek az osztályozónak a teljesítményét, felmérhetjük a különböző LLM-ek közötti eltéréseket.”

Árulkodó nyelvi jelek

Sun és kollégái egy olyan gépi tanulási modellt fejlesztettek ki, amely öt népszerű LLM kimenetét elemezte, és 97,1%-os pontossággal tudta megkülönböztetni őket egymástól. A gépi tanulási modelljük minden egyes LLM-re jellemző egyedi nyelvi furcsaságokat tárt fel.

A ChatGPT modellje például hajlamosabb a “hasznosít” szó használatára, mint más modellek. A Google modellje előszeretettel mondja azt, hogy “bizonyosan”. A Google modellje gyakran vezeti be következtetéseit az “alapvetően” szóval, míg az Anthropic modellje túlzottan használja az olyan kifejezéseket, mint a “… szerint” és “a szöveg szerint”, amikor forrásaira hivatkozik.

Egyedi stílusjegyek

Az xAI modellje kitűnik azzal, hogy diskurzívabb és didaktikusabb, gyakran emlékezteti a felhasználókat, hogy “emlékezzenek” a kulcspontokra, miközben végigvezeti őket az érveken olyan kifejezésekkel, mint “nemcsak” és “hanem … is”.

“Az írás, a szóválasztás, a formázás mind különböző,” mondja Yida Yin, a Kaliforniai Egyetem (Berkeley) kutatója és a tanulmány társszerzője. “Nem csak azt lehet megállapítani nagy biztonsággal, hogy MI-írta-e a szöveget, de azt is, hogy melyik MI.”

Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 11:49

Az MI-gigászok csatája: Google kontra OpenAI

🥨 A Google bemutatta eddigi legfejlettebb mesterségesintelligencia-kutató ügynökét, a Gemini Deep Research újragondolt változatát, amely immár a Gemini 3 Pro modellre épül...

MA 11:33

Az olcsó VMware-csomagnak több országban nyoma vész

A Broadcom néhány EMEA (Európa, Közel-Kelet, Afrika) országban megszüntette a VMware vSphere Foundation csomag értékesítését...

MA 11:17

A stresszes patkányok gyorsabban válnak függővé a kannabisztól

🐼 A stresszes patkányok sokkal hajlamosabbak újra és újra kannabiszt fogyasztani, mint kevésbé ideges társaik...

MA 11:02

A Control folytatása sarkaiból fordítja ki Manhattant

🧙 A Remedy Entertainment végre leleplezte a régóta várt Control: Resonánst (Control: Resonant), amely a 2019-ben megjelent, nagy sikert aratott paranormális akciójáték folytatása lesz...

MA 10:57

A Marson gyorsabban jár az idő – új űrkutatási kihívások

Mára egyértelművé vált, hogy Einstein mégiscsak jól gondolta: az idő tényleg nem egyforma mindenhol az univerzumban...

MA 10:52

A React2Shell réme: egy kattintás, óriási kár

⚠ 2025. december 3-án minden megváltozott a React Server Components (RSC) világában: kiderült, hogy a React2Shell (CVE-2025-55182) nevű súlyos sebezhetőség teljesen kiszolgáltatta a szervereket a távoli kódvégrehajtási támadásoknak...

MA 10:43

Az évtizedek óta várt új Mega Man végre megérkezett

🎮 A Capcom 2027-ben visszahozza Mega Mant, méghozzá a sorozat 40. évfordulójára készülő vadonatúj játékkal, a Mega Man: Kettős felülvezérlés (Dual Override) címmel...

MA 10:39

Az LG StanByMe 2: a hordozható tévé, ami rabul ejt

Egy lényeges szempont, hogy nem minden technológiai újítás talál célba elsőre...

MA 10:29

Jön az új gigász: 70 TB-os HDD a láthatáron

A Seagate bejelentette, hogy hamarosan forgalomba hozza az első, 70 TB kapacitású, 3,5 colos HDD-t, elsőként a világon...

MA 10:23

A James Webb végre leleplezte az univerzum óriáscsillagait

💫 A James Webb űrteleszkóp lenyűgöző felfedezéssel szolgál: eddig ismeretlen, óriási tömegű csillagokat talált a GS 3073 nevű, ősi galaxisban, amely mintegy egymilliárd évvel az ősrobbanás után alakult ki...

MA 10:15

Az orkák új szövetségesekkel vadásznak lazacra?

Az elmúlt időszakban több érdekes megfigyelés is arra utal, hogy a kardszárnyú delfinek (orkák) és a fehéroldalú delfinek szokatlan szövetséget alkothatnak a lazacvadászatban Brit Columbia partjainál...

MA 09:51

A hővel csábító növények titkai: élet a virágzás előtt

Általában elválaszthatatlan fogalmaknak tűnnek a virág és a beporzás, pedig évmilliókkal a virágok megjelenése előtt a növények már sikeresen vonzották az állatokat – csak nem színes szirmokkal, hanem forrósággal...

MA 09:43

Megérkezett az első otthoni depressziókezelő készülék

💡 Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az első olyan eszközt, amely otthon is használható depresszió kezelésére...

MA 09:30

A római sírok új rejtélye: ujjlenyomatok az idő mélyéről

🗿 Közel 1800 évvel ezelőtt a mai Britannia területén élő rómaiak különös temetkezési szertartást alkalmaztak: folyékony gipszpasztát kentek az elhunyt testére, még mielőtt eltemették volna...

MA 09:23

Az OpenAI szabad kezet kapott a Disney-hősökkel

👑 A Disney három évre exkluzív licencet adott több mint 200 karakterére az OpenAI-nak, így mostantól a Sora videós MI és a ChatGPT Images hivatalosan is rajzolt és animált formában generálhat Disney-, Pixar-, Marvel- és Star Wars-karaktereket...

MA 09:16

Az új ChatGPT 5.2: végre itt az okosabb MI

Sokan már napi szinten használják a ChatGPT-t tanulásra és munkára, így fontos kérdés, hogy egy új verzió mennyit javít a megbízhatóságon és a mindennapi hasznosságon...

MA 09:08

A CentreStack súlyos kriptográfiai hibája nyit kaput az adatlopásnak

A hackerek új, eddig dokumentálatlan sérülékenységet használnak ki a Gladinet CentreStack és Triofox fájlmegosztó rendszereiben, amellyel távoli kódfuttatást érhetnek el...

MA 09:02

A 3D-s huzalozás küszöbén a 10 000 qubites MI-chipek

Fontos kérdés, hogyan lehet a kvantumszámítógépek számítási teljesítményét jelentősen növelni, miközben a fizikai méretük nem nő arányosan...