Hogyan leplezd le: Így árulja el a chatbot a szövegben saját magát
Egyre növekszik a szakadék azok között, akik generatív MI chatbotokat használnak szövegek észrevétlen előállítására, és azok között, akik megpróbálják leleplezni őket. Sokan úgy vélik, ismerik az árulkodó jeleket, de egyre nehezebb eldönteni, mit írt ember és mit írt a MI.
Négy amerikai egyetem kutatói azonban előrelépést értek el olyan nyelvi ujjlenyomatok azonosításában, amelyek kiderítik, melyik nagy nyelvi modell (LLM) állított elő egy adott szöveget.
“Minden nap újabb chatbotok jelennek meg, és mi interakcióba lépünk velük, de valójában nem értjük a köztük lévő különbségeket,” mondja Mingjie Sun, a Carnegie Mellon Egyetem kutatója és a tanulmány vezető szerzője. “Azzal, hogy betanítunk egy gépi tanulási osztályozót erre a feladatra, és megvizsgáljuk ennek az osztályozónak a teljesítményét, felmérhetjük a különböző LLM-ek közötti eltéréseket.”
Árulkodó nyelvi jelek
Sun és kollégái egy olyan gépi tanulási modellt fejlesztettek ki, amely öt népszerű LLM kimenetét elemezte, és 97,1%-os pontossággal tudta megkülönböztetni őket egymástól. A gépi tanulási modelljük minden egyes LLM-re jellemző egyedi nyelvi furcsaságokat tárt fel.
A ChatGPT modellje például hajlamosabb a “hasznosít” szó használatára, mint más modellek. A Google modellje előszeretettel mondja azt, hogy “bizonyosan”. A Google modellje gyakran vezeti be következtetéseit az “alapvetően” szóval, míg az Anthropic modellje túlzottan használja az olyan kifejezéseket, mint a “… szerint” és “a szöveg szerint”, amikor forrásaira hivatkozik.
Egyedi stílusjegyek
Az xAI modellje kitűnik azzal, hogy diskurzívabb és didaktikusabb, gyakran emlékezteti a felhasználókat, hogy “emlékezzenek” a kulcspontokra, miközben végigvezeti őket az érveken olyan kifejezésekkel, mint “nemcsak” és “hanem … is”.
“Az írás, a szóválasztás, a formázás mind különböző,” mondja Yida Yin, a Kaliforniai Egyetem (Berkeley) kutatója és a tanulmány társszerzője. “Nem csak azt lehet megállapítani nagy biztonsággal, hogy MI-írta-e a szöveget, de azt is, hogy melyik MI.”
A Hubble űrtávcső idén már 36 éves, és most egy igazán friss, lélegzetelállító képpel ünnepli ezt: a Nyilas (Sagittarius) csillagképben található Trifid-köd legkülönlegesebb alakzata, az űrbéli citromcsiga (Cosmic Sea Lemon) újra lencsevégre került...
A YouTube mobilon mostantól automatikusan némítja azoknak a csatornáknak a push-értesítéseit, amelyeket több mint egy hónapja nem követsz figyelemmel...
🔥 Lényeges szempont, hogy a bitcoin hónapok óta nem látott tempóban erősödik: 14 egymást követő napon át pozitív a Coinbase-prémium, ami legutóbb tavaly októberben történt, amikor a kriptopénz történelmi csúcson, 126 000 dolláron (kb...
A Mozilla legfrissebb tesztjei során meglepő eredmények születtek: az Anthropic fejlesztette Mythos Preview MI-modellje 271 biztonsági sérülékenységet azonosított a hamarosan megjelenő Firefox 150 forráskódjában...
Felmerül a kérdés, hogy miként fordulhat elő, hogy egyetlen alkalmazotti tevékenység elegendő ahhoz, hogy egy egész vállalati infrastruktúrát feltörjék...
🟢 A Honor legújabb középkategóriás készüléke, a 600 Pro, már első ránézésre is ismerős lehet – a teljes szélességű, vízszintes kamerasziget, a precízen megmunkált unibody kialakítás és a hátlapi lencsék elrendezése határozottan idézi a prémium telefonok világát...
🎉 Hatalmas meglepetést okozott a Microsoft azzal, hogy lejjebb vitte a PC- és Xbox Game Pass havidíjait – ezt Ausztráliában már meg is érezhetik a játékosok...
🚧 Több mint 1300 Microsoft SharePoint-szerver maradt védtelen egy veszélyes biztonsági rés miatt, amelyet eredetileg nulladik napi támadás során használtak ki, és jelenleg is folyamatosan támadnak...
A Mozilla most először vetette be az Anthropic-féle Claude Mythos Preview-t, hogy átfésülje a Firefox forráskódját, és hirtelen 271 hibát sikerült feltárni a 150-es verziójában – eddig elképzelhetetlen tempóban...
🔎 A Google új szintre emelte kutató MI-ügynökeinek képességeit: a Deep Research és a Deep Research Max egyszerre képesek az internetet és a céges adatbázisokat is átfésülni, miközben átlátható, vizuális jelentéseket készítenek...
🔒 Az online vásárlások és digitális szolgáltatások világában a csalás elleni védelem és a felhasználói élmény folyamatosan ütközik: ha túl szigorú a biztonság, a valódi ügyfelek is elpártolnak; viszont ha túl engedékeny, akkor megsokszorozódnak a kártékony visszaélések...
Hárommillió, az OkCupid oldalról begyűjtött profilfotó törlésére kényszerült a Clarifai nevű MI-vállalat, miután az Egyesült Államok Szövetségi Kereskedelmi Bizottságával (FTC) egyezségre jutott egy hosszan húzódó adatvédelmi ügyben...
🕵 Erre utal többek között, hogy a közelgő Motorola Razr 2026 szinte minden műszaki részletét felfedte egy hatalmas szivárgás, jóval a hivatalos bejelentés előtt...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. BoobieTime Breastfeeding Timer (iPhone/iPad)A BoobieTime egy 2017-ben létrehozott digitális alkalmazás, melyet az alapítók első gyermekének születése ihletett...
☀️ Az elmúlt évben a globális energiafogyasztás alakulása drámai változást hozott: az elektromos áram iránti kereslet kétszer gyorsabban nőtt, mint az összes energiafogyasztás...
Az egészségmegőrző okoseszközök egyre népszerűbbek, hiszen ígéretesen segítenek abban, hogy jobban megismerjük testünket és követni tudjuk egészségi állapotunkat...
🔒 Egyre nő a feszültség a Build A Rocket Boy (BARB) stúdiónál, ahol ezúttal nem a játék hibái, hanem a dolgozók jogainak megsértése került terítékre...
Néhány hónap telt csak el az OpenAI korábbi, nagy előrelépést jelentő képgeneráló-frissítése óta, máris itt a következő nagy dobás: a ChatGPT Images 2...
Ez a jelenség jól illusztrálható azzal, hogy amerikai kutatók először figyeltek meg természeti körülmények között gyenge, ibolyaszínben derengő fényjelenséget a fák lombkoronáján vihar idején...
🎮 Tipikus helyzet, amikor egy régi kedvenc konzol játékait szeretnéd újra átélni egy modern hordozható gépen, de a tökéletes élményhez rengeteg apró beállítás és trükk szükséges...
Mozilla fejlesztői elképesztő eredményt értek el az Anthropic Claude Mythos nevű MI-jével: 271 sebezhetőséget fedeztek fel és javítottak a Firefox legújabb verziójában, méghozzá úgy, hogy az MI minden olyan hibát felismer, amelyet egyébként az emberek is megtalálnának – csak sokkal gyorsabban...