Hogyan leplezd le: Így árulja el a chatbot a szövegben saját magát
Egyre növekszik a szakadék azok között, akik generatív MI chatbotokat használnak szövegek észrevétlen előállítására, és azok között, akik megpróbálják leleplezni őket. Sokan úgy vélik, ismerik az árulkodó jeleket, de egyre nehezebb eldönteni, mit írt ember és mit írt a MI.
Négy amerikai egyetem kutatói azonban előrelépést értek el olyan nyelvi ujjlenyomatok azonosításában, amelyek kiderítik, melyik nagy nyelvi modell (LLM) állított elő egy adott szöveget.
“Minden nap újabb chatbotok jelennek meg, és mi interakcióba lépünk velük, de valójában nem értjük a köztük lévő különbségeket,” mondja Mingjie Sun, a Carnegie Mellon Egyetem kutatója és a tanulmány vezető szerzője. “Azzal, hogy betanítunk egy gépi tanulási osztályozót erre a feladatra, és megvizsgáljuk ennek az osztályozónak a teljesítményét, felmérhetjük a különböző LLM-ek közötti eltéréseket.”
Árulkodó nyelvi jelek
Sun és kollégái egy olyan gépi tanulási modellt fejlesztettek ki, amely öt népszerű LLM kimenetét elemezte, és 97,1%-os pontossággal tudta megkülönböztetni őket egymástól. A gépi tanulási modelljük minden egyes LLM-re jellemző egyedi nyelvi furcsaságokat tárt fel.
A ChatGPT modellje például hajlamosabb a “hasznosít” szó használatára, mint más modellek. A Google modellje előszeretettel mondja azt, hogy “bizonyosan”. A Google modellje gyakran vezeti be következtetéseit az “alapvetően” szóval, míg az Anthropic modellje túlzottan használja az olyan kifejezéseket, mint a “… szerint” és “a szöveg szerint”, amikor forrásaira hivatkozik.
Egyedi stílusjegyek
Az xAI modellje kitűnik azzal, hogy diskurzívabb és didaktikusabb, gyakran emlékezteti a felhasználókat, hogy “emlékezzenek” a kulcspontokra, miközben végigvezeti őket az érveken olyan kifejezésekkel, mint “nemcsak” és “hanem … is”.
“Az írás, a szóválasztás, a formázás mind különböző,” mondja Yida Yin, a Kaliforniai Egyetem (Berkeley) kutatója és a tanulmány társszerzője. “Nem csak azt lehet megállapítani nagy biztonsággal, hogy MI-írta-e a szöveget, de azt is, hogy melyik MI.”
🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...
A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...
🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...
🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...
Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...
Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...
Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...
A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...
Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...
A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...
Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...
🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...
🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...
Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...
Egy kínai magánvállalat által fejlesztett Zhuque-2E rakéta felső fokozata a fellövés után néhány órával széthullott, mindössze néhány száz kilométerre a Föld felszínétől, ahol a Nemzetközi Űrállomás, valamint számos Starlink-műhold kering...
🛠 Felmerül a kérdés, hogy egy texasi porfészekből hogyan válik országos viták színterévé, amikor a mesterségesintelligencia-infrastruktúra-építési láz eléri a vidéki közösségeket...