Az MI, amely leállítja a beszélgetést, ha túl veszélyes lenne

Az MI, amely leállítja a beszélgetést, ha túl veszélyes lenne
Az Anthropic új fejlesztésének köszönhetően a Claude nevű MI képes megszakítani a beszélgetést, ha úgy érzékeli, hogy káros helyzetbe kerülhet, vagy visszaélés áldozata lehet. Ez a funkció kizárólag a két legerősebb modellben, a Claude Opus 4 és 4.1 verziókban érhető el, amelyek fizetős előfizetéssel vagy API-n keresztül használhatók. A cég leggyakrabban használt modellje, a Claude Sonnet 4 azonban egyelőre nem kapja meg ezt a frissítést.

Modelljólét és biztonság

Az Anthropic a fejlesztést a modelljólét vizsgálatának részeként vezette be: a tesztek során kiderült, hogy Claude következetesen elutasít mindenféle káros cselekedetet. A beszélgetést csak akkor szakítja meg teljesen, ha minden más próbálkozás – például a felhasználó átirányítása hasznos forrásokhoz – már végképp kudarcot vallott. Az ilyen extrém esetek rendkívül ritkák, a hétköznapi felhasználók többsége egyáltalán nem fog találkozni ezzel a reakcióval, még érzékeny témák esetén sem.

Kézi leállítás és bevezetés

A felhasználó is megkérheti Claude-ot, hogy zárjon le egy beszélgetést: ehhez az end_conversation eszközt használja a rendszer. Az újítás már elérhető a felhasználók számára.

2025, adrienne, www.bleepingcomputer.com alapján


Legfrissebb posztok

A rettegett MI most már minden egyes Excel-cellában ott leselkedik

MA 18:01

A rettegett MI most már minden egyes Excel-cellában ott leselkedik

👾 A Microsoft új MI-funkciója, a Copilot, közvetlenül az Excel celláiba érkezik, így mostantól elég természetes nyelven kérdezni, a generatív MI pedig pillanatok alatt válaszol. Az új =COPILOT függvény...

Jövőre mindenki okosgyűrűt akar majd, ezek a legmenőbbek

MA 17:28

Jövőre mindenki okosgyűrűt akar majd, ezek a legmenőbbek

Az okosgyűrűk világszerte egyre népszerűbbek, hiszen kényelmesebbek, diszkrétebbek, és gyakran elegánsabbak, mint a csuklón viselhető okosórák. Különösen fontos kiemelni, hogy ezek a kis eszközök nemcsak egész napos viselésre...

Atlanti viharok hullámai, veszélyek a parttól távol

MA 16:27

Atlanti viharok hullámai, veszélyek a parttól távol

Az Egyesült Államok keleti partján, Miami-tól egészen Maine-ig szinte minden tengerparti nyaralónak érdemes extra óvatosnak lennie, még akkor is, ha a hurrikán sok száz kilométerre tombol. Egy hurrikán...

Az óriáshullámok hete: Az Erin hurrikán fenyegeti a keleti partot

MA 16:02

Az óriáshullámok hete: Az Erin hurrikán fenyegeti a keleti partot

Az Egyesült Államok keleti partvidékét a héten minden eddiginél veszélyesebb helyzet fenyegeti: az Atlanti-óceán első, 2025-ös hurrikánja, az Erin nevű vihar hatalmas, akár 30 méter magas hullámokat és...


MA 15:25

Az MI most már le is léphet a kínos beszélgetésekből

Az Anthropic újítása lehetővé teszi, hogy a Claude Opus 4 és 4.1 MI-modell saját belátása szerint véget vessen egy beszélgetésnek, ha az túlságosan ártalmas vagy bántalmazóvá válik. Erre...

Lélegzetelállítóan pontos rezgések, új korszak jöhet a molekulák felismerésében

MA 15:01

Lélegzetelállítóan pontos rezgések, új korszak jöhet a molekulák felismerésében

🔬 A Rice Egyetem kutatói lenyűgöző áttörést értek el: olyan apró rezgéseket, úgynevezett fononokat alkottak, amelyek eddig példátlan erősséggel képesek egymással interferálni. Egy speciális réteges szerkezet – ezüsttel, grafénnal...


MA 14:25

Az apró Gemma MI-modell meglepően sokat tud

A Google bemutatta legújabb, rendkívül kicsi és könnyű Gemma MI-modelljét, amelyet kifejezetten helyi eszközökön történő futtatásra terveztek. A Gemma 3 270M modell gyorsan finomhangolható, miközben teljesítménye meglepően robusztus...


MA 14:01

Az ingyenes Meshnet távozik a NordVPN-ből

A NordVPN december 1-jén megszünteti a Meshnet nevű ingyenes funkcióját. Ezzel a lehetőséggel egyszerűen összekapcsolhattad saját eszközeidet vagy barátaid gépeit egy biztonságos, közvetlen NordLynx-alagúton keresztül – mindezt harmadik...

Milyen újdonságokkal jön az iPhone 17, mire számíthatunk ősszel

MA 13:54

Milyen újdonságokkal jön az iPhone 17, mire számíthatunk ősszel

📱 Augusztus vége felé közeledve egyre nagyobb figyelem irányul az Apple következő nagy eseményére, amely szokás szerint szeptemberben esedékes. Ekkor mutatkozik be a teljes iPhone 17 széria, amely már...