Az MI, amely leállítja a beszélgetést, ha túl veszélyes lenne

Az MI, amely leállítja a beszélgetést, ha túl veszélyes lenne
Az Anthropic új fejlesztésének köszönhetően a Claude nevű MI képes megszakítani a beszélgetést, ha úgy érzékeli, hogy káros helyzetbe kerülhet, vagy visszaélés áldozata lehet. Ez a funkció kizárólag a két legerősebb modellben, a Claude Opus 4 és 4.1 verziókban érhető el, amelyek fizetős előfizetéssel vagy API-n keresztül használhatók. A cég leggyakrabban használt modellje, a Claude Sonnet 4 azonban egyelőre nem kapja meg ezt a frissítést.

Modelljólét és biztonság

Az Anthropic a fejlesztést a modelljólét vizsgálatának részeként vezette be: a tesztek során kiderült, hogy Claude következetesen elutasít mindenféle káros cselekedetet. A beszélgetést csak akkor szakítja meg teljesen, ha minden más próbálkozás – például a felhasználó átirányítása hasznos forrásokhoz – már végképp kudarcot vallott. Az ilyen extrém esetek rendkívül ritkák, a hétköznapi felhasználók többsége egyáltalán nem fog találkozni ezzel a reakcióval, még érzékeny témák esetén sem.

Kézi leállítás és bevezetés

A felhasználó is megkérheti Claude-ot, hogy zárjon le egy beszélgetést: ehhez az end_conversation eszközt használja a rendszer. Az újítás már elérhető a felhasználók számára.

2025, adrienne, www.bleepingcomputer.com alapján

Legfrissebb posztok

MA 09:50

Az anonimitásnak vége: India bekeményít a kriptováltóknál

🔍 India pénzügyi hírszerzési hatósága új, szigorú intézkedésekkel próbálja visszaszorítani a pénzmosást és a terrorizmus finanszírozását a kriptotőzsdéken...

MA 09:38

Az igazság az otthoni páramentesítőkről: megéri beruházni?

🏠 Egy téglafalakkal díszített, hangulatos pincelakás elsőre csábító lehet, de hamar megjelenhetnek a penészfoltok és a dohos szagok...

MA 09:29

Az új Galaxy S25 meglepő trükkel villant nagyot

🚀 Valami különös, sőt elismerésre méltó dolog történik a Galaxy S25 szériával...

MA 09:22

Az új Supermicro edge szerver: apró méret, brutális teljesítmény

💻 A Supermicro SYS-E403-14B-FRN2T egy kompakt, helytakarékos IoT-szerver, amely bőséges csatlakozási lehetőséggel és GPU-kompatibilitással büszkélkedhet...

MA 09:15

Az Amazon titokban sajátként árulja a kisvállalkozók termékeit?

Az ünnepek alatt kisebb bolttulajdonosok és kézművesek döbbenten vették észre, hogy termékeik feltűntek az Amazon oldalán, anélkül, hogy erről tudtak volna...

MA 09:09

A botrányos MI-ügy: Malajzia és Indonézia betiltja a Grokot

Elon Musk MI-chatbotja, a Grok, már a hétvégén elérhetetlenné vált Malajziában és Indonéziában, miután egyre több aggály merült fel a beleegyezés nélkül készült, szexuális tartalmú képek és deepfake-ek, köztük kiskorúakról készült anyagok előállításával kapcsolatban...

MA 08:37

Az olaj világkapuja felett ismét viharfelhők gyülekeznek

☁ A világ egyik legfontosabb olajszállítási útvonalának számító Hormuzi-szoros ismét a figyelem középpontjába került azután, hogy kiéleződött a feszültség Irán és az Egyesült Államok között...

MA 08:29

Az MI-apokalipszis pánikja többet árt, mint használ

Az Nvidia vezére, Jensen Huang szerint az MI jövőjét övező, végítélettel riogató hangulat több kárt okoz, mint hasznot...

MA 08:22

Az újévben a GameStop üzletei sorra bezárnak Amerikában

🏠 A 2026-os év nem indul jól a GameStop dolgozóinak: több mint 430 üzlet zár be 42 amerikai államban január folyamán...

MA 08:08

A hamis szolgálati kutyák elárasztották a reptereket

Az ünnepi hazautazások alatt egyre több „szolgálati kutyaként” jelölt ebet lehet felfedezni a reptereken és járatokon...

MA 08:03

Az MI-vel szemben csak az eredeti zene győzhet

Ez a jelenség jól illusztrálható azzal, hogy néhány évvel ezelőtt a zenei streaming oldalak forradalmasították a zenehallgatást...

MA 07:50

Az immunsejteket feltüzelő injekció áttörheti a daganat védőpajzsát

💉 A daganatokban található immunsejtek, az úgynevezett makrofágok veleszületett képességgel elpusztítják a rákos sejteket, de a tumorkörnyezet elnyomja őket, így nem tudják ellátni feladatukat...

MA 07:44

Az olasz fizikusok nagy dobása: strapabíró 3D-s szolitonok a laborban

Az olasz Sapienza Egyetem kutatói most először hoztak létre háromdimenziós, különösen ellenálló szolitont: olyan fényhullámcsomagot, amely képes térben mozogni, sőt, más szolitonokkal is ütközhet anélkül, hogy elveszítené formáját...

MA 07:36

A nukleáris startupok forradalmat ígérnek – de kemény menet lesz

⚡ Jó példa erre, hogy a nukleáris ipar történelmi újjászületését éljük: a régi erőműveket felújítják, a befektetők pedig dollármilliárdokkal támogatják az atomenergia-újítókat...

MA 07:29

A medvék arcát is felismeri már az MI

Egy kanadai iskoláscsoportot ért grizzlytámadás után a hatóságok próbálták azonosítani és befogni a támadó állatot...

MA 07:22

Az Instagram-jelszópánik mégiscsak vaklárma volt?

A hétvégén világszerte rengetegen kaptak váratlan jelszó-visszaállító e-mailt az Instagramtól, ami sokakat meglepett és megijesztett...

MA 07:15

Az MI forradalmasítja az online vásárlást: összefog a Walmart és a Google

A Walmart és a Google új közös megoldása forradalmasítja az online vásárlást: a Gemini MI-asszisztensbe integrált, MI-alapú vásárlás hamarosan elindul az Egyesült Államokban...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 1/12

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Warheads (iPhone/iPad)A Warheads egy lendületes, akcióban gazdag arcade játék iPhone-ra és iPod Touch-ra, amely lenyűgöző robbanásokkal és látványos részecskeeffektekkel varázsolja el a játékost...

MA 07:08

Az év meglepetése: ingyenes Stranger Things témák Galaxy-telefonokra

Az A furcsa dolgok (Stranger Things) rajongói most igazán örülhetnek: a Samsung ingyenes A furcsa dolgok (Stranger Things) témákat és háttérképeket tett elérhetővé Galaxy telefonokra...