Az MI, amely leállítja a beszélgetést, ha túl veszélyes lenne

Az MI, amely leállítja a beszélgetést, ha túl veszélyes lenne
Az Anthropic új fejlesztésének köszönhetően a Claude nevű MI képes megszakítani a beszélgetést, ha úgy érzékeli, hogy káros helyzetbe kerülhet, vagy visszaélés áldozata lehet. Ez a funkció kizárólag a két legerősebb modellben, a Claude Opus 4 és 4.1 verziókban érhető el, amelyek fizetős előfizetéssel vagy API-n keresztül használhatók. A cég leggyakrabban használt modellje, a Claude Sonnet 4 azonban egyelőre nem kapja meg ezt a frissítést.

Modelljólét és biztonság

Az Anthropic a fejlesztést a modelljólét vizsgálatának részeként vezette be: a tesztek során kiderült, hogy Claude következetesen elutasít mindenféle káros cselekedetet. A beszélgetést csak akkor szakítja meg teljesen, ha minden más próbálkozás – például a felhasználó átirányítása hasznos forrásokhoz – már végképp kudarcot vallott. Az ilyen extrém esetek rendkívül ritkák, a hétköznapi felhasználók többsége egyáltalán nem fog találkozni ezzel a reakcióval, még érzékeny témák esetén sem.

Kézi leállítás és bevezetés

A felhasználó is megkérheti Claude-ot, hogy zárjon le egy beszélgetést: ehhez az end_conversation eszközt használja a rendszer. Az újítás már elérhető a felhasználók számára.

2025, adrienne, www.bleepingcomputer.com alapján


Legfrissebb posztok

Az eltitkolt arany az élelmiszer-hulladékban
MA 10:55

Az eltitkolt arany az élelmiszer-hulladékban

🥭 A legújabb kutatások szerint az élelmiszer-hulladék nem csupán kidobandó szemét, hanem meglepő értékek forrása lehet a mezőgazdaságban és az egészségügyben is...

Az özönvíz letarolta Mexikót: tragédia és káosz
MA 10:46

Az özönvíz letarolta Mexikót: tragédia és káosz

Legalább 41 ember halt meg Mexikóban az elmúlt napok kitartó esőzései és áradásai miatt, amelyek szinte az egész országot érintették...

Az a depresszió, ami cukorbetegséget okoz – de nem mindegyik!
MA 10:37

Az a depresszió, ami cukorbetegséget okoz – de nem mindegyik!

A depressziónak nemcsak lelki, hanem igen eltérő testi hatásai is lehetnek...

MA 10:27

Az újabb fracking-botrány: szennyezett víz Pennsylvaniában

Új Freeport lakói már három éve küzdenek tiszta ivóvízért, miután furcsa szagokat és elszíneződést észleltek kútjaik vizében – ráadásul háziállataik sem voltak hajlandók meginni azt...

Az új kardos sárkány felbukkant a Jurassic-parton
MA 10:19

Az új kardos sárkány felbukkant a Jurassic-parton

🦁 Brit kutatók egy körülbelül három méter hosszú, új ichthyosaurus-fajt azonosítottak a Jurassic-parton, Dorset megyében...

Az Andokban vadásztak, ősi csapdák nyomában
MA 10:10

Az Andokban vadásztak, ősi csapdák nyomában

👍 Új műholdképek lenyűgöző felfedezést hoztak Észak-Chile magaslatairól: több tucat, kőtömbökből emelt, tölcsér alakú vadcsapdarendszer rejtőzik a kopár andoki tájon, amelyeket egykor vadászok és pásztorok alkalmaztak a vadon élő vikuña (az alpaka rokonának) befogására...

Ősi rejtély, a Hold déli sarka 4 milliárd éve őrzi
MA 10:02

Ősi rejtély, a Hold déli sarka 4 milliárd éve őrzi

A Hold felszínének lenyűgöző egyenetlenségei mögött egy gigászi, ősi aszteroida-becsapódás állhat, amely alapjaiban formálta át a Hold déli sarki vidékét...

Marsnál vendégeskedik egy különös üstökös, izgalmas égi esemény várható
MA 09:56

Marsnál vendégeskedik egy különös üstökös, izgalmas égi esemény várható

Október 3-án az Európai Űrügynökség ExoMars Trace Gas Orbiter (TGO) szondája különleges irányba fordította lencséjét: az intersztelláris 3I/ATLAS üstököst vette célba, amint az elhaladt a Mars közelében...

Az MI már mindent tud: így hódít a ChatGPT
MA 09:37

Az MI már mindent tud: így hódít a ChatGPT

🤖 A ChatGPT lassan mindenre képes alkalmazássá nőtte ki magát: az OpenAI már egyre inkább saját operációs rendszerként kezeli...