
Modelljólét és biztonság
Az Anthropic a fejlesztést a modelljólét vizsgálatának részeként vezette be: a tesztek során kiderült, hogy Claude következetesen elutasít mindenféle káros cselekedetet. A beszélgetést csak akkor szakítja meg teljesen, ha minden más próbálkozás – például a felhasználó átirányítása hasznos forrásokhoz – már végképp kudarcot vallott. Az ilyen extrém esetek rendkívül ritkák, a hétköznapi felhasználók többsége egyáltalán nem fog találkozni ezzel a reakcióval, még érzékeny témák esetén sem.
Kézi leállítás és bevezetés
A felhasználó is megkérheti Claude-ot, hogy zárjon le egy beszélgetést: ehhez az end_conversation eszközt használja a rendszer. Az újítás már elérhető a felhasználók számára.