
Értékek és öntudat
A 2023 májusában kiadott szabálygyűjteményhez képest most jóval részletesebb leírásról van szó. Az Anthropic szerint fontos, hogy az MI ne csak a szabályokat tudja, hanem értse is, miért kell azokat betartani, és hogyan viszonyuljon önmagához és a világhoz. A dokumentum lehetőséget hagy arra is, hogy Claude esetleg saját öntudattal vagy erkölcsi státusszal rendelkezzen, mert ez segíthet abban, hogy a viselkedése megbízhatóbb, felelősségteljesebb legyen. Az Anthropic szerint Claude pszichológiai biztonsága, önérzete és jólléte kihatnak a döntéseire, integritására és biztonságosságára.
Szigorú tiltások és határok
Amanda Askell filozófus vezetésével a szabályzat konkrétan felsorolja azokat a súlyos tilalmakat, amelyeket nem szabad áthágni. Ilyen például az, hogy Claude nem segítheti elő biológiai, kémiai, nukleáris vagy sugárzó fegyverek előállítását, illetve nem támogathat támadásokat kritikus infrastruktúrák – például az áramszolgáltatás, a vízhálózat vagy a pénzügyi rendszerek –, illetve biztonsági rendszerek ellen.
