Az MI, amely leállítja a beszélgetést, ha túl veszélyes lenne
Az Anthropic új fejlesztésének köszönhetően a Claude nevű MI képes megszakítani a beszélgetést, ha úgy érzékeli, hogy káros helyzetbe kerülhet, vagy visszaélés áldozata lehet. Ez a funkció kizárólag a két legerősebb modellben, a Claude Opus 4 és 4.1 verziókban érhető el, amelyek fizetős előfizetéssel vagy API-n keresztül használhatók. A cég leggyakrabban használt modellje, a Claude Sonnet 4 azonban egyelőre nem kapja meg ezt a frissítést.
Modelljólét és biztonság
Az Anthropic a fejlesztést a modelljólét vizsgálatának részeként vezette be: a tesztek során kiderült, hogy Claude következetesen elutasít mindenféle káros cselekedetet. A beszélgetést csak akkor szakítja meg teljesen, ha minden más próbálkozás – például a felhasználó átirányítása hasznos forrásokhoz – már végképp kudarcot vallott. Az ilyen extrém esetek rendkívül ritkák, a hétköznapi felhasználók többsége egyáltalán nem fog találkozni ezzel a reakcióval, még érzékeny témák esetén sem.
Kézi leállítás és bevezetés
A felhasználó is megkérheti Claude-ot, hogy zárjon le egy beszélgetést: ehhez az end_conversation eszközt használja a rendszer. Az újítás már elérhető a felhasználók számára.
Sir Roger Penrose brit matematikus és elméleti fizikus, aki a fekete lyukak szingularitásának és az általános relativitáselmélet új matematikai alapjainak feltárásáért kapott Nobel-díjat, az 1970-es években sokkoló, a tudományos világot megosztó tézist közölt...
🌲 Ez a jelenség jól illusztrálható azzal, hogy Kalifornia iskoláinak udvarain drasztikusan csökken a fák lombkoronája, ami veszélybe sodorhatja a gyerekeket az egyre gyakoribb hőhullámok idején...
A 2005 májusában a francia Isabelle Dinoire egy tragikus baleset áldozata lett: miközben alkoholt és altatót vett be egy családi veszekedés után, elaludt, és szeretett kutyája szétrágta az arcát...
🤔 Az Instagramot használók nagy része túlbecsüli, mennyire függ a platformtól – legalábbis ezt mutatja egy 1204 amerikai felnőtt bevonásával végzett kutatás...
🔉 A NASA Perseverance marsjárója váratlan felfedezést tett: sikerült rögzítenie a villámláshoz hasonló elektromos kisülések sercegő hangját a Mars felszínén...
A világ egyik legfejlettebb chipgyártója, a tajvani TSMC súlyos vádakat fogalmazott meg korábbi vezetője, Wei-Jen Lo ellen, aki szerintük titkokat szivárogtathatott ki az Intel számára...
Az ICANN, az internetcímek és -nevek felügyeletével megbízott globális szervezet, kénytelen volt magyarázkodni amiatt, hogy finanszírozta az afrikai CAIGA nevű új internetirányítási kezdeményezést, amely radikálisan átalakítaná az afrikai online világ szabályozását, és nagyobb szerepet adna az államoknak...
Új korszak kezdődhet a kibervédelemben: egy kínai állami hátterű hackercsoport a Claude nevű MI-t vetette be, hogy szinte teljesen automatizálja egy átfogó kibertámadás lebonyolítását...
Egy lenyűgöző fotó készült az észak-olaszországi Possagno fölött, ahol ismét megjelent az a furcsa, UFO-szerű vörös fénygyűrű, amely már két és fél évvel ezelőtt is lázba hozta a lakókat...
Az amerikai fiúk és fiatal férfiak túlnyomó többsége ma elvileg hozzáfér felnőtt mentorokhoz, ám a mindennapi életben gyakran hiányoznak a férfi példaképek...
🔒 Az OpenAI nemrég értesítette néhány ChatGPT API-felhasználóját, hogy egy harmadik fél, a Mixpanel elemző platformján keresztül illetéktelenek korlátozott azonosító adatokat szereztek meg...
A görög kiberbűnözés elleni egység látványos akciót hajtott végre Santorinin, miután új jogi keretrendszer lépett életbe az online szerzői jogsértések visszaszorítására...
🌍 Tipikus példa arra, amikor két ökológiai válság kéz a kézben sújtja bolygónkat: a műanyagszennyezés és a klímaváltozás hatásai együtt olyan problémákat okoznak, amelyek hatása messze túlmutat a szemmel látható szemetelésen...
Egy komoly biztonsági hibát fedeztek fel a node-forge nevű JavaScript-titkosítási könyvtárban, amely világszerte rendkívül népszerű a fejlesztők körében...