Az MI, amely leállítja a beszélgetést, ha túl veszélyes lenne
Az Anthropic új fejlesztésének köszönhetően a Claude nevű MI képes megszakítani a beszélgetést, ha úgy érzékeli, hogy káros helyzetbe kerülhet, vagy visszaélés áldozata lehet. Ez a funkció kizárólag a két legerősebb modellben, a Claude Opus 4 és 4.1 verziókban érhető el, amelyek fizetős előfizetéssel vagy API-n keresztül használhatók. A cég leggyakrabban használt modellje, a Claude Sonnet 4 azonban egyelőre nem kapja meg ezt a frissítést.
Modelljólét és biztonság
Az Anthropic a fejlesztést a modelljólét vizsgálatának részeként vezette be: a tesztek során kiderült, hogy Claude következetesen elutasít mindenféle káros cselekedetet. A beszélgetést csak akkor szakítja meg teljesen, ha minden más próbálkozás – például a felhasználó átirányítása hasznos forrásokhoz – már végképp kudarcot vallott. Az ilyen extrém esetek rendkívül ritkák, a hétköznapi felhasználók többsége egyáltalán nem fog találkozni ezzel a reakcióval, még érzékeny témák esetén sem.
Kézi leállítás és bevezetés
A felhasználó is megkérheti Claude-ot, hogy zárjon le egy beszélgetést: ehhez az end_conversation eszközt használja a rendszer. Az újítás már elérhető a felhasználók számára.
Érdemes megvizsgálni, hogy a vállalati informatikai biztonság mennyire fókuszál a szem előtt lévő rendszerekre: szerverekre, hálózatokra, felhasználói fiókokra, VPN-ekre vagy a felhőszolgáltatásokra...
Ja, mert hogy nyilván mindeközben a NASA megint belengette, hogy csak ne ácsingózzunk az új holdraszállásra, ugyanis az egész Artemis-program időrendje szétesett...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Castle Zombiestein – 3D FPS (iPhone/iPad)A Zombiestein egy pörgős akciójáték, amelyben a játékos Yuri Agron, azaz “Tarzan” bőrébe bújik, aki egy elit orosz Spetsnaz kommandós...
Jellemző példa erre, hogy több száz Google- és OpenAI-dolgozó aláírta azt a nyílt levelet, amelyben arra kérik cégeiket, hogy vállaljanak közös állásfoglalást az Anthropic mellett...
A Memphis Állatkert bonobókiállítását határozatlan időre bezárták, miután az egyik majom nekirontott a védőüvegnek, és megrepesztette a biztonsági üveget...
💊 Érdemes megvizsgálni, hogy a spanyolországi CiQUS kutatói lenyűgöző áttörést értek el: sikerült a rendszerint elégetett, olcsó és bőséges metánt összetett gyógyszerekké és más, keresett vegyületekké alakítaniuk...
Például egy amerikai nő, Lydia Fairchild teljesen hétköznapi életet élt, két gyermeke volt, a harmadikat várta, egyedülálló anyaként pedig anyagi támogatásra jelentkezett...
A Burger King most mesterséges intelligenciával működő headseteket tesztel, amelyek nemcsak recepteket tudnak felmondani, hanem a dolgozók udvariasságát is képesek nyomon követni...
Fontos kérdés, hogy idén vajon végre látunk-e valódi újdonságot az Apple-től, vagy marad a visszafogott frissítgetés, amit az utóbbi időben megszokhattunk...
📶 A Samsung Galaxy S26 készülékek hamarosan lehetővé teszik a műholdas kommunikációt, így a felhasználók világszerte hozzáférhetnek ehhez a fejlett funkcióhoz...
Megvizsgálandó, hogy miért található hihetetlenül kevés neandervölgyi eredetű DNS az emberi X-kromoszómában, míg más génszakaszokon jóval több maradt fenn...
👟 A kosárlabdapályák jellegzetes nyikorgása végre magyarázatot nyert: a hangot nem egyszerűen a gumi és a parketta közti súrlódás okozza, hanem a talp és a padló között kialakuló, szuperszonikus sebességgel mozgó kis súrlódási zónák...
🍔 Már nemcsak a grillen történik a varázslat: a Burger King bevetette legújabb trükkjét, egy mesterségesintelligencia-alapú chatrobotot, amely beépült a dolgozók fejhallgatóiba...
Több mint 6500 terhes nő adatait elemezve fény derült arra, hogy a COVID–19 elleni védőoltás a várandósság idején nemcsak a vírus elleni védelmet nyújtja, hanem jelentősen mérsékli a preeklampszia kialakulásának esélyét is...
A japán Trend Micro két súlyos sebezhetőséget is javított az Apex One biztonsági rendszerében, amelyek lehetővé tették a hackerek számára, hogy távolról kártékony kódot futtassanak sérülékeny Windows gépeken...
Egy súlyos kibertámadás során a Conduent üzleti szolgáltató rendszereihez jogosulatlanul hozzáfértek, és akár 25 millió amerikai személyes adata kerülhetett rossz kezekbe – közülük 15 millióan texasiak...
🤖 A Perplexity bemutatta új fejlesztését, a Computert, amely képes önállóan megszervezni és levezényelni összetett feladatokat, miközben több MI-modelleket használ egyszerre...
Az orforglipron, az Eli Lilly új fejlesztésű, szájon át szedhető, GLP-1-receptoron ható készítménye látványos sikereket ért el a legújabb klinikai vizsgálatban...
😁 Ez a jelenség jól illusztrálható azzal, hogy a Google lendületét egy évnyi fejlesztés sem tudta megtörni: az MI-modellek sorozatos frissítéseivel sikerült az élmezőnybe ugrania, sőt, több területen még a legnagyobb versenytársakat is maga mögé utasította...
A chilei Cerro Pachón-hegy tetején működő Vera C. Rubin Obszervatórium szenzációs felfedezésekkel indította tudományos küldetését: egyetlen éj leforgása alatt 800 000 égi objektumról adott ki riasztást...