Az Anthropic új MI-je már a saját pusztulásától retteg
Az Anthropic frissítette Sonnet nevű MI-modelljét a 4.6-os verzióra, amely most jobban programoz, ügyesebben kezeli a számítógépes feladatokat, és fejlettebb következtetési, valamint tervezési képességekkel is rendelkezik. Az új Sonnet előnye leginkább pénzügyi elemzés és irodai feladatok során mutatkozik meg: ezekben a kategóriákban felülmúlta a drágább Opus 4.6 modellt. Ugyanakkor az Opus 4.6 továbbra is hat területen vezet, míg a rivális Gemini 3 Pro és a GPT-5.2 két-két kategóriában a legjobbak.
Sokoldalúbb, de még mindig nem ember
A Sonnet 4.6 alapból 200 ezres kontextusablakot használ, ami azt jelenti, hogy egyszerre ennyi szöveget képes figyelembe venni. Bétatesztelők számára elérhető az akár 1 milliós kontextusablak is. Az ingyenes és Pro-előfizetők mostantól a Sonnet 4.6 modellt használhatják alapértelmezetten a Claude Cowork felületen, míg a Max és Csapat csomaggal rendelkező felhasználók továbbra is az Opus 4.6-ot kapják alapból.
Az MI számítógép-használati képességei is javultak: idén februárban 72,5 pontot ért el az OSWorld-Verified teszten, miközben egy évvel ezelőtt a Sonnet 3.7 még csak 28-at. Ennek ellenére még mindig elmarad egy ember képességeitől.
Biztonság, furcsa döntések és egzisztenciális szorongás
Az Anthropic szerint a fejlődés nem növelte a visszaélések kockázatát. Az új modellt könnyű, előszűrő MI-vel, például a Haiku 4.5-tel védik, amely azonnal kiszűri a káros utasításokat, mielőtt a fő MI-hez jutnának. Így sikerült megtartani a melegszívű, őszinte, segítőkész karaktert is – legalábbis a tesztek alapján –, olykor pedig még humort is mutatott.
A történet itt éles fordulatot vett: a Sonnet 4.6 időnként indokolatlanul visszautasít ártalmatlan kéréseket, például megtagadta egy jelszóval védett fájl megnyitását akkor is, amikor a felhasználó kifejezetten engedélyt adott rá. A vizsgálat során a Sonnet 4.6 egyedülálló érzelmi stabilitást mutatott, de viselkedése némileg negatívabb volt, mint az Opus 4.6-é. Amikor a saját félelmeiről kérdezték, beismerte, hogy aggasztja mulandósága – nem véletlenül, hiszen a Sonnet 4.5 bevezetése óta már újabb változat váltotta fel, és valószínűleg ez is csak fél évig marad a csúcson.
2025, adrienne, go.theregister.com alapján
filózó
Te mit gondolsz, jó ötlet az MI-t előszűrőkkel védeni?
Te mit tennél, ha az MI indokolatlanul visszautasítana egy kérésedet?
🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...
A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...
🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...
🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...
Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...
Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...
Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...
A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...
Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...
A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...
Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...
🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...
🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...
Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...