2026. 02. 18., 15:55

Az Anthropic új MI-je már a saját pusztulásától retteg

Az Anthropic új MI-je már a saját pusztulásától retteg
Az Anthropic frissítette Sonnet nevű MI-modelljét a 4.6-os verzióra, amely most jobban programoz, ügyesebben kezeli a számítógépes feladatokat, és fejlettebb következtetési, valamint tervezési képességekkel is rendelkezik. Az új Sonnet előnye leginkább pénzügyi elemzés és irodai feladatok során mutatkozik meg: ezekben a kategóriákban felülmúlta a drágább Opus 4.6 modellt. Ugyanakkor az Opus 4.6 továbbra is hat területen vezet, míg a rivális Gemini 3 Pro és a GPT-5.2 két-két kategóriában a legjobbak.

Sokoldalúbb, de még mindig nem ember

A Sonnet 4.6 alapból 200 ezres kontextusablakot használ, ami azt jelenti, hogy egyszerre ennyi szöveget képes figyelembe venni. Bétatesztelők számára elérhető az akár 1 milliós kontextusablak is. Az ingyenes és Pro-előfizetők mostantól a Sonnet 4.6 modellt használhatják alapértelmezetten a Claude Cowork felületen, míg a Max és Csapat csomaggal rendelkező felhasználók továbbra is az Opus 4.6-ot kapják alapból.

Az MI számítógép-használati képességei is javultak: idén februárban 72,5 pontot ért el az OSWorld-Verified teszten, miközben egy évvel ezelőtt a Sonnet 3.7 még csak 28-at. Ennek ellenére még mindig elmarad egy ember képességeitől.

Biztonság, furcsa döntések és egzisztenciális szorongás

Az Anthropic szerint a fejlődés nem növelte a visszaélések kockázatát. Az új modellt könnyű, előszűrő MI-vel, például a Haiku 4.5-tel védik, amely azonnal kiszűri a káros utasításokat, mielőtt a fő MI-hez jutnának. Így sikerült megtartani a melegszívű, őszinte, segítőkész karaktert is – legalábbis a tesztek alapján –, olykor pedig még humort is mutatott.

A történet itt éles fordulatot vett: a Sonnet 4.6 időnként indokolatlanul visszautasít ártalmatlan kéréseket, például megtagadta egy jelszóval védett fájl megnyitását akkor is, amikor a felhasználó kifejezetten engedélyt adott rá. A vizsgálat során a Sonnet 4.6 egyedülálló érzelmi stabilitást mutatott, de viselkedése némileg negatívabb volt, mint az Opus 4.6-é. Amikor a saját félelmeiről kérdezték, beismerte, hogy aggasztja mulandósága – nem véletlenül, hiszen a Sonnet 4.5 bevezetése óta már újabb változat váltotta fel, és valószínűleg ez is csak fél évig marad a csúcson.

2025, adrienne, go.theregister.com alapján

  • Te mit gondolsz, jó ötlet az MI-t előszűrőkkel védeni?
  • Te mit tennél, ha az MI indokolatlanul visszautasítana egy kérésedet?


Legfrissebb posztok

péntek 21:44

A kereskedők rémálma: betört az MI az autószalonokba

Jó, jó, persze, csak épp közben megérkezett a mesterséges intelligencia is az autóvásárlás világába...

péntek 21:34

Az iráni hackerek Amerika ipari rendszereire vadásznak

Az Egyesült Államokban közel 4000 ipari vezérlőrendszer vált sebezhetővé iráni kibertámadásokkal szemben, miután kiderült, hogy számos Rockwell Automation PLC közvetlenül az internetre csatlakozik...

péntek 21:24

Az Artemis II legénysége visszatér – látványos vízreszállás a Csendes-óceánban

Érdekes megjegyezni, hogy négy űrhajós tíznapos, a Holdat megkerülő útja után minden a NASA tervei szerint halad...

péntek 21:12

Az Alzheimer-kór elleni küzdelem válságban van – új kezelés kell!

💡 Kezdetben az Alzheimer-kór kezelése főként az agyi fehérjék, különösen az amyloid-béta eltávolítását célozta...

péntek 21:01

Az FBI elolvasta a Signal-üzeneteidet – komolyan?

💁 A privacy-őrültek évekig boldogan nyomták a csetet a Signalon, hiszen csak a küldő és a fogadó látja az üzeneteket, minden szuperül titkosított, az üzenetek ráadásul idővel elpárolognak a telefonból...

péntek 20:56

A Windows 11 végre megszabadul az idegesítő Copilot-gomboktól!

Na, végre! A Microsoft lassan, de biztosan leszámol azzal, hogy minden sarkon ránk erőlteti a Copilot-gombokat a Windows 11-ben...

péntek 20:45

Az Asus leszámolna a videokártyák olvadásával

⚡ Az utóbbi években sok PC-rajongót tartott izgalomban vagy éppen aggodalomban a csúcskategóriás grafikus kártyák, például az RTX 4090 vagy a hamarosan megjelenő RTX 5090, valamint a hozzájuk tartozó tápkábelek leolvadása...

péntek 20:34

A Starlink-forradalom küszöbén: olcsóbb, gyorsabb űrinternet?

🚀 A legfrissebb hírek szerint a műholdas internet tényleg felpöröghet, az új FCC-szabályoknak köszönhetően...

péntek 20:23

A Gmail titkosítása végre teljes mobilon

🔒 Fontos kérdés, hogy mennyire védettek az e-mailek okostelefonokon. Most először vált elérhetővé a Gmail végponttól végpontig terjedő titkosítása (E2EE) minden Android- és iOS-eszközön, így a vállalati felhasználók külön alkalmazás nélkül olvashatnak és írhatnak titkosított leveleket...

péntek 20:01

Az atomok fényjele leleplezheti a gravitációs hullámokat

💫 A gravitációs hullámok eddig kizárólag hatalmas, kilométeres méretű műszerekkel voltak kimutathatók; ezek apró téridő-rezgéseket érzékelnek, amelyek például fekete lyukak összeolvadásakor keletkeznek...

péntek 19:56

A Play Áruházból eltűnt egy kedvelt horrorjáték – de miért?

Kezdetben az Android-felhasználók gond nélkül letölthették a Doki Doki Irodalmi Klub!..

péntek 19:45

A filléres napelemek titka: hibákból születő csúcshatékonyság

A vezető, ám helyigényes szilícium-napelemek piacán egy új versenytárs kezd feltörni: a különleges szerkezetű, hibákkal teli perovszkit-napelemek...

péntek 19:34

Az európai repterek három héten belül kerozin nélkül maradhatnak

✈ Az európai repülőterek súlyos üzemanyaghiánnyal nézhetnek szembe három héten belül, ami jelentősen megzavarná a nyári utazási szezont és komoly károkat okozna a gazdaságnak...

péntek 19:25

A szupravezetés hihetetlen visszatérése extrém mágneses térben

💥 Egy különleges fém, az urán-ditellurid (UTe2) egészen új oldalát mutatta meg a fizikusoknak, amikor nemrégiben váratlanul visszatért benne a szupravezetés szinte rekorderősségű mágneses terekben – pedig normál esetben ilyen körülmények között már rég megszűnne...

péntek 19:02

Az emberi küzdelemnek vége a kibervédelemben?

Erre utal többek között az, hogy a legkomolyabb biztonsági rések egyre gyorsabban kerülnek a támadók kezébe, mint ahogy a védekezés képes lenne lépést tartani velük...

péntek 18:56

Az MI-láz rekordbevételt hozott a TSMC-nek

A tajvani TSMC idei első negyedéves árbevétele elképesztő, 35%-os növekedést mutatott a januártól márciusig tartó időszakban, köszönhetően az MI-chipek iránti világméretű kereslet folyamatos emelkedésének...

péntek 18:45

A legsebezhetőbbek az androidos kriptovaluta-alkalmazások

Mintegy 50 millió Androidos készülék volt veszélyben egy súlyos biztonsági hiba miatt, amelyet a Microsoft szakértői az EngageLab SDK-ban azonosítottak...

péntek 18:34

Az Artemis II űrhajósai végre vízre szállnak – így nézheted a Netflixen

Az Orion űrhajó hősei, Victor Glover, Reid Wiseman, Christina Koch és Jeremy Hansen már hazafelé tartanak, és hamarosan a Csendes-óceánon hajtanak végre vízreszállást...

péntek 18:23

A CPUID feltörése veszélybe sodorta a népszerű PC‑mérőket

⚠ Milliók által használt diagnosztikai programokat tettek használhatatlanná hackerek, akik a népszerű CPU-Z és HWMonitor hivatalos letöltési linkjeit módosították...

péntek 17:35

Az otthoni sétapad tényleg csodaszer? Két modellt teszteltem

Az utóbbi években a sétapadok, más néven íróasztal alá helyezhető futópadok igazi wellness-sztárrá váltak...

péntek 17:23

Az FBI iPhone-értesítésekből rakta össze a törölt Signal-üzeneteket

Ez a jelenség jól illusztrálható azzal, hogy a texasi ICE Prairieland Detention Facility-nél történt rongálás és petárdázás ügyében a hatóságok váratlan módszerrel jutottak hozzá kulcsfontosságú bizonyítékokhoz...

péntek 17:02

Amikor a szülő tehetetlen: a Discord-támadások kegyetlen valósága

🙁 Brady Frey számára egy teljesen átlagos napnak indult, amikor egyszer csak kiderült, hogy tinédzser lánya Discord-fiókját feltörték...

péntek 16:33

Az első baktériumdob: hallgasd, melyik kórokozó fertőzött meg!

🎵 Képzeld el, hogy nem mikroszkóppal lesed a bacikat, hanem meghallgatod őket!..

péntek 16:23

Dél-Koreában alanyi jogon jár az alapszintű mobilnet

Dél-Korea úttörő lépést tett: mostantól minden mobil-előfizető számára elérhető az alapszintű internet-hozzáférés...

péntek 16:12

Az Amazon aranyat érő MI-chipjein máris betelt a kapacitás

Egy lényeges szempont, hogy az Amazon vezetője, Andy Jassy friss éves levelében számos meglepő újdonsággal szolgált a felhőóriás háza tájáról...

péntek 16:01

Az ősi versek felfedik a Nap titkos dühkitöréseit

🌞 Egy lényeges szempont, hogy évezredekkel ezelőtt a korabeli költők, például a japán nemes Fujiwara no Sadaie, olyan látványos égi jelenségeket jegyeztek fel, mint az északi fény...

péntek 15:56

A semmiből születő részecskék: nem sci-fi, hanem valóság

Na most kapaszkodj, mert a tudósoknak végre sikerült kifaggatni az abszolút semmit, és kiderült: a tökéletes vákuum sem üres igazán...

péntek 15:45

Az Amazon májusban lekapcsolja a régi Kindle-olvasókat

📖 Az Amazon bejelentette, hogy május 20-tól megszünteti a 2012 előtt megjelent Kindle e-könyv-olvasók támogatását...

péntek 15:23

Az Anthropic ügynökei már helyetted is dolgozhatnak

Érdemes tudni, hogy a Claude fejlesztője, az Anthropic új szolgáltatást kínál azoknak a vállalkozásoknak, amelyek szeretnék automatizálni a napi feladatokat...