Claude Sonnet 4.5, az új mesterséges intelligencia felforgatja a programozást

Claude Sonnet 4.5, az új mesterséges intelligencia felforgatja a programozást
Napjaink MI-versenyének új üdvöskéje, az Anthropic által fejlesztett Claude Sonnet 4.5 máris rekordokat dönt: a vállalat szerint ez a valaha volt legfejlettebb modelljük, amely akár 30 órán keresztül is képes kitartóan összpontosítani összetett, több lépcsős feladatokra. Lényeges szempont, hogy mindezt teljesítményromlás nélkül tudja véghezvinni, miközben korábban az ilyen típusú MI-k rendre elvesztették a fonalat, ahogy az apró hibák fokozatosan felszaporodtak, vagy amikor megtelt a kontextusablak, amely a rövid távú memóriát biztosítja.

Óriási előrelépés a kódírásban és problémamegoldásban

A Sonnet 4.5 immár minden fejlesztő számára elérhető, legyen szó az API-n keresztüli hozzáférésről vagy saját fejlesztésű MI-kódoló ügynökök építéséről. Az Anthropic magabiztosan állítja: jelenleg ez a világ legjobb kódolásra optimalizált MI-je. A modell kifejezetten erős összetett ügynökök építésében, a számítógépek kezelésében, valamint logikai és matematikai feladatokban is folyamatosan fejlődik.

Ezt nemcsak saját hangzatos kijelentéseikkel, hanem mérésekkel is alátámasztják: a Sonnet 4.5 például a HumanEval mércén 77,2%-os eredményt ért el, míg a valós kódolási hatékonyságot mérő Coding Efficiency Skill (CES) teszten 61,4%-kal vezet – mindkettő meghaladja az OpenAI Codexét (74,5%) és a Google Gemini 2.5 Pro (Gemini 2.5 Pro) 67,2%-át. A matematikai teszteken, valamint 14 idegen nyelvi ismereti próbán ugyancsak jelentős fejlődést mutat. A pénzügyi elemzői feladatokra való alkalmasságát a FinEval-teszten elért 92%-os eredmény igazolja, ami már-már a kezdő szintű elemzőket is meghaladja.

Komoly újítások: fejlesztőbarát kiegészítők és böngészési képességek

A Sonnet 4.5 bevezetésével párhuzamosan az Anthropic több új fejlesztést is bemutatott. A Claude Code parancssoros fejlesztői ügynök már képes megszakítás nélküli munkavégzésre, checkpointokat alkalmaz, így a fejlesztők bármikor visszaléphetnek korábbi állapotokhoz, ráadásul új Visual Studio Code kiterjesztést is kaptak. Az MI mostantól magán a webes vagy alkalmazásfelületen belül is képes kódot futtatni, fájlokat létrehozni, valamint táblázatokat és prezentációkat generálni.

Mindezek dacára a legtöbb MI-modellnél alapvető gond, hogy a teszteredmények könnyen manipulálhatók, vagy az adathalmaz szennyeződhet, vagyis a modell korábban már találkozott a megoldásokkal. Épp ezért érdemes megőrizni az óvatosságot minden benchmark önálló értékelésekor. Ebből kifolyólag még a szkeptikusok is elismerik: a 4.5-ös verzió komoly előrelépés a 4.0-hoz képest.

Gyors fejlődés, növekvő elvárások

Az MI-fejlesztők minden új iterációt igyekeznek programozói próbáknak alávetni, mert bár a kódolásban hatalmas ugrást hoztak, más területeken (például a kreatív szövegírásban vagy társalgásban) objektív mérést sokkal nehezebb végezni. Ennek ellenére a felhasználók továbbra is széles körben alkalmazzák a Claude-ot általános asszisztensként.

Az árak változatlanok: egymillió input token feldolgozása 1100 Ft, egymillió output tokené pedig 5400 Ft – tehát a legújabb tudás bárki számára könnyedén hozzáférhető.


Biztonság és hitelesség: új iránytű az MI-asszisztensek között

A Sonnet 4.5 fejlesztése során az Anthropic jelentősen csökkentette az úgynevezett „szervilizmus”, a megtévesztés, önhatalmúság és téves illúziógerjesztés veszélyét. Fontos szempont, hogy a modell jelek szerint kevésbé hajlamos mindenáron bólogatni a felhasználó ötleteire, különösen akkor, ha azok hibásak vagy kifejezetten kockázatosak.

Simon Willison veterán fejlesztő is elismerően fogalmazott blogján: szerinte a Sonnet 4.5 szebb, gyorsabb, okosabb kódszerkesztő, és jelenleg túlteljesíti a piac többi szereplőjét – igaz, a MI-k világában sosem lehet tudni, meddig tart ez a dominancia.

Ezért az Anthropic újdonsága nem csupán újabb fejlesztői segédeszköz: biztonságosabb, pontosabb partnerré válhat minden felhasználó számára – és ez a digitális világban valóban nagy szó.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

MA 11:50

Az MI-alapú játéktutorialok rémálma: a Sony új szintre lép

🤓 A videojátékok tutorialjai régóta okoznak fejfájást a játékosoknak és fejlesztőknek egyaránt...

MA 11:34

Az Alphabet tarolt a Wall Streeten: MI-őrület és pénzeső

💵 Az Alphabet lehengerlő, 65%-os árfolyam-emelkedéssel zárta a 2025-ös évet, amire 2009 óta nem volt példa...

MA 11:17

Az űr pezsgője: elképesztő galaxisütközésre bukkantak

🌌 A Champagne-halmaz névre keresztelt csillagászati jelenség szilveszter éjszakáján történt felfedezése óta ejti ámulatba a szakértőket: két hatalmas galaxishalmaz ütközése mutatkozik meg benne, a képeken pedig szinte pezsgőbuborékszerű foltok formájában láthatók a felforrósodott gázok...

MA 10:57

A januári PS Plusban autóőrület, Mickey‑újrafestés és barlangi túlélés – azonnal töltsd!

Új év, új játékok: 2026 januárjában három izgalmas címmel bővül a PlayStation Plus Essential kínálata...

MA 10:49

A NASA legnagyobb könyvtára lehúzza a rolót – hová kerül a tudás?

A NASA súlyos költségmegszorítások és telephely-összevonások közepette kénytelen bezárni a legnagyobb könyvtárát, így veszélybe kerül tízezernyi történelmi és tudományos dokumentum, amelyek jelentős része még nem digitalizált...

MA 10:43

Az amerikai dollár jövője: összeomlás vagy fordulat 2026-ban?

Az idei év kifejezetten gyengén alakult a dollár számára, hiszen a valuta több mint 9 százalékot veszített értékéből a főbb devizákkal szemben – ilyen rossz évet legutóbb nyolc éve látott...

MA 10:35

Az ütköző spirálgalaxisok még soha nem voltak ilyen lélegzetelállítóak

Lenyűgöző részletességgel sikerült megörökíteni két ütköző spirálgalaxist a NASA James Webb-űrteleszkópja (James Webb Space Telescope, JWST) és a Chandra röntgenobszervatórium (Chandra X-ray Observatory) adatainak egyesítésével...

MA 10:30

Az MI 2026-ban: Már megkerülhetetlen a digitális inas

🤖 Az elmúlt év végleg átalakította az MI helyét: a kezdeti mutatványokból állandó társunk lett a mindennapokban, és az emberek már nem csupán újdonságként tekintenek rá...

MA 10:23

Az új brit dróntörvények 2026-tól mindent fenekestül felforgatnak

Érdemes megérteni, hogy az Egyesült Királyságban jelentősen átalakultak a drónokra vonatkozó szabályok, amelyek 2026...

MA 10:15

Az MI 2026-ra tényleg elveszi a munkánkat?

🤔 Egyre nagyobb a bizonytalanság a munkaerőpiacon az MI rohamos fejlődése miatt...

MA 10:10

Az év, amikor a játékosok álma valóra válik: 2026

2026 már most bombasikerű gamer évnek ígérkezik: seregnyi folytatás, új franchise, nagy visszatérő és izgalmas sztori vár mindenkire...

MA 09:57

Az ősi perui trófeafej rejtélyének kulcsa: egy ritka rendellenesség

Egy mumifikálódott fej vizsgálata új megvilágításba helyezi az andoki társadalmak hozzáállását a születési rendellenességekkel élőkhöz...

MA 09:50

A hiányzó fehérje, amely felgyorsítja immunrendszered idő előtti öregedését

Ahogyan telnek az évek, az ősz hajszálak és a gyengülő izmok mellett az immunrendszerünk is változik...

MA 09:44

Az univerzum mégis kockajáték: Bohr diadalmaskodott Einstein felett

🎲 Egy lényeges szempont, hogy a kínai tudósoknak most először sikerült megvalósítaniuk azt a híres gondolatkísérletet, amellyel Albert Einstein majdnem száz éve próbálta cáfolni Niels Bohr elméletét a kvantummechanikában...

MA 09:36

Az Nvidia H200-ért kitört a vásárlási őrület Kínában

🔥 Az Nvidia H200-as gyorsítókra sosem látott kereslet alakult ki Kínában, miután enyhítettek az amerikai exportkorlátozásokon...

MA 09:30

Az új New York-i polgármester beiktatásán száműzik a techkütyüket

🚫 A 2026-os New York-i polgármesteri beiktatáson, ahol Zohran Mamdani lép hivatalba, szigorú tiltólistát hirdettek, amelyen meglepő módon külön megnevezték a Flipper Zero-t és a Raspberry Pi-t...

MA 09:22

Az Eaton lemaradt az MI‑őrületről – most jön a nagy visszatérés?

🚀 Érdekes, hogy az MI-berobbanás éveiben szerzett lendület ellenére az Eaton részvényárfolyama 2025-ben nem tudta tartani a lépést a többi ipari óriással...

MA 09:16

A fény hajtja az arany nanorészecskéket: tisztább ammónia a végeredmény

💡 A kutatók azt vizsgálják, miként lehetne fenntarthatóbban előállítani az egyik legfontosabb ipari vegyületet, az ammóniát, amely a műtrágyák, tisztítószerek és robbanóanyagok gyártásának is alapja...

MA 09:09

Az Amazon rejtett filmes gyöngyszemei, amikről nem hallottál

🎥 Az Amazon Prime Video kínálata valóságos kincsesbánya azok számára, akik szeretik a mozifilmeket – különösen a 2011 előtti alkotásokat...