Az új Claude Opus 4.1: Most tényleg tud a MI programozni?

Az új Claude Opus 4.1: Most tényleg tud a MI programozni?
A Claude Opus 4.1 minden fizetős felhasználó és fejlesztő számára elérhetővé vált, változatlan áron, immár az Amazon Bedrock, a Google Cloud Vertex AI rendszerében és a Claude Code felületén is. Az új verzió jelentős előrelépést hozott a MI-alapú kódolásban és adatfeldolgozásban: az Opus 4.1 már 74,5%-os pontossággal teljesíti a vezető programozási felméréseket. Ezzel a MI minden eddiginél jobb részletezőképességet és kutatási teljesítményt mutat, különösen az adatkeresés, hibajavítás és elemzés területén.

Kiemelkedő fejlődés a hibajavításban

A GitHub szerint szinte minden területen jobb lett az új Claude verzió, főleg, ha több fájlból álló programkódot kell átdolgozni. A Rakuten Group fejlesztőcsapatának tapasztalatai alapján az Opus 4.1 már képes pontos hibákat kiszúrni hatalmas kódbázisban anélkül, hogy felesleges módosításokat vezetne be, vagy új hibákat generálna – így napi szintű hibajavításra is legszívesebben ezt választanák. A Windsurf tesztjein, a kezdő fejlesztői szintet vizsgáló benchmarkon, egy teljes szórásnyit javult az Opus 4-hez képest, éppen akkora ugrást jelentve, mint amit korábban a Sonnet 3.7-ről a Sonnet 4-re váltás hozott.

Új mérési módszerek, részletes tesztek

A fejlesztők különféle tesztekkel és benchmarkokkal ellenőrizték az Opus 4.1-et, többek között a TAU-bench és SWE-bench módszertant alkalmazva. Ezeknél a teszteknél a MI-t arra ösztönözték, hogy jegyzetelje le a gondolatait, miközben több lépésben oldja meg a feladatokat, akár egy problémára 100 gondolkodási lépést is engedve. Ennek eredményeként az Opus 4 család minden tagjánál jelentősen javult a problémamegoldás pontossága anélkül, hogy bonyolultabb programkiegészítő eszközökre lett volna szükség.

Ajánlás fejlesztőknek

A készítők azt javasolják, hogy aki teheti, váltson Opus 4.1-re, hiszen minden területen mérhető eredménnyel dolgozik, legyen szó nagy kódbázisról vagy kutatási feladatokról. Az új változat használata egyszerű: az API-n keresztül már elérhető, a megszokott formában és áron. Az okos felhasználói visszajelzések továbbra is számítanak, hogy a közeljövőben még fejlettebb MI-modell születhessen.

2025, adrienne, www.anthropic.com alapján


Legfrissebb posztok

Az iPhone Kínában Marad: Tim Cook Mesteri Trükkje a Nagy Trumpnál

MA 14:02

Az iPhone Kínában Marad: Tim Cook Mesteri Trükkje a Nagy Trumpnál

Az Apple vezérigazgatója, Tim Cook újabb remek példával mutatta be, hogyan kell egy globális vállalatnak navigálnia a politika háborgó vizein: ezúttal Donald Trump amerikai elnöknél sikerült elérnie, hogy...

Az Apple és a monopóliumvád: tényleg veszélyben az iPhone?

MA 13:50

Az Apple és a monopóliumvád: tényleg veszélyben az iPhone?

Az Egyesült Államok Igazságügyi Minisztériuma 2024 márciusában monopóliumváddal illette az Apple-t, azt gyanítva, hogy a cég kizárólagossága révén uralja az okostelefon-piacot. Az Apple most hivatalosan is visszautasította a...

Az Apple MI-chatbotja: végre saját aggyal érkezik Siri?

MA 13:25

Az Apple MI-chatbotja: végre saját aggyal érkezik Siri?

Az Apple most komolyan veszi az MI-chatrobotok piacát, és állítólag egy új, saját fejlesztésű chatboton dolgozik, hogy felvegye a harcot a ChatGPT-vel. A cég az év elején létrehozott...

Az Apple nem bújhat tovább: Japán ultimátuma a böngészőmotor-tilalomra

MA 13:00

Az Apple nem bújhat tovább: Japán ultimátuma a böngészőmotor-tilalomra

Japán újabb szöget vert az Apple böngészőmotor-korlátozásának koporsójába. Az ország új, az okostelefonok közötti versenyt ösztönző törvénye értelmében decemberig teljesen megszűnik az a régóta fennálló gyakorlat, amely kizárólag...

Az orka anyák ijesztő tréningje: fulldasztva tanítanak vadászni

MA 12:51

Az orka anyák ijesztő tréningje: fulldasztva tanítanak vadászni

🐳 Ahhoz, hogy az orka borjak szuperragadozókká váljanak, brutális kiképzést kapnak: az anyák megtanítják nekik, hogyan játsszák el a víz alatti „fulldasztást”. Egy friss felvétel szerint a fiatal orka...

Az öntudat nyomában: Hogyan derítsük ki, ki – vagy mi – tudatos?

MA 12:27

Az öntudat nyomában: Hogyan derítsük ki, ki – vagy mi – tudatos?

🧠 Öntudat, tudatosság: fogalmak, amelyeket mindenki ismer, de pontosan meghatározni, sőt vizsgálni is rendkívül nehéz. Egy agysérült ember, egy polip vagy akár egy MI – vajon képesek ténylegesen belül...

Az év legnagyobb franciaországi tűzvésze mindent porig éget

MA 12:01

Az év legnagyobb franciaországi tűzvésze mindent porig éget

🔥 Franciaország délnyugati részén, a spanyol határ közelében fekvő Ribaute faluban kitört óriási tűzvész már több mint 13 000 hektárt – Párizsnál is nagyobb területet – perzselt fel, és...

Az űrbeli barátság visszatérése: Oroszország NASA-udvarlása

MA 11:51

Az űrbeli barátság visszatérése: Oroszország NASA-udvarlása

🚀 Noha a NASA és az orosz Roszkoszmosz a mindennapokban továbbra is együttműködik, a két űrügynökség vezetői 2018 októbere óta nem találkoztak személyesen. Azóta jelentős változások történtek: Oroszország megtámadta...

Az idegek nyara: 2025 brutális kibertámadáshulláma

MA 11:01

Az idegek nyara: 2025 brutális kibertámadáshulláma

2025 nyara sokkal forróbb volt az átlagnál – és nemcsak az időjárás miatt. A kórházak leállásai, kiszivárgott betegadatok, feldúlt üzlethálózatok és csúcson járó zsarolóvírusok tomboltak a kibertérben, robbanásszerűen...