Az MI-háború új felvonása: a Claude Opus 4.7 visszaveszi a trónt

A mesterséges intelligencia fejlesztésének újabb mérföldkövéhez érkeztünk: az Anthropic piacra dobta legújabb, mindenki számára elérhető nagy nyelvi modelljét, a Claude Opus 4.7-et. A friss kiadás közvetlenül veszi célba a korábbi favoritokat – főként az OpenAI GPT-5.4 változatát –, és kis különbséggel visszaszerezte a vezető pozíciót a legkomplexebb, széles körben használható MI-modellek csatájában. Az Opus 4.7 a GDPVal-AA tudásmunka-értékelésen 1753-as Elo-pontszámot szerzett, amivel megelőzte a GPT-5.4-et (1674 ponttal) és a Gemini 3.1 Pro-t (1314 ponttal) is. Fontos kiemelni, hogy az új modell nem minden területen vitte a prímet: keresési feladatokban vagy többnyelvű kérdésekben továbbra is akadnak vetélytársak, amelyek jobban teljesítenek nála.

Erődemonstráció a fejlesztőknek: multimodális éleslátás és önellenőrzés

Az Opus 4.7 a korábbi 4.6-os architektúrából nőtt ki, de az új kiadás főként az ügynökalapú munkafolyamatokban, például szoftvermérnökségben és komplex dokumentumok feldolgozásában villant nagyot. A modell legfőbb újítása a szigor megtestesítése: önálló ellenőrző lépéseket végez, mielőtt egy feladatot lezártnak tekintene. Belső teszteken például egy Rust-alapú szövegfelolvasó motort alkotott meg, majd a saját audiokimenetét egy különálló beszédfelismerőn keresztül ellenőrizte Python-referencia alapján. Ez a fajta önjavító folyamat csökkenti a korábbi „hallucinációs hurkokat”, amelyek gyakran bosszantották a MI-felhasználókat – és olykor komoly kellemetlenségeket okoztak.

Az eddigi alacsony felbontású képfeldolgozás helyett most akár 2576 pixeles hosszúságú képeket képes kezelni, ami kb. 3,75 megapixeles felbontást jelent – ez háromszoros növekedés. Fejlesztőknek, akik bonyolult, nagy DPI-s felületeken dolgozó ügynökalapú alkalmazásokat írnak, vagy összetett műszaki ábrákról vonnak ki adatot, ezzel a homályos látás korlátja végre megszűnt.

Az XBOW vizuális tesztjein az Opus 4.7 sikeraránya 54,5%-ról 98,5%-ra ugrott. Tudásmunka, ügynöki programozás, diplomás szintű logikai feladatok és vizuális okfejtés terén mindenhol komoly előrelépést mutat.

Pontosabb, mint valaha – de ez tudatos promptolást igényel

A modell szószerinti utasításkövetése újfajta kihívást jelent. Míg korábban a MI-modellek képesek voltak „olvasni a sorok között”, az Opus 4.7 már kizárólag azt végzi el, amit pontosan kérnek tőle. Ez azt jelenti, hogy a régebbi, lazábban megírt utasításkészletek most kellemetlen meglepetéseket okozhatnak, vagy éppen túl merev eredményt szülnek – így mindenképp érdemes az alkalmazott promptokat átdolgozni.

Az „ügynöki” logika, amely miatt a modell képes tervezni, ellenőrizni és „magától gondolkodni”, jár némi kompromisszummal: hosszabb feladatoknál több tokent fogyaszt, és a válaszidő is hosszabb lehet. Ennek kiegyensúlyozására bevezettek egy új „effort” (erőfeszítés) beállítást, amelynél finoman szabályozható, mennyi energiát szánjon egyes feladatokra a MI. A tapasztalatok szerint az „xhigh” szint adja azt az optimális egyensúlyt, ahol kiemelkedő teljesítményt kapunk elfogadható tokenfelhasználással.

A költségek kordában tartására az új „task budget” rendszer is debütált, ahol maximalizálható egy MI-ügynök által elköltött tokenmennyiség. Ez különösen hasznos, ha órákig tartó hibakereső- vagy elemzőfolyamatokról beszélünk.

Újdonság még a /ultrareview parancs a Claude Code-ban, amely a megszokott szintaktikai ellenőrzés helyett tapasztalt fejlesztőként működik, és a bonyolultabb logikai vagy tervezési hibákat is kiszúrja.

Kibervédelem és jogosultság: már nem minden MI-képesség jár mindenkinek

Idővel egyre komolyabb kérdés lett, mennyire veszélyes, ha bárki hozzáfér csúcskategóriás MI-képességekhez – különösen a kiberbiztonságban. Az Opus 4.7 a jövőbeli védekező automatizmusok tesztelésére szolgál: beépített rendszerekkel igyekszik kiszűrni a magas kockázatú, például sérülékenységkihasználó támadások kéréseit.

A biztonsági szakemberek számára elérhető a Cyber Verification Program, amely ellenőrzött módon enged hozzáférést az Opus 4.7 védelmi funkcióihoz. Ezzel lényegében kapuőrként funkcionál a MI-funkciókhoz, amelyeket csak hitelesített szakértők használhatnak ki teljes mértékben.

A CyberGym-teszteken a modell 73,1%-os sikerrátát ért el, míg a csúcsmodell Mythos Preview 83,1%-ot, a GPT-5.4 pedig csupán 66,3%-ot.

Céges visszajelzések: már nem asszisztens, hanem kolléga

Az első ügyfél-visszajelzések szerint az Opus 4.7 nemcsak lenyűgöző technológia, hanem megbízható, hétköznapi munkaeszköz lett. Az Intuit technológiai alelnöke, Clarence Huang azt hangsúlyozta, hogy az MI már a tervezés során felismeri saját logikai buktatóit, ami elképesztően felgyorsítja a fejlesztést.

Sarah Sachs a Notiontól kiemelte, hogy a modell 14%-kal javított a többlépcsős folyamatokon, miközben 66%-kal visszaesett az eszközhasználati hibák száma, vagyis tényleg csapattársként működik az MI. A logelemzésnél és hibavadászatnál is hatékonyabban és olcsóbban működik, mint korábban.

Több cég képviselői azt emelték ki, hogy az Opus 4.7 órákig képes egyhuzamban, konzisztensen dolgozni, és végigviszi az összes ellenőrzési lépést – nem áll meg félúton.

Érdemes rögtön váltani?

Az Opus 4.7 már nem a régi, kreatív asszisztens szerepét játssza, hanem valódi, megbízható operatív erőforrás lett vállalatok számára. Frissítés előtt viszont érdemes körültekintően eljárni: a régi, lazább promptokra most túlságosan szószerinti vagy rideg válaszok érkezhetnek, illetve a működési költségek is emelkedhetnek a megnövekedett tokenfogyasztás miatt.

Ahol a felhasználás és a költségérzékenység kritikus, ott fokozatos átállást, prompt-újrahangolást és teszteléseket ajánlott bevezetni.

Anthropic helyzete: pénz, szabályozás, kihívások – és lázadó felhasználók

Az Anthropic jelenleg elképesztő lendületben van: a vállalat értéke márciusig meghaladta a 760 milliárd HUF-ot, éves bevétele 2026 áprilisában elérte a 12 ezer milliárd HUF-ot, főként vállalati ügyfeleknek és a Claude Code sikerének köszönhetően. Ám a gyors növekedéshez komoly szabályozási és technikai konfliktusok társulnak: katonai beszállítóként például több fontos piacon hátrányba került, miután visszautasították a tömeges megfigyelés vagy önműködő fegyverek fejlesztését.

Miközben a vállalat a piacvezető szerepet hangoztatja, egyre többen panaszkodnak a korábbi Opus 4.6 és a Claude Code tudatos „butítására”; feltűnt a memóriaszivárgás és a gyakori hibás végrehajtás is, ami miatt az új asztali alkalmazást már csak „fapados” verziónak nevezik. Az Opus 4.7 megjelenése most válasz ezekre a kritikus hangokra: a cég bebizonyítja, hogy a mély gondolkodás és a szigorú végrehajtás együtt lehetséges.

Ez a modell a fegyelem szimbóluma. A korábbi modellekkel ellentétben immár nem a „segítőkész hibák” dominálnak, hanem a szabályok precíz betartása. Az MI-menedzsment a szemlélődő figyelemből a szigorú eredménymenedzsment felé helyeződött át – az Anthropic célja egy valóban autonóm, megbízható digitális munkaerő megteremtése lett.

2026, adminboss, venturebeat.com alapján