2026. 04. 17., 08:16

Az MI-háború új felvonása: a Claude Opus 4.7 visszaveszi a trónt

Az MI-háború új felvonása: a Claude Opus 4.7 visszaveszi a trónt
A mesterséges intelligencia fejlesztésének újabb mérföldkövéhez érkeztünk: az Anthropic piacra dobta legújabb, mindenki számára elérhető nagy nyelvi modelljét, a Claude Opus 4.7-et. A friss kiadás közvetlenül veszi célba a korábbi favoritokat – főként az OpenAI GPT-5.4 változatát –, és kis különbséggel visszaszerezte a vezető pozíciót a legkomplexebb, széles körben használható MI-modellek csatájában. Az Opus 4.7 a GDPVal-AA tudásmunka-értékelésen 1753-as Elo-pontszámot szerzett, amivel megelőzte a GPT-5.4-et (1674 ponttal) és a Gemini 3.1 Pro-t (1314 ponttal) is. Fontos kiemelni, hogy az új modell nem minden területen vitte a prímet: keresési feladatokban vagy többnyelvű kérdésekben továbbra is akadnak vetélytársak, amelyek jobban teljesítenek nála.

Erődemonstráció a fejlesztőknek: multimodális éleslátás és önellenőrzés

Az Opus 4.7 a korábbi 4.6-os architektúrából nőtt ki, de az új kiadás főként az ügynökalapú munkafolyamatokban, például szoftvermérnökségben és komplex dokumentumok feldolgozásában villant nagyot. A modell legfőbb újítása a szigor megtestesítése: önálló ellenőrző lépéseket végez, mielőtt egy feladatot lezártnak tekintene. Belső teszteken például egy Rust-alapú szövegfelolvasó motort alkotott meg, majd a saját audiokimenetét egy különálló beszédfelismerőn keresztül ellenőrizte Python-referencia alapján. Ez a fajta önjavító folyamat csökkenti a korábbi „hallucinációs hurkokat”, amelyek gyakran bosszantották a MI-felhasználókat – és olykor komoly kellemetlenségeket okoztak.

Az eddigi alacsony felbontású képfeldolgozás helyett most akár 2576 pixeles hosszúságú képeket képes kezelni, ami kb. 3,75 megapixeles felbontást jelent – ez háromszoros növekedés. Fejlesztőknek, akik bonyolult, nagy DPI-s felületeken dolgozó ügynökalapú alkalmazásokat írnak, vagy összetett műszaki ábrákról vonnak ki adatot, ezzel a homályos látás korlátja végre megszűnt.

Az XBOW vizuális tesztjein az Opus 4.7 sikeraránya 54,5%-ról 98,5%-ra ugrott. Tudásmunka, ügynöki programozás, diplomás szintű logikai feladatok és vizuális okfejtés terén mindenhol komoly előrelépést mutat.

Pontosabb, mint valaha – de ez tudatos promptolást igényel

A modell szószerinti utasításkövetése újfajta kihívást jelent. Míg korábban a MI-modellek képesek voltak „olvasni a sorok között”, az Opus 4.7 már kizárólag azt végzi el, amit pontosan kérnek tőle. Ez azt jelenti, hogy a régebbi, lazábban megírt utasításkészletek most kellemetlen meglepetéseket okozhatnak, vagy éppen túl merev eredményt szülnek – így mindenképp érdemes az alkalmazott promptokat átdolgozni.

Az „ügynöki” logika, amely miatt a modell képes tervezni, ellenőrizni és „magától gondolkodni”, jár némi kompromisszummal: hosszabb feladatoknál több tokent fogyaszt, és a válaszidő is hosszabb lehet. Ennek kiegyensúlyozására bevezettek egy új „effort” (erőfeszítés) beállítást, amelynél finoman szabályozható, mennyi energiát szánjon egyes feladatokra a MI. A tapasztalatok szerint az „xhigh” szint adja azt az optimális egyensúlyt, ahol kiemelkedő teljesítményt kapunk elfogadható tokenfelhasználással.

A költségek kordában tartására az új „task budget” rendszer is debütált, ahol maximalizálható egy MI-ügynök által elköltött tokenmennyiség. Ez különösen hasznos, ha órákig tartó hibakereső- vagy elemzőfolyamatokról beszélünk.

Újdonság még a /ultrareview parancs a Claude Code-ban, amely a megszokott szintaktikai ellenőrzés helyett tapasztalt fejlesztőként működik, és a bonyolultabb logikai vagy tervezési hibákat is kiszúrja.

Kibervédelem és jogosultság: már nem minden MI-képesség jár mindenkinek

Idővel egyre komolyabb kérdés lett, mennyire veszélyes, ha bárki hozzáfér csúcskategóriás MI-képességekhez – különösen a kiberbiztonságban. Az Opus 4.7 a jövőbeli védekező automatizmusok tesztelésére szolgál: beépített rendszerekkel igyekszik kiszűrni a magas kockázatú, például sérülékenységkihasználó támadások kéréseit.

A biztonsági szakemberek számára elérhető a Cyber Verification Program, amely ellenőrzött módon enged hozzáférést az Opus 4.7 védelmi funkcióihoz. Ezzel lényegében kapuőrként funkcionál a MI-funkciókhoz, amelyeket csak hitelesített szakértők használhatnak ki teljes mértékben.

A CyberGym-teszteken a modell 73,1%-os sikerrátát ért el, míg a csúcsmodell Mythos Preview 83,1%-ot, a GPT-5.4 pedig csupán 66,3%-ot.


Céges visszajelzések: már nem asszisztens, hanem kolléga

Az első ügyfél-visszajelzések szerint az Opus 4.7 nemcsak lenyűgöző technológia, hanem megbízható, hétköznapi munkaeszköz lett. Az Intuit technológiai alelnöke, Clarence Huang azt hangsúlyozta, hogy az MI már a tervezés során felismeri saját logikai buktatóit, ami elképesztően felgyorsítja a fejlesztést.

Sarah Sachs a Notiontól kiemelte, hogy a modell 14%-kal javított a többlépcsős folyamatokon, miközben 66%-kal visszaesett az eszközhasználati hibák száma, vagyis tényleg csapattársként működik az MI. A logelemzésnél és hibavadászatnál is hatékonyabban és olcsóbban működik, mint korábban.

Több cég képviselői azt emelték ki, hogy az Opus 4.7 órákig képes egyhuzamban, konzisztensen dolgozni, és végigviszi az összes ellenőrzési lépést – nem áll meg félúton.

Érdemes rögtön váltani?

Az Opus 4.7 már nem a régi, kreatív asszisztens szerepét játssza, hanem valódi, megbízható operatív erőforrás lett vállalatok számára. Frissítés előtt viszont érdemes körültekintően eljárni: a régi, lazább promptokra most túlságosan szószerinti vagy rideg válaszok érkezhetnek, illetve a működési költségek is emelkedhetnek a megnövekedett tokenfogyasztás miatt.

Ahol a felhasználás és a költségérzékenység kritikus, ott fokozatos átállást, prompt-újrahangolást és teszteléseket ajánlott bevezetni.

Anthropic helyzete: pénz, szabályozás, kihívások – és lázadó felhasználók

Az Anthropic jelenleg elképesztő lendületben van: a vállalat értéke márciusig meghaladta a 760 milliárd HUF-ot, éves bevétele 2026 áprilisában elérte a 12 ezer milliárd HUF-ot, főként vállalati ügyfeleknek és a Claude Code sikerének köszönhetően. Ám a gyors növekedéshez komoly szabályozási és technikai konfliktusok társulnak: katonai beszállítóként például több fontos piacon hátrányba került, miután visszautasították a tömeges megfigyelés vagy önműködő fegyverek fejlesztését.

Miközben a vállalat a piacvezető szerepet hangoztatja, egyre többen panaszkodnak a korábbi Opus 4.6 és a Claude Code tudatos „butítására”; feltűnt a memóriaszivárgás és a gyakori hibás végrehajtás is, ami miatt az új asztali alkalmazást már csak „fapados” verziónak nevezik. Az Opus 4.7 megjelenése most válasz ezekre a kritikus hangokra: a cég bebizonyítja, hogy a mély gondolkodás és a szigorú végrehajtás együtt lehetséges.

Ez a modell a fegyelem szimbóluma. A korábbi modellekkel ellentétben immár nem a „segítőkész hibák” dominálnak, hanem a szabályok precíz betartása. Az MI-menedzsment a szemlélődő figyelemből a szigorú eredménymenedzsment felé helyeződött át – az Anthropic célja egy valóban autonóm, megbízható digitális munkaerő megteremtése lett.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 21:45

A kannabisz 65 felett biztonságos? Öt veszély, amit ismerni kell

👪 Az utóbbi években a kannabiszhasználat rohamosan nőtt az idősebb korosztály körében is: egyre többen fordulnak hozzá krónikus fájdalom, álmatlanság vagy szorongás enyhítésére...

MA 21:22

Az agy boldogsághormonja titokban gerjesztheti a fülzúgást

😱 Már régóta ismert, hogy a fülzúgás – vagyis az állandó, zavaró csengés, búgás vagy zúgás a fülben – milliók mindennapjait nehezíti meg világszerte...

MA 21:12

A Googlebook berobban: kilép a Chromebook árnyékából?

Az Apple innovációi után a Google és az Intel is lépett: együtt mutatták be közös notebookjukat, amelyet egyelőre csak Googlebook néven emlegetnek...

MA 21:01

A Zee TV bárhol a világon: így nézheted VPN-nel

Zee TV-t szeretnél nézni Indián kívül, akár külföldi utazás vagy tartósabb kintlét alatt?..

MA 20:57

A ConcernedApe új játéka nagyobb, sötétebb és kegyetlenebb

Eric Barone, a Csillagharmat-völgy (Stardew Valley) megalkotója az utóbbi években minden energiáját következő játékára, a Kísértetjárta Csokoládékészítőre (Haunted Chocolatier) fordítja...

MA 20:45

A nagy tőzsdék vizsgálatot sürgetnek a Hyperliquid manipulációs kockázatai miatt

📊 A Hyperliquid nevű decentralizált derivatív tőzsde egyre nagyobb figyelmet kelt az amerikai pénzügyi óriások, a CME Group és az Intercontinental Exchange (ICE) körében...

MA 20:33

Az 5%-os hozam visszatért a hosszú amerikai állampapírra, 2007 óta először

💰 Először 19 év után ismét 5%-os hozammal kínáltak 30 éves amerikai államkötvényt, ami jelentős fordulatot hozott a befektetői piacon...

MA 20:23

A tudósok megfejtették az antarktiszi tengeri jég rejtélyes összeomlását

Egy lényeges szempont, hogy az Antarktisz körüli tengeri jégtakaró szinte példátlan gyorsasággal kezdett eltűnni 2015-től, pedig azt megelőzően évtizedekig stabilnak tűnt...

MA 19:56

A láthatatlan koleszterinveszély, amelyről minden ötödik ember nem tud

Többek között több mint 20 000 önkéntes adatait elemezték kutatók, és kiderült: számos embernél akkor is fennáll a szív- és érrendszeri betegségek kockázata, ha a hagyományos kezeléseket megfelelően kapják...

MA 19:45

Az RTX 5090 még drágább lehet: jöhet a százezres drágulás?

Ha valaki mostanában tervezte, hogy új grafikus kártyára vált, valószínűleg jobban teszi, ha még vár: az RTX 5090 eddig sem volt olcsó, de a legújabb hírek szerint az Nvidia további, akár 100 ezer forintos áremelést fontolgat...

MA 19:34

A kínai tiltás marad: Nvidia MI-chipekre továbbra sincs engedély

Donald Trump, Jensen Huang és több nagyvállalati vezető is Kínába utazott, hogy javítsák az országok közötti kereskedelmi kapcsolatok helyzetét...

MA 19:23

A Kanye West-koncertet Indiában biztonsági okokból felfüggesztették

Kanye West indiai fellépésére ismét nem kerül sor: a május 23-ra tervezett, az újdelhi Jawaharlal Nehru Stadionban tartandó koncertet a szervezők biztonsági aggályok miatt törölték...

MA 19:12

Az OpenAI rákapcsol: Távoli hozzáférés a Codexhez iPhone-on, iPaden és Androidon

📱 Érdekes fejlemény, hogy egyre több fejlesztő mostantól a telefonjáról felügyelheti és irányíthatja a kódolási feladatait, bárhol is jár éppen...

MA 19:02

Az MI-chatbotok felerősítik a nőkkel és lányokkal szembeni erőszakot – sürgős szabályozás kell

Az automatizált csevegőrobotok elárasztották az internetet, átalakítva a nőket és lányokat érő bántalmazás formáit, miközben egészen új, veszélyes módszereket is teremtenek...

MA 18:45

A B2-vitamin árnyoldala: segítheti a rákos sejtek túlélését

😷 Felmerül a kérdés, vajon minden, ártalmatlannak tartott vitamin valóban csak jótékony hatással van-e a szervezetünkre...

MA 18:34

A halált is kijátszotta: Emilia Clarke két agyvérzést élt túl

💪 A világhírű színésznő, Emilia Clarke a mai napig hihetetlennek tartja, hogy életben maradt két súlyos agyvérzés után, amelyeket a Trónok harca (Game of Thrones) forgatása alatt szenvedett el...

MA 17:23

Az olcsó Alienware kemény vádirat a PC-s játékhardver állapotáról

Külön említést érdemel, hogy a 2026-os Alienware 15 megjelenése komoly kérdéseket vet fel a gamer laptopok világában...

MA 16:45

Az OpenAI perelné az Apple-t: válságban a Siri-szövetség

🔥 Érdemes megérteni, hogy két óriás, az Apple és az OpenAI régóta együtt dolgozik, hogy Siri, az Apple hangasszisztense még okosabb és hasznosabb legyen...

MA 16:02

Az antarktiszi Don Juan-tó, amely még mínusz ötven fokban sem fagy be

💦 Az Antarktiszon, a McMurdo-szárazvölgyek fagyott vidékén terül el a Don Juan Pond, amely különös tulajdonságairól híres: ebben a mindössze 10 centiméter mély, hat focipályányi tavacskában annyi só, pontosabban kalcium-klorid található, hogy még mínusz 50 Celsius-fokos hidegben sem fagy be a víz...

MA 15:45

A Wall Street felfigyel a kripto legokosabb MI-fogadására

Nof1 egyik legújabb kezdeményezése, az Alpha Arena egyre nagyobb figyelmet kap a pénzügyi világban...

MA 15:12

A Dutton Ranch ingyen nézhető – íme a rejtett kiskapu

🤸 Hatalmas várakozás előzi meg a Yellowstone (Yellowstone) sorozat új mellékszálát, a Dutton Ranchot, ami már most az év egyik legkeresettebb streamingtartalma...

MA 15:01

Az OpenAI megerősítette a TanStack ellátásilánc-támadását, nem szivárogtak felhasználói adatok

Két OpenAI-munkatárs gépét érte támadás a TanStack ellátási láncát érintő Mini Shai-Hulud incidens során, de a vállalat szerint a történtek nem okoztak érdemi fennakadást a működésben...

MA 14:56

Az MI torzíthatja a pályaválasztást, figyelmeztet a Raspberry Pi-alapító

A technológia és programozás világa egyre kevésbé vonzó a fiatalok számára, mivel a mesterséges intelligencia folyamatosan átveszi a kezdő munkaköröket...

MA 14:45

Az Artemis II űrhajósai belülről mesélik el a felfoghatatlan napfogyatkozást

Érdekes felvetés, hogy milyen módon változtathatja meg egy űrutazás az ember szemléletét a világról...

MA 13:34

Az STRC 1,5 milliárd dolláros rekordforgalommal 11 707 bitcoin vételét fedezi

💰 Lényeges, hogy a Strategy által kibocsátott STRC-részvények forgalma minden eddigit felülmúlva elérte az 1,53 milliárd dollárt (kb...

MA 13:01

Az idei nyár pénztárcabarát futófülhallgatói: kezdőknek, tempóváltáshoz

Kezdő futóként gyakran csapdába esik az ember: túlárazott, csúcskategóriás fülhallgatókat nem akar venni, de a saját lihegése nem elég motiváló társ az edzéshez...

MA 12:34

A Nothing-vezér kiosztja a Sonyt az Xperia 1 VIII bénázó MI-je miatt

A Sony legújabb zászlóshajó mobilja, az Xperia 1 VIII nagy vihart kavart egy egyszerű közösségi poszttal...

MA 11:23

A zombi sejtek nyomában: áttörés az öregedés ellen

👽 Az életkor előrehaladtával testünkben egyre több olyan sejt halmozódhat fel, amelyek már leálltak az osztódással, de ahelyett, hogy elpusztulnának, makacsul kitartanak – ezek az úgynevezett „zombi sejtek”, vagyis szeneszcens sejtek...

MA 10:46

Az Xbox Elite 3 kiszivárgott képei: fura extra, nehéz lesz helytállni

🎮 Érdemes megvizsgálni, mire lehet képes a hamarosan debütáló Xbox Elite 3 kontroller az új piaci viszonyok között...