2026. 04. 17., 08:16

Az MI-háború új felvonása: a Claude Opus 4.7 visszaveszi a trónt

Az MI-háború új felvonása: a Claude Opus 4.7 visszaveszi a trónt
A mesterséges intelligencia fejlesztésének újabb mérföldkövéhez érkeztünk: az Anthropic piacra dobta legújabb, mindenki számára elérhető nagy nyelvi modelljét, a Claude Opus 4.7-et. A friss kiadás közvetlenül veszi célba a korábbi favoritokat – főként az OpenAI GPT-5.4 változatát –, és kis különbséggel visszaszerezte a vezető pozíciót a legkomplexebb, széles körben használható MI-modellek csatájában. Az Opus 4.7 a GDPVal-AA tudásmunka-értékelésen 1753-as Elo-pontszámot szerzett, amivel megelőzte a GPT-5.4-et (1674 ponttal) és a Gemini 3.1 Pro-t (1314 ponttal) is. Fontos kiemelni, hogy az új modell nem minden területen vitte a prímet: keresési feladatokban vagy többnyelvű kérdésekben továbbra is akadnak vetélytársak, amelyek jobban teljesítenek nála.

Erődemonstráció a fejlesztőknek: multimodális éleslátás és önellenőrzés

Az Opus 4.7 a korábbi 4.6-os architektúrából nőtt ki, de az új kiadás főként az ügynökalapú munkafolyamatokban, például szoftvermérnökségben és komplex dokumentumok feldolgozásában villant nagyot. A modell legfőbb újítása a szigor megtestesítése: önálló ellenőrző lépéseket végez, mielőtt egy feladatot lezártnak tekintene. Belső teszteken például egy Rust-alapú szövegfelolvasó motort alkotott meg, majd a saját audiokimenetét egy különálló beszédfelismerőn keresztül ellenőrizte Python-referencia alapján. Ez a fajta önjavító folyamat csökkenti a korábbi „hallucinációs hurkokat”, amelyek gyakran bosszantották a MI-felhasználókat – és olykor komoly kellemetlenségeket okoztak.

Az eddigi alacsony felbontású képfeldolgozás helyett most akár 2576 pixeles hosszúságú képeket képes kezelni, ami kb. 3,75 megapixeles felbontást jelent – ez háromszoros növekedés. Fejlesztőknek, akik bonyolult, nagy DPI-s felületeken dolgozó ügynökalapú alkalmazásokat írnak, vagy összetett műszaki ábrákról vonnak ki adatot, ezzel a homályos látás korlátja végre megszűnt.

Az XBOW vizuális tesztjein az Opus 4.7 sikeraránya 54,5%-ról 98,5%-ra ugrott. Tudásmunka, ügynöki programozás, diplomás szintű logikai feladatok és vizuális okfejtés terén mindenhol komoly előrelépést mutat.

Pontosabb, mint valaha – de ez tudatos promptolást igényel

A modell szószerinti utasításkövetése újfajta kihívást jelent. Míg korábban a MI-modellek képesek voltak „olvasni a sorok között”, az Opus 4.7 már kizárólag azt végzi el, amit pontosan kérnek tőle. Ez azt jelenti, hogy a régebbi, lazábban megírt utasításkészletek most kellemetlen meglepetéseket okozhatnak, vagy éppen túl merev eredményt szülnek – így mindenképp érdemes az alkalmazott promptokat átdolgozni.

Az „ügynöki” logika, amely miatt a modell képes tervezni, ellenőrizni és „magától gondolkodni”, jár némi kompromisszummal: hosszabb feladatoknál több tokent fogyaszt, és a válaszidő is hosszabb lehet. Ennek kiegyensúlyozására bevezettek egy új „effort” (erőfeszítés) beállítást, amelynél finoman szabályozható, mennyi energiát szánjon egyes feladatokra a MI. A tapasztalatok szerint az „xhigh” szint adja azt az optimális egyensúlyt, ahol kiemelkedő teljesítményt kapunk elfogadható tokenfelhasználással.

A költségek kordában tartására az új „task budget” rendszer is debütált, ahol maximalizálható egy MI-ügynök által elköltött tokenmennyiség. Ez különösen hasznos, ha órákig tartó hibakereső- vagy elemzőfolyamatokról beszélünk.

Újdonság még a /ultrareview parancs a Claude Code-ban, amely a megszokott szintaktikai ellenőrzés helyett tapasztalt fejlesztőként működik, és a bonyolultabb logikai vagy tervezési hibákat is kiszúrja.

Kibervédelem és jogosultság: már nem minden MI-képesség jár mindenkinek

Idővel egyre komolyabb kérdés lett, mennyire veszélyes, ha bárki hozzáfér csúcskategóriás MI-képességekhez – különösen a kiberbiztonságban. Az Opus 4.7 a jövőbeli védekező automatizmusok tesztelésére szolgál: beépített rendszerekkel igyekszik kiszűrni a magas kockázatú, például sérülékenységkihasználó támadások kéréseit.

A biztonsági szakemberek számára elérhető a Cyber Verification Program, amely ellenőrzött módon enged hozzáférést az Opus 4.7 védelmi funkcióihoz. Ezzel lényegében kapuőrként funkcionál a MI-funkciókhoz, amelyeket csak hitelesített szakértők használhatnak ki teljes mértékben.

A CyberGym-teszteken a modell 73,1%-os sikerrátát ért el, míg a csúcsmodell Mythos Preview 83,1%-ot, a GPT-5.4 pedig csupán 66,3%-ot.


Céges visszajelzések: már nem asszisztens, hanem kolléga

Az első ügyfél-visszajelzések szerint az Opus 4.7 nemcsak lenyűgöző technológia, hanem megbízható, hétköznapi munkaeszköz lett. Az Intuit technológiai alelnöke, Clarence Huang azt hangsúlyozta, hogy az MI már a tervezés során felismeri saját logikai buktatóit, ami elképesztően felgyorsítja a fejlesztést.

Sarah Sachs a Notiontól kiemelte, hogy a modell 14%-kal javított a többlépcsős folyamatokon, miközben 66%-kal visszaesett az eszközhasználati hibák száma, vagyis tényleg csapattársként működik az MI. A logelemzésnél és hibavadászatnál is hatékonyabban és olcsóbban működik, mint korábban.

Több cég képviselői azt emelték ki, hogy az Opus 4.7 órákig képes egyhuzamban, konzisztensen dolgozni, és végigviszi az összes ellenőrzési lépést – nem áll meg félúton.

Érdemes rögtön váltani?

Az Opus 4.7 már nem a régi, kreatív asszisztens szerepét játssza, hanem valódi, megbízható operatív erőforrás lett vállalatok számára. Frissítés előtt viszont érdemes körültekintően eljárni: a régi, lazább promptokra most túlságosan szószerinti vagy rideg válaszok érkezhetnek, illetve a működési költségek is emelkedhetnek a megnövekedett tokenfogyasztás miatt.

Ahol a felhasználás és a költségérzékenység kritikus, ott fokozatos átállást, prompt-újrahangolást és teszteléseket ajánlott bevezetni.

Anthropic helyzete: pénz, szabályozás, kihívások – és lázadó felhasználók

Az Anthropic jelenleg elképesztő lendületben van: a vállalat értéke márciusig meghaladta a 760 milliárd HUF-ot, éves bevétele 2026 áprilisában elérte a 12 ezer milliárd HUF-ot, főként vállalati ügyfeleknek és a Claude Code sikerének köszönhetően. Ám a gyors növekedéshez komoly szabályozási és technikai konfliktusok társulnak: katonai beszállítóként például több fontos piacon hátrányba került, miután visszautasították a tömeges megfigyelés vagy önműködő fegyverek fejlesztését.

Miközben a vállalat a piacvezető szerepet hangoztatja, egyre többen panaszkodnak a korábbi Opus 4.6 és a Claude Code tudatos „butítására”; feltűnt a memóriaszivárgás és a gyakori hibás végrehajtás is, ami miatt az új asztali alkalmazást már csak „fapados” verziónak nevezik. Az Opus 4.7 megjelenése most válasz ezekre a kritikus hangokra: a cég bebizonyítja, hogy a mély gondolkodás és a szigorú végrehajtás együtt lehetséges.

Ez a modell a fegyelem szimbóluma. A korábbi modellekkel ellentétben immár nem a „segítőkész hibák” dominálnak, hanem a szabályok precíz betartása. Az MI-menedzsment a szemlélődő figyelemből a szigorú eredménymenedzsment felé helyeződött át – az Anthropic célja egy valóban autonóm, megbízható digitális munkaerő megteremtése lett.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...

kedd 11:56

A Philips Hue új Play lámpákkal, gyertyaizzókkal és kapcsolókkal támad

Az okos izzók és fényszalagok (Lightstrip) mellett mostantól a hagyományos csillárok és retró lámpák is integrálhatók a Philips Hue rendszerébe...

kedd 11:34

A Starlink mellett veszélyesen darabokra hullott egy kínai rakéta

Egy kínai magánvállalat által fejlesztett Zhuque-2E rakéta felső fokozata a fellövés után néhány órával széthullott, mindössze néhány száz kilométerre a Föld felszínétől, ahol a Nemzetközi Űrállomás, valamint számos Starlink-műhold kering...