2025. 09. 30., 18:00

Claude Sonnet 4.5, az új mesterséges intelligencia felforgatja a programozást

Napjaink MI-versenyének új üdvöskéje, az Anthropic által fejlesztett Claude Sonnet 4.5 máris rekordokat dönt: a vállalat szerint ez a valaha volt legfejlettebb modelljük, amely akár 30 órán keresztül is képes kitartóan összpontosítani összetett, több lépcsős feladatokra. Lényeges szempont, hogy mindezt teljesítményromlás nélkül tudja véghezvinni, miközben korábban az ilyen típusú MI-k rendre elvesztették a fonalat, ahogy az apró hibák fokozatosan felszaporodtak, vagy amikor megtelt a kontextusablak, amely a rövid távú memóriát biztosítja.

Óriási előrelépés a kódírásban és problémamegoldásban

A Sonnet 4.5 immár minden fejlesztő számára elérhető, legyen szó az API-n keresztüli hozzáférésről vagy saját fejlesztésű MI-kódoló ügynökök építéséről. Az Anthropic magabiztosan állítja: jelenleg ez a világ legjobb kódolásra optimalizált MI-je. A modell kifejezetten erős összetett ügynökök építésében, a számítógépek kezelésében, valamint logikai és matematikai feladatokban is folyamatosan fejlődik.

Ezt nemcsak saját hangzatos kijelentéseikkel, hanem mérésekkel is alátámasztják: a Sonnet 4.5 például a HumanEval mércén 77,2%-os eredményt ért el, míg a valós kódolási hatékonyságot mérő Coding Efficiency Skill (CES) teszten 61,4%-kal vezet – mindkettő meghaladja az OpenAI Codexét (74,5%) és a Google Gemini 2.5 Pro (Gemini 2.5 Pro) 67,2%-át. A matematikai teszteken, valamint 14 idegen nyelvi ismereti próbán ugyancsak jelentős fejlődést mutat. A pénzügyi elemzői feladatokra való alkalmasságát a FinEval-teszten elért 92%-os eredmény igazolja, ami már-már a kezdő szintű elemzőket is meghaladja.

Komoly újítások: fejlesztőbarát kiegészítők és böngészési képességek

A Sonnet 4.5 bevezetésével párhuzamosan az Anthropic több új fejlesztést is bemutatott. A Claude Code parancssoros fejlesztői ügynök már képes megszakítás nélküli munkavégzésre, checkpointokat alkalmaz, így a fejlesztők bármikor visszaléphetnek korábbi állapotokhoz, ráadásul új Visual Studio Code kiterjesztést is kaptak. Az MI mostantól magán a webes vagy alkalmazásfelületen belül is képes kódot futtatni, fájlokat létrehozni, valamint táblázatokat és prezentációkat generálni.

Mindezek dacára a legtöbb MI-modellnél alapvető gond, hogy a teszteredmények könnyen manipulálhatók, vagy az adathalmaz szennyeződhet, vagyis a modell korábban már találkozott a megoldásokkal. Épp ezért érdemes megőrizni az óvatosságot minden benchmark önálló értékelésekor. Ebből kifolyólag még a szkeptikusok is elismerik: a 4.5-ös verzió komoly előrelépés a 4.0-hoz képest.

Gyors fejlődés, növekvő elvárások

Az MI-fejlesztők minden új iterációt igyekeznek programozói próbáknak alávetni, mert bár a kódolásban hatalmas ugrást hoztak, más területeken (például a kreatív szövegírásban vagy társalgásban) objektív mérést sokkal nehezebb végezni. Ennek ellenére a felhasználók továbbra is széles körben alkalmazzák a Claude-ot általános asszisztensként.

Az árak változatlanok: egymillió input token feldolgozása 1100 Ft, egymillió output tokené pedig 5400 Ft – tehát a legújabb tudás bárki számára könnyedén hozzáférhető.

Biztonság és hitelesség: új iránytű az MI-asszisztensek között

A Sonnet 4.5 fejlesztése során az Anthropic jelentősen csökkentette az úgynevezett „szervilizmus”, a megtévesztés, önhatalmúság és téves illúziógerjesztés veszélyét. Fontos szempont, hogy a modell jelek szerint kevésbé hajlamos mindenáron bólogatni a felhasználó ötleteire, különösen akkor, ha azok hibásak vagy kifejezetten kockázatosak.

Simon Willison veterán fejlesztő is elismerően fogalmazott blogján: szerinte a Sonnet 4.5 szebb, gyorsabb, okosabb kódszerkesztő, és jelenleg túlteljesíti a piac többi szereplőjét – igaz, a MI-k világában sosem lehet tudni, meddig tart ez a dominancia.

Ezért az Anthropic újdonsága nem csupán újabb fejlesztői segédeszköz: biztonságosabb, pontosabb partnerré válhat minden felhasználó számára – és ez a digitális világban valóban nagy szó.

2025, adminboss, arstechnica.com alapján

Legfrissebb posztok

A Google villámgyorsan javította a Home hangszóró beüzemelési gondjait

Színes

MA 11:31

A Google villámgyorsan javította a Home hangszóró beüzemelési gondjait

Az elmúlt hetekben az új Google Home Speaker vásárlóit komoly bosszúságok érték: a készülék beállítása során sokuk szembesült egy makacs hibával, amely egyszerűen megakadályozta a használatot...

A gombnak hitt lelet valójában Mezítlábas Magnus 900 éves érméje

Tudomány

MA 11:02

A gombnak hitt lelet valójában Mezítlábas Magnus 900 éves érméje

🪙 Egy norvég mezőn végzett fémdetektorozás közben különös felfedezés született: egy tárgy, amit eredetileg elhagyott gombnak gondoltak, végül egy 900 éves ezüstpénznek bizonyult...

A nyílt forrású MI-modellek olcsóbban vészelik át a költségrobbanást

MI Hírek

MA 10:49

A nyílt forrású MI-modellek olcsóbban vészelik át a költségrobbanást

💰 Egyre több cég dönt úgy, hogy olcsóbb, nyílt forráskódú MI-modellekre vált, miután a fejlett rendszerek használata világszerte elszálló számlákat eredményezett...

Az új robotszív egy gyakori, rejtélyes szívbetegséget utánoz, hogy kutathassák

Tudomány

MA 10:37

Az új robotszív egy gyakori, rejtélyes szívbetegséget utánoz, hogy kutathassák

💖 Egy különleges, puha robot-szív képes utánozni a szívelégtelenség több különböző fázisát, így új lehetőséget adhat a kutatóknak arra, hogy még a klinikai vizsgálatok előtt teszteljék a lehetséges kezeléseket...

A Defender 0-day javítása támadóknak töltheti tele a merevlemezed

Színes

MA 10:25

A Defender 0-day javítása támadóknak töltheti tele a merevlemezed

A legfrissebb Windows Defender-javítás ugyan befoltoz egy komoly biztonsági rést, de újabb, igencsak kellemetlen mellékhatást is bevezethet: lehetőséget teremt arra, hogy támadók pillanatok alatt teleírják a számítógép merevlemezét, egészen addig, amíg egyetlen bájtnyi hely sem marad...

Tudomány

MA 09:37

Az idő születése: fizikusok órák nélkül teremtettek miniatűr univerzumot

Mi történik, ha az idő nem létezik addig, amíg valami meg nem változik?..

MI Hírek

MA 09:25

Az MI-szenny elárasztotta a netet, főleg a LinkedInt és az X-et

Az online világban egyre nehezebb kibogozni, hogy ki írta valójában a közösségi platformok hosszabb, tartalmasnak tűnő bejegyzéseit...

MI Hírek

MA 09:13

Az új ChatGPT a munka svájcibicskája

🛠 Az OpenAI végre bemutatta azt az univerzális mesterségesintelligencia-alkalmazást, amely egyetlen helyen egyesíti a legfontosabb digitális munkaeszközöket...

APP

MA 09:11

APPok, Amik Ingyenesek MA, 7/10

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Between Dates Calendar Math (iPhone/iPad)A Between Days egy egyszerű alkalmazás, amely megmutatja, hány nap van két megadott dátum között...

Tudomány

MA 08:49

A hawaii mosolygópók meglepő rokona az indiai Himalájában

Egy apró, élénkpiros mosollyal díszített pók ejtette ámulatba a kutatókat, amikor Indiában – jóval távolabb Hawaii-tól, amelyhez eddig kötötték a híres „mosolygós pókot” – fedezték fel...

MI Hírek

MA 08:37

A Forg365 adathalászplatform MI-vel támadja a Microsoft 365-fiókokat

🚨 Megemlíthető továbbá, hogy a digitális fenyegetések egyre kifinomultabbak, most pedig a Forg365 platform vetett be újszerű, MI-alapú módszereket a Microsoft 365-fiókok elleni adathalásztámadások során...

MI Hírek

MA 08:25

Az USA fontolgatja a kormány és fékpedál elhagyását az önvezetőknél?

Az amerikai autóiparban jelentős változások várhatók: hamarosan eltűnhet a kormány és a fékpedál az önvezető autókból...

Tudomány

MA 08:14

A jobb kvantumbiztos aláírásokra várni luxus, most kell lépnünk

🔒 A kriptográfia világát régóta uraló RSA- és ECC-algoritmusok hamarosan végveszélybe kerülnek...

MI Hírek

MA 07:49

Az OpenAI új eszköze veled együtt dolgozik – és helyetted is?

Érdemes megérteni, hogy az OpenAI ismét nagyot lépett előre: bemutatta legújabb fejlesztését, amely képes komplex, akár órákig tartó feladatok önálló elvégzésére, nem akad el a hosszabb munkafolyamatokban, és ténylegesen kézzelfogható eredményre vezet különféle célok esetén is...

Színes

MA 07:39

Az Asus ProArt RTX 5090: karcsú szörnyeteg alkotóknak, 32 GB VRAM-mal

🔥 Az Asus ProArt GeForce RTX 5090 32 GB GDDR7 OC Edition kifejezetten a tartalomgyártók és prémium minőségű munkaállomások építőinek szánt grafikus kártya, amely ötvözi a legerősebb fogyasztói GPU-t egy vékonyabb, kis helyigényű kivitelben...

A világ legnagyobb szuperkamerája: 3 tonna, 3200 megapixel az égen

Tudomány

MA 07:26

A világ legnagyobb szuperkamerája: 3 tonna, 3200 megapixel az égen

📷 Egy személyautó-méretű óriáskamera megkezdte minden idők legnagyobb földi égboltfelmérését Chilében. A Cerro Pachón tetején működő, 3 tonnás digitális műszer elindította a Legacy Survey of Space and Time-ot, és mostantól éjszakánként, negyven másodpercenként, körülbelül 3200 megapixeles, 8 GB-os képeket készít az univerzumról...

Tudomány

MA 07:13

A csillagászok szerint a Tejútrendszer nagyobb, nehezebb és aszimmetrikusabb, mint hittük?

A legújabb csillagászati megfigyeléseknek köszönhetően kiderült, hogy a Tejútrendszer két hatalmas spirálkarja sokkal messzebb húzódik, mint azt valaha gondoltuk...

Tudomány

MA 06:49

A heves hasmenést okozó parazita Amerikában tombol: Michiganben 1 251 eset

Lényeges, hogy az Egyesült Államokat az utóbbi hetekben különösen súlyos parazitajárvány sújtja: országszerte már több mint ezer cyclosporiasis-fertőzést jelentettek...

MI Hírek

MA 06:37

Az MI-ügynököket a cégek 69 százalékánál a közös API-kulcsok teszik sebezhetővé

Az MI-ügynökök egyre fontosabb szerepet töltenek be a vállalati működésben, azonban az egyszerűség kedvéért gyakran ugyanazt az API-kulcsot kapják meg...

A 800 másodperces vizit ára: az antibiotikum-rezisztencia nem biológiai okai

Tudomány

MA 06:26

A 800 másodperces vizit ára: az antibiotikum-rezisztencia nem biológiai okai

Az antibiotikum-rezisztencia az egyik legsúlyosabb egészségügyi fenyegetés világszerte, a következő 15 évben akár 39 millió halálesethez is vezethet, ha a baktériumok továbbra is ellenállóvá válnak a gyógyszerekkel szemben...

HistoryToday

MA 06:05

Történelmi események a mai napon (Július 10.)

Időutazás a történelembe: Julius Caesar majdnem elszenvedett macedóniai veresége, a Vichy-kormány megalakulása és a Death Valley hőmérsékleti rekordja mind ezen a napon történt...

Színes

MA 06:01

A Google Home beállításánál sokan elakadnak, és senki sem érti, miért

A Google új Home hangszórója igen viharosan rajtolt, hiszen hónapokkal a Pixel 10 bemutatója után, hosszas késlekedést és számos kiszivárgást követően jutott el a felhasználókhoz...

Tudomány

csütörtök 18:31

A fák növekedés után is elnyelik a szén-dioxidot

🌲 Az évszakok változása és az egyre melegebb éghajlat régi elméleteket kérdőjelez meg az erdők szénmegkötésével kapcsolatban...

Tudomány

csütörtök 17:01

Az A-vitamin új felfedezése átírja, amit a látásról hittünk

👀 Érdemes megérteni, hogy a Johns Hopkins Egyetem kutatóinak sikerült megfejteniük, miként alakul ki az éles, központi látásunk már születésünk előtt...

A Microsoft befoltozta a Defender nulladik napi RoguePlanet-hibáját

MI Hírek

csütörtök 16:31

A Microsoft befoltozta a Defender nulladik napi RoguePlanet-hibáját

🛡 Érdemes megvizsgálni, hogy a júniusi hibajavítási hullám után egy új, napvilágot látott sebezhetőség miatt ismét frissítést kellett kiadnia a Microsoftnak...

Az NHTSA nekimegy az önvezetőknek: útban vannak a mentőknek

MI Hírek

csütörtök 16:02

Az NHTSA nekimegy az önvezetőknek: útban vannak a mentőknek

🚧 Az Egyesült Államok Közlekedésbiztonsági Hivatala most ultimátumot adott az önvezető autókat fejlesztő cégeknek: július végéig találják meg a megoldást arra, hogy a sofőr nélküli járművek ne zavarják a mentőket vészhelyzetekben...

Tudomány

csütörtök 14:31

A Linux-hiba, amivel kiszökhet a vendég VM — 250 ezer dollár a Google-tól

🚨 Noha a Linux hosszú ideje az egyik legmegbízhatóbb operációs rendszerként él a köztudatban, a közelmúltban két súlyos sebezhetőség is napvilágra került, amelyek alapjaiban rengethetik meg a felhőszolgáltatók biztonságát...

Az apró szilícium-dioxid-részecskék egerekben kiirtották az agresszív prosztatarákot

Tudomány

csütörtök 12:01

Az apró szilícium-dioxid-részecskék egerekben kiirtották az agresszív prosztatarákot

🔬 A Cornell Egyetem kutatói új típusú, mikroszkopikus szilícium-dioxid nanorészecskéket fejlesztettek ki, amelyek képesek közvetlenül elpusztítani a prosztatarákos daganatokat, miközben egyidejűleg aktiválják a szervezet immunrendszerét is a rák elleni harcra...

A Grok 4.5 már önmagában megéri az X-előfizetést?

MI Hírek

csütörtök 11:01

A Grok 4.5 már önmagában megéri az X-előfizetést?

💡 Grok 4.5 bemutatkozott, és jelentősen egyszerűsíti a bonyolult feladatok elvégzését. Kódírás, táblázatok és prezentációk készítése most egyetlen munkafolyamatba sűríthető anélkül, hogy újra és újra át kellene írni az utasításokat...