Az új Claude Opus 4.1: Most tényleg tud a MI programozni?
A Claude Opus 4.1 minden fizetős felhasználó és fejlesztő számára elérhetővé vált, változatlan áron, immár az Amazon Bedrock, a Google Cloud Vertex AI rendszerében és a Claude Code felületén is. Az új verzió jelentős előrelépést hozott a MI-alapú kódolásban és adatfeldolgozásban: az Opus 4.1 már 74,5%-os pontossággal teljesíti a vezető programozási felméréseket. Ezzel a MI minden eddiginél jobb részletezőképességet és kutatási teljesítményt mutat, különösen az adatkeresés, hibajavítás és elemzés területén.
Kiemelkedő fejlődés a hibajavításban
A GitHub szerint szinte minden területen jobb lett az új Claude verzió, főleg, ha több fájlból álló programkódot kell átdolgozni. A Rakuten Group fejlesztőcsapatának tapasztalatai alapján az Opus 4.1 már képes pontos hibákat kiszúrni hatalmas kódbázisban anélkül, hogy felesleges módosításokat vezetne be, vagy új hibákat generálna – így napi szintű hibajavításra is legszívesebben ezt választanák. A Windsurf tesztjein, a kezdő fejlesztői szintet vizsgáló benchmarkon, egy teljes szórásnyit javult az Opus 4-hez képest, éppen akkora ugrást jelentve, mint amit korábban a Sonnet 3.7-ről a Sonnet 4-re váltás hozott.
Új mérési módszerek, részletes tesztek
A fejlesztők különféle tesztekkel és benchmarkokkal ellenőrizték az Opus 4.1-et, többek között a TAU-bench és SWE-bench módszertant alkalmazva. Ezeknél a teszteknél a MI-t arra ösztönözték, hogy jegyzetelje le a gondolatait, miközben több lépésben oldja meg a feladatokat, akár egy problémára 100 gondolkodási lépést is engedve. Ennek eredményeként az Opus 4 család minden tagjánál jelentősen javult a problémamegoldás pontossága anélkül, hogy bonyolultabb programkiegészítő eszközökre lett volna szükség.
A készítők azt javasolják, hogy aki teheti, váltson Opus 4.1-re, hiszen minden területen mérhető eredménnyel dolgozik, legyen szó nagy kódbázisról vagy kutatási feladatokról. Az új változat használata egyszerű: az API-n keresztül már elérhető, a megszokott formában és áron. Az okos felhasználói visszajelzések továbbra is számítanak, hogy a közeljövőben még fejlettebb MI-modell születhessen.
Egy tizenkilencedik századi kézirat került elő Rómában, amely igazi szenzációnak számít a nyelvészek és irodalomtudósok körében: a Trinity College Dublin kutatóinak sikerült azonosítani az egyik legkorábbi, ma ismert angol vers egyik legrégebbi változatát...
A Riválisok (Rivals) második évadának első három epizódja már elérhető a Hulu-n és a Disney+-on, viszont a rajongók csalódottan tapasztalhatják, hogy a szezon második felére idén még várni kell...
Érdemes megvizsgálni, hogy tényleg mindenáron kerülni kell-e a jojódiétát. Az évek óta tartó rettegés, miszerint az ismétlődő fogyás és visszahízás árthat az egészségnek, úgy tűnik, nem támasztható alá meggyőző tudományos bizonyítékokkal...
Egy Spanyolországban talált, 150 millió éves, elképesztően jól megmaradt sztégoszaurusz-koponya alapjaiban változtatja meg mindazt, amit eddig a dinoszauruszok fejlődéséről tudtunk...
A Kongói Demokratikus Köztársaság és Uganda területén kitört ebola-járványt vasárnap nemzetközi jelentőségű egészségügyi vészhelyzetnek minősítette az Egészségügyi Világszervezet...
A Survivor – Görögország (Survivor Greece) forgatását azonnali hatállyal leállították, miután egy fiatal versenyző, Stavros Floros életveszélyes balesetet szenvedett...
A technológiai átalakulás új korszakát éljük, ahol a fejlett algoritmusok már nemcsak támogatják, hanem egyre inkább kiváltják azokat a szakértői feladatokat, amelyekben az embereknek fejlődniük kellene...
A GameSir G8+ MFi jelentős előrelépés a mobil játékvezérlők világában, amely a G8 Galileo bevált tulajdonságait vette alapul, majd szinte minden kritikus ponton továbbfejlesztette azt...
Kételyek merültek fel, hogy a nemrég megjelent, Mixtape című történetközpontú játék hamarosan eltűnhet a digitális boltokból a zeneszámok licencproblémái miatt...
Hihetetlen, de mégis igaz, hogy az Egyesült Államokban működő adatközpontok évente annyi áramot fogyasztanak, amellyel több mint 16 millió otthon energiaigényét lehetne fedezni...
Kenya elképesztő technológiai ugrásra készült, amikor májusban bejelentették a G42 és a Microsoft közös, 1 milliárd dolláros adatközpont-beruházását...
Csak három évvel a megjelenése után végleg eltűnik a digitális boltok polcairól a LEGO 2K Gyorsulás (LEGO 2K Drive), az a nyílt világú versenyjáték, ahol saját építésű járgányaiddal száguldozhatsz...
😐 Ez a jelenség jól illusztrálható azzal, hogy ha egy alkotó bármilyen megjegyzést tesz egy legendás játék folytatásáról, az internetes rajongók azonnal az új rész bejelentését vizionálják...
Mi fűzte össze ezt a napot? Alkotmányok 📜, háborúk ⚔️ és történelmi első alkalmak 🚆 formálták a világot: Norvégia alkotmánya, a Boshin-háború lezárása, a Watergate-ügy nyilvános szenátusi meghallgatásai és az első legális azonos nemű házasságok mind ide kötődnek...
💪 Ami kezdetben ártalmatlannak tűnt, az utóbbi években jelentősen megváltozott: világszerte milliók home office-ba kényszerültek, ami alaposan átrajzolta, mit várunk el az irodabútortól...
A közelmúltban egy tengerjáró hajón történt hantavírus-kitörés miatt jelenleg mintegy 150 utast figyelnek meg, illetve akár hathetes karanténba is helyeznek...
🕵 Egy 17. századi marylandi temető különös titkot rejtett: egy mindössze nyolcéves fiú földi maradványait találták meg, aki túlnyomórészt afrikai származású volt...
Az agyunk működése mögötti titkos összetevőkre újabb fény vetült: amerikai kutatók felfedezték, hogy a tartós szorongással élőknél kimutathatóan kevesebb található egy létfontosságú agyi tápanyagból, amelyet az emberek többsége amúgy is hiányosan visz be...