Az új Claude Opus 4.1: Most tényleg tud a MI programozni?
A Claude Opus 4.1 minden fizetős felhasználó és fejlesztő számára elérhetővé vált, változatlan áron, immár az Amazon Bedrock, a Google Cloud Vertex AI rendszerében és a Claude Code felületén is. Az új verzió jelentős előrelépést hozott a MI-alapú kódolásban és adatfeldolgozásban: az Opus 4.1 már 74,5%-os pontossággal teljesíti a vezető programozási felméréseket. Ezzel a MI minden eddiginél jobb részletezőképességet és kutatási teljesítményt mutat, különösen az adatkeresés, hibajavítás és elemzés területén.
Kiemelkedő fejlődés a hibajavításban
A GitHub szerint szinte minden területen jobb lett az új Claude verzió, főleg, ha több fájlból álló programkódot kell átdolgozni. A Rakuten Group fejlesztőcsapatának tapasztalatai alapján az Opus 4.1 már képes pontos hibákat kiszúrni hatalmas kódbázisban anélkül, hogy felesleges módosításokat vezetne be, vagy új hibákat generálna – így napi szintű hibajavításra is legszívesebben ezt választanák. A Windsurf tesztjein, a kezdő fejlesztői szintet vizsgáló benchmarkon, egy teljes szórásnyit javult az Opus 4-hez képest, éppen akkora ugrást jelentve, mint amit korábban a Sonnet 3.7-ről a Sonnet 4-re váltás hozott.
Új mérési módszerek, részletes tesztek
A fejlesztők különféle tesztekkel és benchmarkokkal ellenőrizték az Opus 4.1-et, többek között a TAU-bench és SWE-bench módszertant alkalmazva. Ezeknél a teszteknél a MI-t arra ösztönözték, hogy jegyzetelje le a gondolatait, miközben több lépésben oldja meg a feladatokat, akár egy problémára 100 gondolkodási lépést is engedve. Ennek eredményeként az Opus 4 család minden tagjánál jelentősen javult a problémamegoldás pontossága anélkül, hogy bonyolultabb programkiegészítő eszközökre lett volna szükség.
A készítők azt javasolják, hogy aki teheti, váltson Opus 4.1-re, hiszen minden területen mérhető eredménnyel dolgozik, legyen szó nagy kódbázisról vagy kutatási feladatokról. Az új változat használata egyszerű: az API-n keresztül már elérhető, a megszokott formában és áron. Az okos felhasználói visszajelzések továbbra is számítanak, hogy a közeljövőben még fejlettebb MI-modell születhessen.
Április 2. tele van fordulópontokkal: Florida első európai észlelése, a Falkland-háború kirobbanása, Haile Selassie trónra lépése és nagy port kavart terrortámadások, illetve merényletek formálták a világot...
Mitchell H. Katz, a New York-i egészségügyi óriás, a NYC Health + Hospitals vezérigazgatója szerint, ha mesterséges intelligencia végezné az elsődleges radiológiai értékeléseket, jelentős összegeket lehetne megtakarítani...
A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...
Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...
🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...
🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...
Nyolc évvel ezelőtt indult útjára az 1.1.1.1 nyilvános DNS-feloldó, amelynek célja nem kevesebb volt, mint a világ leggyorsabb, a magánszférát tiszteletben tartó szolgáltatásának létrehozása...
Washingtonban mondott beszédében Harry herceg kemény hangot ütött meg a közösségi oldalak működésével kapcsolatban, amikor elismerően szólt két friss, nagy horderejű perről, amelyek főként a gyerekek védelmét érintik...
😴 A korán kezdődő munkanapok milliók mindennapjait keserítik meg, hiszen a hajnalban kezdődő műszak biológiailag kényszerű kompromisszum: az agy ilyenkor még alvásra van programozva, a teljesítmény pedig jelentősen csökken...
🚀 Elon Musk újra a figyelem középpontjában: a SpaceX titokban beadta a tőzsdei bevezetéshez szükséges papírokat az Egyesült Államok Értékpapír- és Tőzsdebizottságához...
Jack Dorsey, a Block alapítója és vezérigazgatója szerint a vállalatok egy új működési korszak küszöbén állnak, amelyben a középvezetői réteg szerepét nagyrészt a mesterséges intelligencia veheti át...
A Google sürgősséggel adott ki frissítést a Chrome böngészőhöz, miután felfedeztek egy negyedik, ebben az évben aktívan kihasznált nulladik napi hibát...
Ez a jelenség jól illusztrálható azzal, hogy az Apple, amely évtizedeken át forradalmasította a technológiai világot és termékeivel új szokásokat teremtett, ma saját történetének egyik legkritikusabb szakaszához érkezett...
Egy kanadai tinédzser élete teljesen felborult, amikor szinte egyik napról a másikra testét ismeretlen eredetű csalánkiütések lepték el, valahányszor víz érte a bőrét...
Érdemes megvizsgálni, hogy a tokenizáció, vagyis eszközök blokklánc-alapú nyilvántartása és átruházása miért vált az utóbbi évek egyik legnagyobb kriptós hívószavává...
🛡 2026 tavaszán a világ legnagyobb kiberbiztonsági konferenciáján futótűzként terjedt egy nyugtalanító felismerés: soha nem volt még ilyen rövid az ablak, amelyen keresztül a védelmezők megállíthatják a támadásokat...