Az Anthropic MI-je már a fejlesztők helyett is kódol

A hétfőn bemutatott Claude Sonnet 4.5 az Anthropic legújabb MI-fejlesztése, amely új szintre emeli a kódolást: nemcsak prototípusokat tud létrehozni, hanem teljesen működő, gyártásra kész alkalmazásokat is összeállít. Ez a megbízhatóság jelentős ugrást jelent a korábbi modellekhez képest, így a Sonnet 4.5 már a nagyvállalatok igényeit is kielégíti. Az MI igénybe vehető a Claude API-n és a Claude chatbotban is, a fejlesztőknek pedig változatlan áron érhető el: egymillió input token 1 080 forint, míg ugyanennyi output token 5 400 forint.

A piac legjobbja kódolásban?

Az Anthropic MI-megoldásait már most is olyan óriások használják házon belül, mint az Apple vagy a Meta. API-hozzáférést kínálnak többek között a Cursor, Windsurf és Replit szoftverekhez is, így a cég a fejlesztői piac meghatározó szereplőjévé vált. Komoly konkurenciát jelent viszont az OpenAI o1 modellje, amely több kódolási teszten már le is körözte a Claude modelleket. Az Anthropic ennek ellenére azt állítja, hogy a Sonnet 4.5 a legjobban teljesít a HumanEval kódolási benchmarkon és hosszabb távú feladatokon.

Gyártásra kész alkalmazások, önálló MI-munka

Korai tesztek során az MI akár 30 órán keresztül is képes volt folyamatosan kódolni, miközben teljes alkalmazásokat állított össze, adatbázisokat konfigurált, domain nevet vásárolt, sőt, biztonsági auditot is végrehajtott – mindezt önállóan. A szakértők szerint ez a generáció már képes komplex, hosszabb feladatokat végigvinni anélkül, hogy elakadna vagy hibázna. A Claude Sonnet 4.5 javított a korábbi modellek őszinteségén, kevesebbszer hízeleg vagy téveszt meg, emellett kevésbé érzékeny manipulációs kísérletekre.

Új eszközök fejlesztőknek

Az új modell bemutatásával együtt elérhetővé vált a Claude Agent SDK is, amellyel a fejlesztők saját MI-ügynököket hozhatnak létre, ugyanarra az infrastruktúrára támaszkodva, mint a Claude Code. Emellett a Max előfizetők kipróbálhatják az Álmodj Claude-dal (Imagine with Claude) funkciót is, ahol valós időben, előre megírt funkciók nélkül kérhetnek szoftvert az MI-től.

Gyorsuló verseny, egyre rövidebb lemaradási idővel

Az MI-fejlesztés tempója elképesztő: a Claude Sonnet 4.5 mindössze két hónappal követte az előző, Claude 4.0 verziót. Az Anthropic és riválisai szinte negyedévente teljesen új zászlóshajókat dobnak piacra, ami lehetetlenné teszi, hogy bármelyikük sokáig jelentős előnyben maradjon.

2025, adrienne, techcrunch.com alapján

Share on Social Media