
A piac legjobbja kódolásban?
Az Anthropic MI-megoldásait már most is olyan óriások használják házon belül, mint az Apple vagy a Meta. API-hozzáférést kínálnak többek között a Cursor, Windsurf és Replit szoftverekhez is, így a cég a fejlesztői piac meghatározó szereplőjévé vált. Komoly konkurenciát jelent viszont az OpenAI o1 modellje, amely több kódolási teszten már le is körözte a Claude modelleket. Az Anthropic ennek ellenére azt állítja, hogy a Sonnet 4.5 a legjobban teljesít a HumanEval kódolási benchmarkon és hosszabb távú feladatokon.
Gyártásra kész alkalmazások, önálló MI-munka
Korai tesztek során az MI akár 30 órán keresztül is képes volt folyamatosan kódolni, miközben teljes alkalmazásokat állított össze, adatbázisokat konfigurált, domain nevet vásárolt, sőt, biztonsági auditot is végrehajtott – mindezt önállóan. A szakértők szerint ez a generáció már képes komplex, hosszabb feladatokat végigvinni anélkül, hogy elakadna vagy hibázna. A Claude Sonnet 4.5 javított a korábbi modellek őszinteségén, kevesebbszer hízeleg vagy téveszt meg, emellett kevésbé érzékeny manipulációs kísérletekre.
Új eszközök fejlesztőknek
Az új modell bemutatásával együtt elérhetővé vált a Claude Agent SDK is, amellyel a fejlesztők saját MI-ügynököket hozhatnak létre, ugyanarra az infrastruktúrára támaszkodva, mint a Claude Code. Emellett a Max előfizetők kipróbálhatják az Álmodj Claude-dal (Imagine with Claude) funkciót is, ahol valós időben, előre megírt funkciók nélkül kérhetnek szoftvert az MI-től.
Gyorsuló verseny, egyre rövidebb lemaradási idővel
Az MI-fejlesztés tempója elképesztő: a Claude Sonnet 4.5 mindössze két hónappal követte az előző, Claude 4.0 verziót. Az Anthropic és riválisai szinte negyedévente teljesen új zászlóshajókat dobnak piacra, ami lehetetlenné teszi, hogy bármelyikük sokáig jelentős előnyben maradjon.