
Mi romlott el pontosan?
Áprilisban a fejlesztői közösség részletes technikai vizsgálatokkal bizonyította, hogy a Claude teljesítménye visszaesett. Például Stella Laurenzo, az AMD MI‑csapatának egyik vezetője, saját tapasztalatai alapján mutatta ki, mennyivel sekélyebbé vált az MI gondolkodása a korábbi használathoz képest. Adatokat is közöltek: a BridgeMind mérései szerint a Claude Opus 4.6 pontossága 83,3%-ról 68,3%-ra zuhant, és a modell a második helyről a tizedikre esett vissza. Egyesek ugyan megkérdőjelezték a tesztelés módszertanát, de a felhasználók nagy része szerint a Claude tényleg „butább” lett. Az is feltűnt, hogy a felhasználási keretek gyorsabban elfogynak, ami gyanút keltett a szándékos teljesítmény‑visszafogással kapcsolatban.
Három hiba, egy nagy baj
Az Anthropic technikai jelentése három külön termékszintű módosítást jelölt meg felelősként. Március 4‑én a Claude Code alapértelmezett gondolkodási erősségét magasról közepesre csökkentették a felhasználói felület lassulásának elkerülésére, de ezzel jelentősen visszaesett a bonyolultabb feladatoknál az MI teljesítménye. Március 26‑án egy gyorsítótárazási hiba következtében a Claude minden egyes váltásnál törölte az aktív gondolkodási folyamatát, nemcsak inaktivitás után; ez pedig a rövid távú memóriát jelentősen gyengítette. Április 16‑án a rendszerpromptra vonatkozó szólimitet (eszközhívásoknál 25 szó, a végső válaszra 100 szó) is bevezették, ami szintén visszaütött: 3%-kal rosszabb eredményt hozott a kódolási teszteken.
Vissza az alapokhoz
A hibák hatása túlnyúlt a Claude Code parancssori felhasználásán: az Agent SDK‑t és a Cowork eszközt is érintette, de az API működését nem veszélyeztette. Az Anthropic szerint a felhasználók nem azt a szintet kapták, amit elvárhattak. Ennek orvoslására visszaállították a gondolkodási paramétereket, javították a gyorsítótár‑hibát, enyhítettek a szólimiten, sőt: minden előfizetőnek újraindították a felhasználható tokenkeretet, hogy kárpótolják őket a veszteségekért.
Mit hoz a jövő?
A cég ezután szigorúbb belső tesztfolyamatokat vezet be, az összes változtatást jobban auditálja, és több cégen belüli dolgozó használja majd közvetlenül a nyilvános Claude‑verziót. Rendszeres, részletes jelentéseket ígérnek a felhasználóknak, és minden termékmódosítás hátterét, indokát nyilvánosságra hozzák a GitHubon is. Az Anthropic célja, hogy visszaszerezze a közösség bizalmát, és ne ismétlődhessen meg hasonló baklövés.
