Az Anthropic bakija miatt butább lett a Claude mesterséges intelligenciája

Az elmúlt hetekben fejlesztők és MI‑nagyágyúk egyre többen panaszkodtak arra, hogy az Anthropic zászlóshajója, a Claude, elvesztette éleslátását. Sokan arról számoltak be a GitHubon, Redditen és más fórumokon, hogy a Claude már nem képes hosszú, összefüggő okfejtésekre, gyakrabban téved, sőt, feltűnően pazarolja az értékes tokeneket is. Egyre több felhasználó érezte úgy, hogy a modell már nem alkalmas mérnöki problémák megoldására, és bizalomvesztés kezdett kialakulni. Ennek ellenére a háttérben nem az MI belső súlyai változtak meg, hanem a működési környezetbe épített változtatások okozták a gondot.

Mi romlott el pontosan?

Áprilisban a fejlesztői közösség részletes technikai vizsgálatokkal bizonyította, hogy a Claude teljesítménye visszaesett. Például Stella Laurenzo, az AMD MI‑csapatának egyik vezetője, saját tapasztalatai alapján mutatta ki, mennyivel sekélyebbé vált az MI gondolkodása a korábbi használathoz képest. Adatokat is közöltek: a BridgeMind mérései szerint a Claude Opus 4.6 pontossága 83,3%-ról 68,3%-ra zuhant, és a modell a második helyről a tizedikre esett vissza. Egyesek ugyan megkérdőjelezték a tesztelés módszertanát, de a felhasználók nagy része szerint a Claude tényleg „butább” lett. Az is feltűnt, hogy a felhasználási keretek gyorsabban elfogynak, ami gyanút keltett a szándékos teljesítmény‑visszafogással kapcsolatban.

Három hiba, egy nagy baj

Az Anthropic technikai jelentése három külön termékszintű módosítást jelölt meg felelősként. Március 4‑én a Claude Code alapértelmezett gondolkodási erősségét magasról közepesre csökkentették a felhasználói felület lassulásának elkerülésére, de ezzel jelentősen visszaesett a bonyolultabb feladatoknál az MI teljesítménye. Március 26‑án egy gyorsítótárazási hiba következtében a Claude minden egyes váltásnál törölte az aktív gondolkodási folyamatát, nemcsak inaktivitás után; ez pedig a rövid távú memóriát jelentősen gyengítette. Április 16‑án a rendszerpromptra vonatkozó szólimitet (eszközhívásoknál 25 szó, a végső válaszra 100 szó) is bevezették, ami szintén visszaütött: 3%-kal rosszabb eredményt hozott a kódolási teszteken.

Vissza az alapokhoz

A hibák hatása túlnyúlt a Claude Code parancssori felhasználásán: az Agent SDK‑t és a Cowork eszközt is érintette, de az API működését nem veszélyeztette. Az Anthropic szerint a felhasználók nem azt a szintet kapták, amit elvárhattak. Ennek orvoslására visszaállították a gondolkodási paramétereket, javították a gyorsítótár‑hibát, enyhítettek a szólimiten, sőt: minden előfizetőnek újraindították a felhasználható tokenkeretet, hogy kárpótolják őket a veszteségekért.

Mit hoz a jövő?

A cég ezután szigorúbb belső tesztfolyamatokat vezet be, az összes változtatást jobban auditálja, és több cégen belüli dolgozó használja majd közvetlenül a nyilvános Claude‑verziót. Rendszeres, részletes jelentéseket ígérnek a felhasználóknak, és minden termékmódosítás hátterét, indokát nyilvánosságra hozzák a GitHubon is. Az Anthropic célja, hogy visszaszerezze a közösség bizalmát, és ne ismétlődhessen meg hasonló baklövés.

2026, adminboss, venturebeat.com alapján