Az Anthropic újítása: álmodó MI-ügynökök, akik hibáikból tanulnak

San Franciscóban zajló második Anthropic-konferencián látványos eredményekkel mutatkozott be a Claude platform legnagyszabásúbb frissítése, amelynek középpontjában egy új, „álmodás” (dreaming) nevű fejlesztés áll. Ez lehetővé teszi, hogy MI-ügynökök saját hibáikból tanuljanak, folyamatosan fejlődjenek korábban rögzített munkáik alapján, és mindezt emberi beavatkozás nélkül valósítsák meg. A vállalat szerint ezzel végre közelebb kerülünk ahhoz, hogy önjavító, folyamatosan fejlődő MI-rendszereket bízhassunk meg üzleti szinten is.

Exponenciális növekedés és valódi sikerek

Az Anthropic nemcsak új képességeket mutatott be, hanem két eddig kísérleti funkció – outcomes (eredményalapú visszacsatolás) és multi-agent orchestration (több ügynök egyidejű együttműködése) – is mostantól elérhető a nagyközönség számára. Ezek jelentősen hozzájárulnak ahhoz, hogy a fejlesztők skálázható, pontos és tanulékony MI-ügynökrendszereket tudjanak építeni.

Az első tapasztalatok figyelemre méltóak: az EvenUp nevű jogi MI-cég hatszorosára növelte a sikeres feladatmegoldások számát az álmodás bevezetése után, a Codoxo pedig az általa használt outcomes rendszer révén a felére csökkentette a dokumentumfeldolgozás idejét. A Netflix is párhuzamosan futtat már több száz naplófeldolgozási feladatot a multi-agent orchestration segítségével.

Még az Anthropic által várt tízszeres növekedés is optimistának tűnt volna, ehhez képest az idei első negyedévben már nyolcvanszoros évesített növekedés történt bevételben és használatban, a Claude-platformon az API-forgalom közel hetvenszeresére nőtt, a fejlesztők pedig átlagosan heti húsz órát dolgoznak a Claude Code-dal.

Hogyan tanul az MI saját múltjából?

A legizgalmasabb újdonság az álmodás. Ezzel a funkcióval az MI rendszeresen átvizsgálja saját korábbi munkafolyamatait, feltárja a visszatérő mintákat, hibákat és sikeres megoldásokat, majd ezekből összefoglaló „playbookokat” – használati kézikönyveket – ír a jövőbeli felhasználás számára. Az emberi ellenőrzés egyszerű marad, mert az MI nem a modelljei súlyait módosítja, hanem saját tapasztalatait strukturált jegyzetekben rögzíti, amelyekhez bárki hozzáférhet. Így a tanulási folyamat átlátható és auditálható marad, a humán felhasználó is vizsgálhatja, mire és hogyan tanult az MI.

Egy élő színpadi demóban a Claude-rendszer egy „Lumara” nevű fiktív űripari startupnak segített holdi drónleszállások automatizált optimalizálásában. Első körben nem mindegyik leszállás sikerült tökéletesen, de az álmodás funkció éjszaka átnézte az összes eddigi próbát, majd egy új playbookot generált. Ezután ezzel a kézikönyvvel már jóval magasabb arányban sikerültek a Holdra szállások.

Független értékelés: amikor az MI maga javítja munkáját

Az „outcomes” funkció lehetővé teszi, hogy a fejlesztők előre lefektessék, milyen kimenet tekinthető sikeresnek – például egy szerkezeti szempontból rendezett dokumentum vagy egy adott márkahangnemben írt szöveg. A munka befejezése után egy független „grader” (ellenőrző) ügynök, amely egy másik, érintetlen kontextusablakban dolgozik, összeveti az eredményt a kritériumokkal. Ezután konkrétan kiemeli a hibákat vagy hiányokat, és visszaadja az ügynöknek javításra – emberi kontroll nélkül, addig ismétlődve, amíg minden megfelel az elvárásoknak.

Ez a típusú rendszer már a GitHub Copilotban is működik: ott egy kisebb, olcsóbb végrehajtó modellt egy nagyobb „mentor” modell segíti ki, ha problémába ütközik. Így szinte Opus-szintű intelligenciát érhetnek el költséghatékonyan.

Több ügynök, összetettebb problémák

A multi-agent orchestration lehetővé teszi, hogy egy vezető ügynök több részfeladatra osszon egy nagyobb problémát, majd ezek mindegyikét egy-egy specialista oldja meg saját, elkülönített környezetben. Mindez valós időben nyomon követhető a Claude Console-ban, így pontosan látható, ki mit csinált, mikor és miért. Az Anthropic szerint így lényegesen jobb eredményeket lehet produkálni, mint amikor egyetlen ügynök próbál minden szálat összefogni.

A párhuzamos ügynökök fő előnye: egyedi, nagyméretű keresési vagy elemzési feladatokat gyorsan, specializáltan oldanak meg, miközben az MI maga dönti el, mikor érdemes „osztódni”.

Üzleti MI: közelebb a teljes autonómiához

Mindezt figyelembe véve látványos a fejlődés iránya: az MI-képességek exponenciálisan nőnek, míg a vállalati használat egyelőre csak lineárisan bővül. Nagy felhasználók – például a Mercado Libre 23 000 mérnökkel és már több mint félmillió ellenőrzött kódmódosítással, vagy a Canva, amely már dizájn- és adatcsapatainál is a Claude Code-ot alkalmazza – jól mutatják, mennyire megnőtt az autonóm ügynökökbe vetett bizalom.

A fejlesztés gyorsítására az Anthropic bejelentette az API-limitek duplázását, a SpaceX Colossus adatközpontjával kötött partnerséget, és új menedzselt ügynökszolgáltatások indulnak, amelyekkel a fejlesztőcsapatok tízszer gyorsabban építhetnek működő rendszereket.

Noha Dario Amodei, a vezérigazgató úgy kalkulál, hogy idén még nem születik meg az első egyszemélyes, milliárd dolláros cég, a folyamat visszafordíthatatlan: már csak néhány hónap, és lehet, hogy az MI-hez értők valóban egyedül is képesek lesznek teljes vállalatokat, sőt, egész szervezeti intelligenciát futtatni.

2026, adminboss, venturebeat.com alapján