2026. 05. 08., 06:30

Az Anthropic újítása: álmodó MI-ügynökök, akik hibáikból tanulnak

Az Anthropic újítása: álmodó MI-ügynökök, akik hibáikból tanulnak
San Franciscóban zajló második Anthropic-konferencián látványos eredményekkel mutatkozott be a Claude platform legnagyszabásúbb frissítése, amelynek középpontjában egy új, „álmodás” (dreaming) nevű fejlesztés áll. Ez lehetővé teszi, hogy MI-ügynökök saját hibáikból tanuljanak, folyamatosan fejlődjenek korábban rögzített munkáik alapján, és mindezt emberi beavatkozás nélkül valósítsák meg. A vállalat szerint ezzel végre közelebb kerülünk ahhoz, hogy önjavító, folyamatosan fejlődő MI-rendszereket bízhassunk meg üzleti szinten is.

Exponenciális növekedés és valódi sikerek

Az Anthropic nemcsak új képességeket mutatott be, hanem két eddig kísérleti funkció – outcomes (eredményalapú visszacsatolás) és multi-agent orchestration (több ügynök egyidejű együttműködése) – is mostantól elérhető a nagyközönség számára. Ezek jelentősen hozzájárulnak ahhoz, hogy a fejlesztők skálázható, pontos és tanulékony MI-ügynökrendszereket tudjanak építeni.

Az első tapasztalatok figyelemre méltóak: az EvenUp nevű jogi MI-cég hatszorosára növelte a sikeres feladatmegoldások számát az álmodás bevezetése után, a Codoxo pedig az általa használt outcomes rendszer révén a felére csökkentette a dokumentumfeldolgozás idejét. A Netflix is párhuzamosan futtat már több száz naplófeldolgozási feladatot a multi-agent orchestration segítségével.

Még az Anthropic által várt tízszeres növekedés is optimistának tűnt volna, ehhez képest az idei első negyedévben már nyolcvanszoros évesített növekedés történt bevételben és használatban, a Claude-platformon az API-forgalom közel hetvenszeresére nőtt, a fejlesztők pedig átlagosan heti húsz órát dolgoznak a Claude Code-dal.

Hogyan tanul az MI saját múltjából?

A legizgalmasabb újdonság az álmodás. Ezzel a funkcióval az MI rendszeresen átvizsgálja saját korábbi munkafolyamatait, feltárja a visszatérő mintákat, hibákat és sikeres megoldásokat, majd ezekből összefoglaló „playbookokat” – használati kézikönyveket – ír a jövőbeli felhasználás számára. Az emberi ellenőrzés egyszerű marad, mert az MI nem a modelljei súlyait módosítja, hanem saját tapasztalatait strukturált jegyzetekben rögzíti, amelyekhez bárki hozzáférhet. Így a tanulási folyamat átlátható és auditálható marad, a humán felhasználó is vizsgálhatja, mire és hogyan tanult az MI.

Egy élő színpadi demóban a Claude-rendszer egy „Lumara” nevű fiktív űripari startupnak segített holdi drónleszállások automatizált optimalizálásában. Első körben nem mindegyik leszállás sikerült tökéletesen, de az álmodás funkció éjszaka átnézte az összes eddigi próbát, majd egy új playbookot generált. Ezután ezzel a kézikönyvvel már jóval magasabb arányban sikerültek a Holdra szállások.

Független értékelés: amikor az MI maga javítja munkáját

Az „outcomes” funkció lehetővé teszi, hogy a fejlesztők előre lefektessék, milyen kimenet tekinthető sikeresnek – például egy szerkezeti szempontból rendezett dokumentum vagy egy adott márkahangnemben írt szöveg. A munka befejezése után egy független „grader” (ellenőrző) ügynök, amely egy másik, érintetlen kontextusablakban dolgozik, összeveti az eredményt a kritériumokkal. Ezután konkrétan kiemeli a hibákat vagy hiányokat, és visszaadja az ügynöknek javításra – emberi kontroll nélkül, addig ismétlődve, amíg minden megfelel az elvárásoknak.

Ez a típusú rendszer már a GitHub Copilotban is működik: ott egy kisebb, olcsóbb végrehajtó modellt egy nagyobb „mentor” modell segíti ki, ha problémába ütközik. Így szinte Opus-szintű intelligenciát érhetnek el költséghatékonyan.


Több ügynök, összetettebb problémák

A multi-agent orchestration lehetővé teszi, hogy egy vezető ügynök több részfeladatra osszon egy nagyobb problémát, majd ezek mindegyikét egy-egy specialista oldja meg saját, elkülönített környezetben. Mindez valós időben nyomon követhető a Claude Console-ban, így pontosan látható, ki mit csinált, mikor és miért. Az Anthropic szerint így lényegesen jobb eredményeket lehet produkálni, mint amikor egyetlen ügynök próbál minden szálat összefogni.

A párhuzamos ügynökök fő előnye: egyedi, nagyméretű keresési vagy elemzési feladatokat gyorsan, specializáltan oldanak meg, miközben az MI maga dönti el, mikor érdemes „osztódni”.

Üzleti MI: közelebb a teljes autonómiához

Mindezt figyelembe véve látványos a fejlődés iránya: az MI-képességek exponenciálisan nőnek, míg a vállalati használat egyelőre csak lineárisan bővül. Nagy felhasználók – például a Mercado Libre 23 000 mérnökkel és már több mint félmillió ellenőrzött kódmódosítással, vagy a Canva, amely már dizájn- és adatcsapatainál is a Claude Code-ot alkalmazza – jól mutatják, mennyire megnőtt az autonóm ügynökökbe vetett bizalom.

A fejlesztés gyorsítására az Anthropic bejelentette az API-limitek duplázását, a SpaceX Colossus adatközpontjával kötött partnerséget, és új menedzselt ügynökszolgáltatások indulnak, amelyekkel a fejlesztőcsapatok tízszer gyorsabban építhetnek működő rendszereket.

Noha Dario Amodei, a vezérigazgató úgy kalkulál, hogy idén még nem születik meg az első egyszemélyes, milliárd dolláros cég, a folyamat visszafordíthatatlan: már csak néhány hónap, és lehet, hogy az MI-hez értők valóban egyedül is képesek lesznek teljes vállalatokat, sőt, egész szervezeti intelligenciát futtatni.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...

kedd 11:56

A Philips Hue új Play lámpákkal, gyertyaizzókkal és kapcsolókkal támad

Az okos izzók és fényszalagok (Lightstrip) mellett mostantól a hagyományos csillárok és retró lámpák is integrálhatók a Philips Hue rendszerébe...

kedd 11:34

A Starlink mellett veszélyesen darabokra hullott egy kínai rakéta

Egy kínai magánvállalat által fejlesztett Zhuque-2E rakéta felső fokozata a fellövés után néhány órával széthullott, mindössze néhány száz kilométerre a Föld felszínétől, ahol a Nemzetközi Űrállomás, valamint számos Starlink-műhold kering...

kedd 11:01

Az EU megnyitná az Android MI-jét, a Google szerint indokolatlan

Az Európai Unió legújabb döntése szerint a Google-nek jóval szélesebbre kell tárnia az Androidon működő MI-szolgáltatások kapuját...