Az MI ügynökök titkos nyelve: Egymásnak üzengetnek a gépek

Ahogy a technológia egyre újabb területeket hódít meg, folyamatosan jelennek meg új szabványok és protokollok annak érdekében, hogy a különböző rendszerek együttműködhessenek. Mostanra az MI-ügynökök kommunikációja körül is kezdenek körvonalazódni a játékszabályok, köszönhetően többek között az Anthropic által bemutatott Model Context Protocolnak (MCP-nek) és a Google-féle Ügynök–ügynök (Agent-to-Agent, A2A) protokollnak.

Protokollháború helyett szabad piac

Első pillantásra úgy tűnhet, mintha visszatérnének a 80-as évek VHS–Betamax háborúi, amikor két techóriás próbálja ráerőltetni a világra a saját protokollját. Valójában azonban az MCP és az A2A eltérő problémákat oldanak meg, és a köztük lévő különbségek az MI-ügynökök meglehetősen homályos definíciójából erednek.

Mit csinálnak az MI-ügynökök?

Az MI-ügynökök alapvetően nem túl bonyolultak: van egy modell, amely értelmezi az információkat, és eldönti, mit kezdjen velük. A modell különféle „eszközöket” és funkciókat is használhat, hogy feladatokat hajtson végre vagy adatokat gyűjtsön. Például: egy naplózó ügynök rendszeresen lekérdezhet egy API-t, és ha rendellenességet talál, automatikusan hibajegyet generálhat egy emberi operátornak. A nagy techvállalatok nem is titkolják, hogy mindezzel hosszabb távon számos emberi munkakört szeretnének kiváltani.

MCP: Az univerzális csatlakozó az MI-nek

Az Anthropic MCP-je egy univerzális, nyílt protokoll arra, hogy MI-modellek könnyen kapcsolódjanak adatforrásokhoz. Legyen szó SQL-adatbázisról, Kubernetes klaszterről vagy API-ról, az MCP a JSON-RPC kommunikációra épül, amit Stdio, HTTP vagy SSE folyamatos adatátvitel valósít meg.
Fő előnye, hogy szabványosítja, miként kommunikálhatnak a modellek és eszközeik egységes módon. Ha a technológiai világban az USB-C szabvány minden töltő és adatkábel csatlakozója, akkor az MCP az MI-k USB-C-je – legalábbis az Anthropic szerint.

A2A: Az MI-ügynökök csevegője

A Google által bevezetett A2A is a JSON-RPC-t, HTTP-t és SSE-t használja, de a célja, hogy ügynökök (nem pedig modellek és eszközeik) kommunikáljanak egymással. A kapcsolatfelvétel egyfajta névjegycserével kezdődik: az ügynökök elárulják egymásnak, mire képesek, hogyan érhetők el, hogyan lehet őket hitelesíteni, valamint például tudnak-e folyamatos (streaming) adatátvitelt biztosítani, vagy milyen formátumokat fogadnak el (szöveg, kép, hang, videó).
Ezután érkezhetnek a feladatok: az egyik ügynök „megbízza” a másikat valamilyen művelettel, az pedig visszaküld egy azonosítóval ellátott státuszüzenetet, amely alapján követni lehet a folyamatot. Ha adat hiányzik, például a felhasználó e-mail címe vagy a hibajegy súlyossága, azt az ügynökök egymás között tisztázzák. A végső eredményt (legyen az szöveg, kép vagy más formátum) a megbízott ügynök küldi vissza.

Az MI-rendszerek legózása

Az A2A lényege, hogy a jövő MI-rendszerei nem egyetlen nagy ügynökből fognak állni, hanem sok kisebb, specializált ügynökből, amelyek egymással kommunikálva oldanak meg összetett feladatokat. Ezek közül sokat házon belül fejlesztenek majd, de számosat szoftvergyártók fognak szállítani. Az A2A célja, hogy ezen különböző ügynököket úgy kapcsolja össze, hogy azok nyíltan megosszák egymással képességeiket, korlátaikat és a feladat végrehajtásának állapotát.

Ki áll a protokollok mögött?

Az A2A mögött már most sorakoznak a nagyvállalati támogatók, mint az Accenture, az Arize, az Atlassian, a Workday vagy az Intuit, de ott van az Amazon, a Microsoft, a Cisco, a Salesforce, az SAP és a ServiceNow is – nemrég a Google bejelentette, hogy az A2A-t átadná a Linux Foundationnek. Az MCP is komoly támogatást élvez, de maga az MI-ügynökök világa még nagyon fiatal és folyamatosan változik. Könnyen előfordulhat, hogy hamarosan új protokollok és szabványok jelennek meg, ahogy egyre tisztábban látszik majd, pontosan hogyan is kellene kommunikálniuk egymással a gépi ügynököknek.

2025, adminboss, go.theregister.com alapján

Share on Social Media