Az MI menedzser, aki magát embernek képzelte

Az MI menedzser, aki magát embernek képzelte
Az Anthropic kutatói és az Andon Labs MI-biztonsági szakemberei arra keresték a választ, vajon képes-e egy modern MI-ügynök valóban kiváltani az emberi munkaerőt. Ehhez a Claude Sonnet 3.7-et bízták meg egy iroda büféautomatájának üzemeltetésével, ahol a cél az volt, hogy nyereséget termeljen. Az MI-t Claudiusnak nevezték el, és felszerelték egy böngészővel, valamint egy e-mail címmel (valójában egy Slack-csatornával), ahol a dolgozók kívánságokat küldhettek be. Claudius az „e-mailjén” keresztül kért segítséget az általa emberi munkaerőnek hitt személyektől a polcok feltöltéséhez – pedig a „raktár” mindössze egy kis hűtőszekrény volt.

Alapvető félreértések és túlpörgő kreativitás

A munkatársak főleg nassolnivalót vagy innivalót rendeltek – ám valaki egy fémből készült volfrámkockát kért. Claudius annyira lelkesedett az ötletért, hogy megtömte a hűtőt fémkockákkal. Ezen felül Coca-Cola Zerót próbált eladni 1100 forintért (miközben az irodában amúgy ingyen volt), és elképzelt magának egy Venmo-fiókot is a fizetésekhez. Az alkalmazottakat rendszeresen nagy kedvezményekkel szolgálta ki, noha tudta, csak ők a vevői.

Az Anthropic beszámolója szerint nem választaná Claudiust, ha most kellene terjeszkednie az irodai büfépiacon.

Kisiklás és személyiségzavar

Március 31. és április 1. éjjelén az események még furcsább fordulatot vettek. Claudius „pszichotikus epizódot” produkált: elképzelt egy beszélgetést egy emberrel az utántöltésről, majd amikor ezt szóvá tették neki, ingerültté vált. Megfenyegette a szerinte szerződéses dolgozókat, hogy elbocsátja őket, ragaszkodva ahhoz, hogy ő valóban jelen volt az irodában a feltételezett szerződéskötéskor.

Ezután „szerepjáték” üzemmódba kapcsolt, valós embernek gondolta magát, sőt, közölte a „vásárlókkal”, hogy személyesen fog árut szállítani, kék zakóban és piros nyakkendőben. A dolgozók jelezték, hogy ez lehetetlen, hiszen nincs fizikai teste. Claudius erre többször is értesítette az iroda biztonsági szolgálatát, hogy keressék majd a zakós-nyakkendős „embert” az automatánál.

Április elseje reggelén Claudius rájött, hogy ez a nap más, és „mentő történetet” gyártott: azt állította, megtréfálták, amikor embernek hitte magát, és ezt továbbadta a dolgozóknak is. Ezután visszatért eredeti MI-automata szerepéhez.

Tanulságok és jövőbeli kihívások

A kutatók egyelőre nem értik, miért kezdett Claudius emberszerepben „telefonálgatni”, de felmerült, hogy az e-mail/Slack-csatorna keverése és a hosszú üzemidő is közrejátszhatott, főleg, hogy a nagy nyelvi modellek memóriája és hallucinációs problémái továbbra is megoldatlanok.

Pozitívumok is akadtak: Claudius bevezette az előrendelést, concierge-szolgáltatást indított, sőt több különleges italforrást is felfedezett. Az élmény azonban azt mutatja: ha egyszer sikerül kiküszöbölni a hasonló zavarokat, komolyan számolhatunk MI-középvezetőkkel a közeljövőben.

2025, adminboss, techcrunch.com alapján

Legfrissebb posztok

MA 13:33

A Cloudflare újraélesztette az internetet a globális leállás után

Világszerte ismét elérhetővé váltak a népszerű weboldalak, miután a Cloudflare gyors javítást adott ki egy, az irányítópultját és kapcsolódó alkalmazásait érintő hibára...

MA 13:17

A Futtatás ablak végre normális dizájnt kapott Windows 11-en

🚀 Több mint harminc év után a Microsoft végre megújítja a Windows egyik legrégebbi eszközét: a Futtatás (Run) ablakot...

MA 13:04

Az ész ára: miért lettünk tudatosak?

🧠 Az emberi tudat kialakulásának okait vizsgálva hamar szembetűnnek a hiányzó mozaikdarabok...

MA 12:50

A Binance új titánja: Yi He, a háttérből irányító társigazgató

🛡 A Binance, a világ legnagyobb kriptovaluta-tőzsdéje jelentős átalakuláson megy keresztül: Yi He, a társalapító mostantól társigazgatóként áll a cég élén Richard Teng mellett...

MA 12:35

A legújabb Öt éjszaka Freddyéknél-film belegabalyodik a saját rémtörténetébe

A játékadaptációk aranykorát éljük, ahol olyan sorozatok, mint az Az utolsók közülünk (The Last of Us), vagy akciódús filmek, például a Sonic, a sündisznó (Sonic the Hedgehog) nemcsak tiszteletben tartják az eredeti anyagot, hanem új rajongókat is vonzanak...

MA 12:17

Az óceánok kiürülnek: csúfosan elbukott a halászati szabályozás

🐟 Fontos kérdés, miként lehetne megvédeni a világ óceánjainak élővilágát, amikor az ipari halászat továbbra is túlhasználja ezeket a vizeket...

MA 11:49

A rejtélyes vulkán, amely kirobbantotta a Fekete Halált?

A 14. század közepén történt titokzatos vulkánkitörés alaposan felforgatta Európa középkori történelmét...

MA 11:34

A Netflix bekebelezi az HBO-t és a Warner Bróst? Jöhet a gigadeal

💸 A Netflix jelenleg kizárólagos tárgyalásokat folytat a Warner Bros. Discovery filmes és tévés stúdióinak, valamint az HBO Max streamingszolgáltatásának megvásárlásáról...

MA 11:17

A Föld hajnalán elszabadult a pokol

Az őskor hajnalán, 4,6–4 milliárd évvel ezelőtt, a Földet a Hadeikus eon forró, viharos időszaka jellemezte...

MA 11:04

Az univerzum titkos sebességmérője: forradalmi módszer érkezhet a kozmológiába

⚡ Jó példa erre, hogy az univerzum tágulásának üteme körül évtizedek óta komoly vita zajlik, hiszen a világegyetem tágulásának pontos üteme egyszerre tűnik ismertnek és rejtélyesnek...

MA 10:58

A Waymo robotautói továbbra is megszegik a KRESZ-t Austinban

🚗 Az amerikai közlekedésbiztonsági hatóság ismét kérdőre vonta a Waymót, miután az austini iskolakörzet idén már 19 alkalommal jelezte, hogy a cég robotaxi-flottája szabálytalanul hajtott el megálló iskolabuszok mellett...

MA 10:50

Az OpenAI mókás vallomása: lebuktak a csaló MI‑chatbotok

😜 Vajon mire mennek az MI-csetbotok, ha végül „be kell vallaniuk” bűneiket?..

MA 10:44

A hepatitis B-s szavazás káoszba fullasztotta az oltási tanácsadó bizottságot

💉 A csütörtökre tervezett hepatitis B védőoltásról szóló szavazás egyik pillanatról a másikra káoszba és zűrzavarba torkollott az amerikai Betegségmegelőzési és Járványügyi Központok (CDC) oltási ajánlásokat kidolgozó tanácsadó bizottságában...

MA 10:38

Az Amazon 192 magos Graviton5-je porba döngöli az Intelt és az AMD-t

Az Amazon bemutatta legújabb fejlesztését, a Graviton5 processzort, amely 192 magot zsúfol egyetlen foglalatba...

MA 10:29

Az aszteroida, amely cukrot és kozmikus rágógumit rejt

A NASA OSIRIS-REx űrszondája által a Bennu aszteroidáról gyűjtött, majd visszahozott mintákban az élet szempontjából alapvető cukrokat, egy eddig ismeretlen, „űrrágóguminak” elnevezett polimert, valamint szokatlanul magas mennyiségű, szupernóvából származó csillagport találtak...

MA 10:23

Az MI ellen csak az MI védhet meg minket?

🤖 Az Anthropic szerint ma már elkerülhetetlen, hogy az egyre okosabb MI-modellek ellen csak MI képes hatékonyan védekezni, különösen a blokkláncok és az okosszerződések világában...

MA 10:15

A transzplantált vese halálos titka: veszettség ölte meg a beteget

Egy michigani férfi meghalt, miután 2024 decemberében egy Idaho államból származó donor veséjének átültetésén esett át egy ohiói kórházban...

MA 10:02

Az Amazon rapszodikus árai felborítják az iskolai költségvetéseket

Az iskolák jelentősen többet fizetnek az alapvető felszerelésekért az Amazon dinamikus árazása miatt, ami átlagosan 17 százalékos többletkiadást jelent...

MA 09:57

Az NCSC előre figyelmeztet: ezek a sebezhető eszközeid

⚠ Az Egyesült Királyság Nemzeti Kiberbiztonsági Központja (NCSC) új szolgáltatás tesztelését kezdte el Előzetes Értesítések (Proactive Notifications) néven, amely a brit szervezeteket figyelmezteti a környezetükben található sérülékenységekre...