2025. 09. 13., 11:26

Mostantól az MI végzi helyettünk a munkát, de biztosan ezt akarjuk?

Mostantól az MI végzi helyettünk a munkát, de biztosan ezt akarjuk?
Az OpenAI új fejlesztése, a ChatGPT ügynök jelentősen kibővíti a mesterséges intelligencia lehetőségeit: a virtuális számítógép és a beépített eszköztár révén most már nemcsak elemzéseket és adatgyűjtést tud végezni, hanem konkrét feladatokat is képes elvégezni a számítógépeden. Ez az újítás lényegesen összetettebb, többlépcsős munkafolyamatokat is képes megvalósítani emberi felügyelet mellett, amelyekről eddig az MI még csak nem is álmodott.

Mit tud a ChatGPT ügynök?

Az új MI nemcsak adatokat keres, hanem azok alapján cselekszik is. Tegyük fel, hogy szeretnéd, ha átnézné a naptáradat, összefoglalná a közelgő eseményeket, vagy rövid prezentációt készítene egy adatcsomag alapján – mindezt már megoldja. Még arra is képes, hogy egy japán reggeli hozzávalóit ne csak felsorolja, hanem meg is vásárolja azokat online (például tíz főre). Lényeges szempont, hogy a ChatGPT ügynök ezzel komplex, valós életbeli feladatokat képes végrehajtani, amelyeket elődei még nem tudtak kezelni.

Mindezek dacára akadnak kiaknázatlan területek – például a térbeli tájékozódás, útvonaltervezés terén jóval gyengébben teljesít. Hiányzik belőle a tartós emlékezet is: nem képes több interakció között következetesen emlékezni a korábbi információkra.

Kipróbált teljesítmény, összehasonlítások

Az OpenAI szerint a ChatGPT ügynök a tesztek során lényegesen pontosabb volt, mint elődei: egy szakmai kérdéseket tartalmazó teszten (MMLU) 41,6%-os pontosságot ért el a régi modellek 20,3%-ához képest. A világ legnehezebb matematikai tesztjén, a Határmatematika (FrontierMath) teszten is nagy fölénnyel verte saját korábbi verzióit és más OpenAI eszközöket. Ez a fejlettség három pilléren nyugszik: a saját böngészővel rendelkező Operator ügynökön, a deep research (mély kutatás) tömeges adatfeldolgozón, valamint a csevegőalapú ChatGPT elődein.

Ma már önállóan képes böngészni, kódot írni, fájlokat létrehozni és kezelni – persze még mindig igényel emberi felügyeletet. Nyarko, a Morgan State Egyetem professzora ugyanakkor hangsúlyozza, hogy nem szabad teljesen magára hagyni: könnyen hibázhat, téves következtetéseket vonhat le, és szükséges a beépített védelmi mechanizmusok alkalmazása.

Veszélyek, biztonsági aggályok

Az OpenAI maga is elismeri, hogy a ChatGPT ügynök biológiai és vegyi képességei magasak – ezzel akár veszélyes anyagok előállításában is segédkezhet, ha rossz kezekbe kerül. Egy MI által végzett kutatás könnyedén összekötheti a tudományos diszciplínák eredményeit, szakértői magyarázatokkal és jelentős gyorsasággal. Virtuális számítógépe révén a fájlokat, weboldalakat, űrlapokat is önállóan kezeli, ami tovább növeli a lehetséges kockázatokat adatlopás, pénzügyi csalás vagy rendszerek eltérítése terén.

Mindezeken túl új dilemma, hogy az MI ügynökök tovább erősíthetik a hibákat, torzításokat terjeszthetnek, komplexebbé teszik a felelősség kérdését, és akár pszichológiai függőséget is kialakíthatnak.


Miként reagál az OpenAI?

Az MI fokozott veszélyei miatt már számos védelmi eljárást vezettek be: kockázatelemzés, kettős felhasználás elutasításának tréningje, hibafeltáró (bug bounty) programok és szakértői biztonsági támadások (red-teaming), főként biológiai védelmi célokra. Ebből kifolyólag, bár a cég javuló óvintézkedéseket ígér, egy 2025-ös biztonsági elemzés szerint csak 33%-os pontszámot ért el a veszélykockázat-menedzsmentben, sőt, összesítésben is csak közepes (C) minősítést kapott a Jövő Élet Intézete (Future of Life Institute) értékelése alapján.

Az MI kétségkívül hegyeket tud megmozgatni, de kérdés, elbírjuk-e a hegymozgatás veszélyeit is.

2025, adminboss, www.livescience.com alapján

Legfrissebb posztok

MA 13:45

Az Uber robotaxijai megrohanják Horvátországot – kínai technikával

Zágráb utcáira érkezik az Uber és a kínai Pony.ai közös robotaxi-szolgáltatása, amelyet egy horvát cég, a Verne fog össze – ők gondoskodnak a teljes működési rendszer kiépítéséről...

MA 13:23

Az Exynos 2800: végre tanult a hibáiból a Samsung?

Érdemes megvizsgálni, milyen változások várhatók a Samsung következő generációs mobilchipjénél. Az Exynos 2800 koncepciója mostanra körvonalazódik, és úgy tűnik, a vállalat ezúttal a stabilitást helyezi előtérbe a Galaxy S28 szériánál...

MA 12:01

Az új PolyShell-támadás a Magento-áruházak felét fenyegeti

Fontos megérteni, hogy az utóbbi napokban tömeges támadássorozat indult a Magento Open Source és az Adobe Commerce rendszereket érintő, súlyos PolyShell-sebezhetőség kihasználására...

MA 11:56

Az MI megeszi az adatközpontok akkumulátorait – új korszakot nyit a Panasonic

A nagy memóriagyártók már minden idei moduljukat eladták, így hiányok és áremelkedések alakultak ki a piacon...

MA 11:45

Az új Razer Blade 16: karcsú, brutális és piszkosul drága

A Razer legújabb, 16 hüvelykes laptopja látványos hardverfrissítéssel érkezik: az Intel vadonatúj Core Ultra lapkáival és ultragyors, 9600 MHz-es LPDDR5X memóriával kapható, legalább 32 GB-tal szerelve...

MA 11:34

Az új Galaxy A57 végre könnyebben javítható

🔧 A Samsung Galaxy A57 5G-t már a bemutató előtt, néhány órával szét is szedték, és ami a leginkább feltűnő: a telefont végre a könnyű javíthatóság jegyében tervezték...

MA 11:12

A techóriások pórul jártak: kétmilliárdos bírság a közösségi oldalaknak

💸 Egy amerikai esküdtszék történelmi döntése értelmében a Meta és a YouTube összesen 6 millió dollár (közel 2,2 milliárd forint) kártérítést köteles fizetni egy ma 20 éves fiatal nőnek és édesanyjának...

MA 11:02

Az elektronikus hadviselés felforgatta a Perzsa-öböl rendjét

A Perzsa-öböl térségében az utóbbi hetekben a helymeghatározó rendszerek zavarása szinte mindennapossá vált...

MA 10:58

Az Intel új Arc Pro kártyái forradalmat hoznak a munkaállomások piacán

Az Intel most masszív lendületet ad az Arc B-sorozatú videokártyáinak, két új modellel: megérkezett az Arc Pro B70 és az Arc Pro B65...

MA 10:51

Az amerikai Hold-állomásról indul az atommeghajtású Mars-küldetés

🚀 Érdekes felvetés, hogy mi lesz a sorsa annak a több milliárd dollárért fejlesztett Hold körüli űrállomásnak, amelynek építését az Egyesült Államok most jegeli, hogy az erőforrásokat inkább más, nagyobb szabású célokra összpontosítsa...

MA 10:43

A Ring új videócsengői végre vezeték nélküliek és 4K-sak

A Ring új szintre emelte kültéri biztonsági eszközeit: elérhetővé váltak a vezeték nélküli, akkumulátoros verziók a 4K-s és 2K-s felbontású videócsengőkből is, már 29 000 Ft-tól...

MA 10:36

Az Insta nem játék: a nagyok rászoktatták, 3 millió dollárt kaszált

💸 A kaliforniai bíróság most tényleg odacsapott: két techóriást, a Metát és a Google-t is felelőssé tették, amiért addiktív dizájnnal szippantották be a fiatalokat...

MA 10:29

Az X kriptóvezért igazolt a pénzügyi áttöréshez

Különösen igaz ez akkor, ha a közösségi médiaóriások pénzügyi szolgáltatások irányába terjeszkednek...

MA 09:57

A rendőrség új szuperdrónja Starlinket is cipel

A dróntechnológia új korszakába lépett, amikor a BRINC bemutatta legújabb fejlesztését, a Guardian nevű, kifejezetten rendőrségi célokra szánt drónt...

MA 09:29

Az éber álom lehet a pihentető alvás titka?

😴 Éjszaka nemcsak testünk pihen, agyunk is különös utakat jár be. Egy friss kutatás szerint ugyanis a színes, élénk álmok nem csupán szórakoztatnak, hanem hozzájárulhatnak ahhoz is, hogy reggel valóban kipihentnek érezzük magunkat — sőt, az intenzív álmodás azoknak az éjszakáknak a titka, amikor a legmélyebbnek érezzük az alvást, függetlenül attól, mennyire aktív maradt közben az...

MA 09:16

A nagy leleplezés: mit naplóz rólad valójában a VPN-ed?

👀 Fontos kérdés, hogy mennyi adatot gyűjt rólad egy VPN, miközben elvileg éppen azt ígéri, hogy megvédi a magánszférádat...

MA 09:08

Az űrtávcsövek lélegzetelállító fotókon tárják fel a Szaturnuszt

🛰 A NASA frissen közzétett képei segítségével a Szaturnusz eddig soha nem látott részletességben tárul elénk...

MA 08:50

Az Apple lehagyhatja a Samsungot a 200 megapixeles iPhone-kamerával

Az Apple évek óta kivár a mobilkamerák terén, de most végre felrázhatja a piacot: tesztelés alatt áll egy 200 megapixeles főkamera, amely nagyobb lehet, mint a Samsung Galaxy S26 Ultra 200 megapixeles érzékelője...

MA 08:43

Az igazság ára: egy volt NASA-klímakutató megrázó vallomása

💬 Fontos kérdés, hogy mi történik akkor, amikor a tudományos élet válságba kerül, és azok is távoznak, akik egyszer a kutatás iránti elkötelezettséget mindennél előbbre valónak tartották...

MA 08:36

Az új trükk: virtuális telefonokkal csapnak le a csalók

Ilyen eset például, amikor a csalók nem valódi telefonokat, hanem virtuális okostelefonokat használnak, hogy teljesen hiteles felhasználónak tűnjenek...

MA 08:29

Az új, rettegett vírus lecsap a kriptopénzedre, és ellopja a jelszavaidat

Egy új, folyamatosan fejlődő kártevő, a Torg Grabber már 850 böngészőbővítményből képes érzékeny adatokat ellopni, ebből 728 kifejezetten kriptopénztárcákhoz kapcsolódik...

MA 07:57

Az új tömegspektrométer egyszerre milliárdnyi molekula titkát fedi fel

🔬 Az elmúlt évtizedekben a tömegspektrometria alapvető eszközzé vált a tudományos kutatásban, ám a technika egyik legnagyobb korlátja, hogy a legtöbb jelenleg használt műszer egyszerre csak néhány molekulát képes elemezni...

MA 07:50

Az MI‑ellátási lánc új réme: hamis papírral is támadnak

🛑 A szoftverellátási lánc sebezhetőségei eddig főként kártevők és zsarolóvírusok révén kerültek be a köztudatba, azonban most egy lényegesen egyszerűbb módszer is elérhetővé vált a támadóknak: rosszindulatú vagy hamisított API-dokumentációval is megvezethetők az MI-alapú kódoló ügynökök...

MA 07:36

Az amerikai tél halálos ára: évente 40 ezer infarktus

Az USA-ban a zimankós hónapok alatt ugrásszerűen megnő a szív- és érrendszeri halálozások száma...

MA 07:22

Az MI-s Bubble-alkalmazások új húzása: tömeges Microsoft-fióklopás

A bűnözők legújabb trükkje, hogy a Bubble nevű, no-code, MI-alapú alkalmazáskészítő platformot használják Microsoft-fiókok elleni adathalász támadásokhoz...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:08

A Reddit az emberekért küzd: jön az emberazonosítás

👤 A Reddit új lépést tett a gyanús aktivitás kiszűrésére: hamarosan arra kötelezi azokat a fiókokat, amelyek automatizált vagy egyébként gépies viselkedést mutatnak, hogy igazolják, valóban ember kezeli őket...

MA 07:01

A mesterséges intelligencia már a GitHub védőernyője alatt működik

A GitHub mostantól mesterséges intelligenciát vet be hibák és sebezhetőségek felderítésére, ezzel jóval szélesebb biztonsági lefedettséget ígér...

MA 06:50

A rejtélyes új-zélandi barlang felfedi a múlt titkait

🗿 Egy váratlanul gazdag lelet került elő egy észak-új-zélandi barlang mélyéből: mintegy egymillió éves fosszíliák, amelyek között tucatnyi madárfaj és négy különböző béka is szerepel...