2025. 09. 13., 11:26

Mostantól az MI végzi helyettünk a munkát, de biztosan ezt akarjuk?

Mostantól az MI végzi helyettünk a munkát, de biztosan ezt akarjuk?
Az OpenAI új fejlesztése, a ChatGPT ügynök jelentősen kibővíti a mesterséges intelligencia lehetőségeit: a virtuális számítógép és a beépített eszköztár révén most már nemcsak elemzéseket és adatgyűjtést tud végezni, hanem konkrét feladatokat is képes elvégezni a számítógépeden. Ez az újítás lényegesen összetettebb, többlépcsős munkafolyamatokat is képes megvalósítani emberi felügyelet mellett, amelyekről eddig az MI még csak nem is álmodott.

Mit tud a ChatGPT ügynök?

Az új MI nemcsak adatokat keres, hanem azok alapján cselekszik is. Tegyük fel, hogy szeretnéd, ha átnézné a naptáradat, összefoglalná a közelgő eseményeket, vagy rövid prezentációt készítene egy adatcsomag alapján – mindezt már megoldja. Még arra is képes, hogy egy japán reggeli hozzávalóit ne csak felsorolja, hanem meg is vásárolja azokat online (például tíz főre). Lényeges szempont, hogy a ChatGPT ügynök ezzel komplex, valós életbeli feladatokat képes végrehajtani, amelyeket elődei még nem tudtak kezelni.

Mindezek dacára akadnak kiaknázatlan területek – például a térbeli tájékozódás, útvonaltervezés terén jóval gyengébben teljesít. Hiányzik belőle a tartós emlékezet is: nem képes több interakció között következetesen emlékezni a korábbi információkra.

Kipróbált teljesítmény, összehasonlítások

Az OpenAI szerint a ChatGPT ügynök a tesztek során lényegesen pontosabb volt, mint elődei: egy szakmai kérdéseket tartalmazó teszten (MMLU) 41,6%-os pontosságot ért el a régi modellek 20,3%-ához képest. A világ legnehezebb matematikai tesztjén, a Határmatematika (FrontierMath) teszten is nagy fölénnyel verte saját korábbi verzióit és más OpenAI eszközöket. Ez a fejlettség három pilléren nyugszik: a saját böngészővel rendelkező Operator ügynökön, a deep research (mély kutatás) tömeges adatfeldolgozón, valamint a csevegőalapú ChatGPT elődein.

Ma már önállóan képes böngészni, kódot írni, fájlokat létrehozni és kezelni – persze még mindig igényel emberi felügyeletet. Nyarko, a Morgan State Egyetem professzora ugyanakkor hangsúlyozza, hogy nem szabad teljesen magára hagyni: könnyen hibázhat, téves következtetéseket vonhat le, és szükséges a beépített védelmi mechanizmusok alkalmazása.

Veszélyek, biztonsági aggályok

Az OpenAI maga is elismeri, hogy a ChatGPT ügynök biológiai és vegyi képességei magasak – ezzel akár veszélyes anyagok előállításában is segédkezhet, ha rossz kezekbe kerül. Egy MI által végzett kutatás könnyedén összekötheti a tudományos diszciplínák eredményeit, szakértői magyarázatokkal és jelentős gyorsasággal. Virtuális számítógépe révén a fájlokat, weboldalakat, űrlapokat is önállóan kezeli, ami tovább növeli a lehetséges kockázatokat adatlopás, pénzügyi csalás vagy rendszerek eltérítése terén.

Mindezeken túl új dilemma, hogy az MI ügynökök tovább erősíthetik a hibákat, torzításokat terjeszthetnek, komplexebbé teszik a felelősség kérdését, és akár pszichológiai függőséget is kialakíthatnak.


Miként reagál az OpenAI?

Az MI fokozott veszélyei miatt már számos védelmi eljárást vezettek be: kockázatelemzés, kettős felhasználás elutasításának tréningje, hibafeltáró (bug bounty) programok és szakértői biztonsági támadások (red-teaming), főként biológiai védelmi célokra. Ebből kifolyólag, bár a cég javuló óvintézkedéseket ígér, egy 2025-ös biztonsági elemzés szerint csak 33%-os pontszámot ért el a veszélykockázat-menedzsmentben, sőt, összesítésben is csak közepes (C) minősítést kapott a Jövő Élet Intézete (Future of Life Institute) értékelése alapján.

Az MI kétségkívül hegyeket tud megmozgatni, de kérdés, elbírjuk-e a hegymozgatás veszélyeit is.

2025, adminboss, www.livescience.com alapján

Legfrissebb posztok

MA 20:37

A COVID és a H1N1 két hét alatt söpört végig Amerikán

🦠 Egy új kutatás megdöbbentő sebességet tárt fel, amivel a H1N1 és a COVID-19 elterjedt az amerikai városokban...

MA 20:01

A NASA február 11-én indítja útnak a Crew-12 legénységét a Nemzetközi Űrállomásra

🚀 A Crew-12 űrhajósai február 11-én indulnak a Nemzetközi Űrállomásra, csatlakozva a fedélzeten maradt három űrutazóhoz, miután az előző missziót egészségügyi okokból lerövidítették...

MA 19:55

A BridgePay elleni zsarolóvírus-támadás országos fizetési káoszt okozott

Az egyik legnagyobb amerikai fizetésiátjáró-szolgáltató, a BridgePay ransomware-támadás áldozata lett, ami kulcsfontosságú rendszereit tette elérhetetlenné, és országos kiesést okozott...

MA 19:37

A Bitcoin 70 000 dollár alá zuhant a piaci pánik közepette

💸 A Bitcoin 60 000 dollár közeléből körülbelül 69 000 dollárra tért magához, miután gyakorlatilag visszaadta azokat a nyereségeket, amelyeket Donald Trump 2024...

MA 19:19

Az új AirTag, a Nex Playground és az MSI Prestige: a hét legizgalmasabb tesztjei

🏷️ Ebből következően érdemes megérteni, hogy február kellős közepén jócskán volt dolga az Engadget tesztelőinek...

MA 19:02

Harcosi felszereléssel temettek el angolszász gyerekeket Nagy-Britanniában

Régészek angolszász gyerekeket fedeztek fel, akiket lándzsával, pajzzsal és csatokkal temettek el – olyan felszereléssel, amely általában harcosok sírjaiban található...

MA 18:56

A telefotoextenderek az Android világ legizgalmasabb újítása

📱 Korábban minden kirándulásomra magammal vittem a megbízható Nikon DSLR fényképezőgépemet. Felejthetetlenül szép pillanatokat örökítettem meg a kit objektívvel és a 70-300 mm-es zoomobjektívvel, de mindig sajnáltam, hogy az utóbbi mennyire sok helyet foglal...

MA 18:37

A Samsung rejtett hangfunkciója, aminek minden telefonban ott kellene lennie

A modern Samsung telefonok rengeteg funkcióval vannak tele, több mint bármely más Android márka...

MA 18:18

Az új AirTag megment, ha örökké elveszíted a kulcsod

🔑 Az ADHD-val küzdők álma a második generációs AirTag. A hangosabb sípolás és a megnövelt hatótáv életmentő lehet azoknak, akik soha nem emlékeznek, hová tették a kulcsukat...

MA 17:38

A QNAP TS-h1290FX 25 gigabites szörnyet szabadít el 12 SSD-vel

Tavaly év végén bemutattuk, hogyan építettük stúdiónkat a QNAP TS-h1290FX köré...

MA 16:56

A technológiai óriások idén 217 billió forintot önthetnek mesterséges intelligenciába

🤖 A Google, az Amazon, a Microsoft és a Meta együttesen közel 217 billió forintot (700 milliárd dollárt) szánhat idén mesterségesintelligencia-fejlesztésekre...

MA 16:37

A Super Bowl rejtett veszélye: szívrohamot kaphatunk a kanapén

A nagy sporteseményekhez, mint a Super Bowl, rejtett egészségügyi kockázatok társulnak...

MA 16:21

Ezért törlik tömegesen a fiatalok a közösségi médiát – és mit csinálnak helyette

📱 A 23 éves Matt Richards ügyfélmenedzser tavaly törölte az összes közösségimédia-alkalmazást a telefonjáról, és meglepődött, amikor felfedezte, hogy az élete jobbra fordult...

MA 16:01

Gyógyítja a skizofréniát a ketogén diéta? RFK Jr. meglepő kijelentése hullámokat vert

🧠 Megvizsgálandó, hogy Robert F. Kennedy Jr., az amerikai egészségügyi és humánszolgáltatási miniszter állítása, miszerint a magas zsírtartalmú, alacsony szénhidráttartalmú étrend meggyógyíthat bizonyos pszichiátriai betegségeket, mennyire tartható...

MA 15:57

A szivacs vagy a fésűsmedúza volt az első állat? A vita nem csitul

Csaknem két évtizede dúl a vita a tudósok körében: a szivacsok vagy a fésűsmedúzák jelentették-e az első állati vonalat...

MA 15:01

A térdei árulták el: ennyi volt Lindsey Vonn számára az elit síelés ára

A 41 éves olimpiai aranyérmes síelő, Lindsey Vonn valóságos fiziológiai csoda...

MA 14:56

A napelem- és szélenergia-forradalom, amit már semmi sem állíthat meg

⚡ 2025-ben a napelem és a szélenergia először múlta felül a szenet mint globális energiaforrást...

MA 14:37

A Webb-űrteleszkóp megtalálta a valaha látott legnagyobb sötétanyag-struktúrát

A James Webb Űrteleszkóp segítségével a csillagászok feltérképezték az univerzum sötét anyagának eddigi legnagyobb szakaszát, elmélyítve ezzel a titokzatos anyag kozmikus tájat formáló szerepének megértését...

MA 14:19

Miért volt ennyire vacak a PlayStation 3D-s grafikája?

🎮 Bár gyakran egybemossuk a retro játékkonzolokat, az első 3D-s grafikai rendszerek, mint a Nintendo 64 és a Sony PlayStation, vizuálisan markánsan különböztek egymástól...

MA 14:03

A tartalomgyártók új kedvence: DJI Power 1000 V2

A korábban csak drónjairól ismert DJI mára sokkal több lett, mint egy dróngyártó...

MA 13:55

Az ősi ráncos mintázatok felkavarják az élet eredetéről alkotott képet

Lenyűgöző, több mint 180 millió éves ősi nyomokat fedeztek fel Marokkó Közép-Atlasz-hegységében, amelyek új fejezetet nyithatnak az élet eredetének kutatásában...

MA 13:19

A mesterséges intelligenciás hollywoodi filmek egymás után elhasalnak

Az utóbbi években Hollywood mindent feltett az MI-re, de látványosan pórul járt...

MA 13:02

Az a powerbank, amit nem dobsz félre: Sharge 3 az 1-ben teszt

A mindennapok egyre elengedhetetlenebb eszköze az okos, multifunkciós töltő, amely nem csupán energiával lát el, de még jól is néz ki...

MA 12:57

A féktelen MI ára: ügyvédi bakik, bírói ultimátum

Egy New York-i szövetségi bíró példátlan döntést hozott: egy ügyvéd ismételt MI-visszaélése miatt megszüntette a teljes pert...

MA 12:20

Az iPhone Fold közeleg: ezt tudjuk a hajlítható csúcsmobilról

Kérdés, mikor és milyen formában lép be az Apple a hajlítható okostelefonok világába – hiszen míg a Samsung és a Google már évekkel ezelőtt piacra dobták saját hajlítható mobiljaikat, az Apple eddig feltűnően kimaradt ebből a kategóriából...

MA 12:01

A Waymo önvezető taxijai nem állnak meg az iskolabuszok elött

Waymo önvezető taxijai komoly problémákkal küzdenek Austinban, mert rendszeresen nem állnak meg az iskolabuszoknál, amikor éppen gyerekek szállnak le vagy fel...

MA 11:55

Az európai Disney+-ról eltűnt a Dolby Vision

A Disney+ előfizetők több európai országban egy ideje hiába keresik a Dolby Vision HDR-tartalmakat, ezek ugyanis eltűntek a platformról...

MA 11:38

Az új fogyasztószerek minden eddiginél veszélyesebbek

⚠ Egyre erősebb súlycsökkentő gyógyszerek jelennek meg, amelyek a korábbi sikereket messze felülmúlhatják...

MA 11:02

Az OpenAI-nál forr a levegő: káosz, vádak, adatbotrány

Fontos kérdés, hogy miként tudja az OpenAI vezetősége kezelni az egyre erősödő kritikákat, amelyek a vállalat növekedésével párhuzamosan szaporodnak...