2025. 08. 04., 09:02

Az MI már tényleg bármit elvégez helyetted?

Az MI már tényleg bármit elvégez helyetted?
OpenAI kutatói az elmúlt években óriási lépéseket tettek annak érdekében, hogy általános célú, önállóan feladatokat végrehajtó MI-ügynököket hozzanak létre – olyan rendszereket, amelyek egyszerű utasításokra is képesek komplex számítógépes műveleteket végrehajtani, hasonlóan egy emberhez. A folyamat egyelőre messze nem ért véget, de már most bámulatos eredményeket láthatunk.

Matematikai zseni MI-k az OpenAI-nál

Hunter Lightman 2022-ben csatlakozott az OpenAI-hoz, amikor a ChatGPT hatalmas sikereket aratott, azonban ő ekkor csendben egy olyan csapattal kezdett dolgozni, amely az OpenAI MI-modelleket tanította középiskolai matematikaversenyek feladatainak megoldására. Elmondása szerint akkoriban az MI-modellek matematikai gondolkodása még ingatag lábakon állt, a cél viszont az lett, hogy ezen változtassanak. A MathGen néven ismert csapat kulcsszerepet játszott abban, hogy az OpenAI a matematikai érvelésben az iparág élére kerüljön: egyik modelljük már aranyérmet szerzett a Nemzetközi Matematikai Olimpián (International Mathematical Olympiad, IMO) is, amelyet a világ legjobb középiskolás matematikusai számára rendeznek. Az OpenAI úgy véli, hogy ezek az eredmények más területeken is hasznosítható tudáshoz vezetnek, sőt, megalapozzák azokat az MI-ügynököket, amelyeket mindig is szerettek volna létrehozni.

Az MI-ügynökök születése

Bár a ChatGPT igazi sikertörténet, eredetileg csak egy visszafogott kutatási projektből született meg, az MI-ügynökök viszont évekig tartó, tudatos munka eredményei a cégnél. Sam Altman, az OpenAI vezérigazgatója már 2023-ban arról beszélt, hogy hamarosan a felhasználók csak rábízzák a gépre, mit szeretnének, az MI pedig mindent elvégez helyettük.

Lényeges kiemelni, hogy az OpenAI új modelljeinek kiemelkedő teljesítménye miatt kutatóik a Szilícium-völgy legkeresettebb tehetségeivé váltak. Mark Zuckerberg például öt OpenAI-s kutatót csábított át a Meta szuperintelligenciával foglalkozó részlegéhez, több mint 36 milliárd forintos (100 millió USD) ajánlatokkal.

Megújult megerősítéses tanulás

Az MI-ügynökök fejlődésének egyik kulcsa a megerősítéses tanulás (reinforcement learning, RL), amely évtizedek óta ismert: a gép visszacsatolást kap a döntései helyességéről szimulált környezetekben. A Google DeepMind már 2016-ban RL segítségével alkotta meg az AlphaGo-t, amely legyőzte a go világbajnokát.

Az OpenAI munkatársa, Andrej Karpathy már a kezdetektől arra törekedett, hogy olyan MI-ügynököt hozzon létre, amely önállóan használja a számítógépet, de ehhez éveknek kellett eltelnie, mire a megfelelő modellek megszülettek. Az első nagy áttörés 2023-ban jött el: a Strawberry (eredeti nevén Q*) elhozta azt a módszert, amely az LLM-eket (nagy nyelvi modelleket), RL-t és tesztidős számítást ötvözte. Ez az MI-nek extra időt és számítási kapacitást adott a gondolkodásra, így képessé vált a hibák felismerésére, visszalépésre, vagy akár a frusztráció „megélésére” is, mintha csak ember lenne.


Az érvelési modellek skálázása

Ezekkel az új MI-érvelési modellekkel az OpenAI két jelentős skálázási tengelyt talált: egyrészt a modellek utóképzéséhez használt számítási kapacitás növelését, másrészt pedig az MI számára biztosított extra idő és erőforrás adását a válaszadáskor.

2023-ban külön Agents (Ügynökök) csapat alakult az OpenAI-n belül Daniel Selsam vezetésével. Az Agents csapat munkája végül az o1 nevű érvelési modell fejlesztésében csúcsosodott ki, amelyet az alapítók és vezető kutatók, köztük Ilya Sutskever is koordináltak. A kutatók szerint döntő jelentőségű volt, hogy az OpenAI AGI- (általános MI) fókuszú célnak köszönhetően mindig a legokosabb MI-modellek fejlesztése volt az elsődleges, még akkor is, ha ehhez jelentős erőforrásokat kellett allokálni.

Ezzel szemben a hagyományos pretraining stratégiával dolgozó laborok előbb elérték teljesítményük plafonját, és ma a MI-fejlesztés fő hajtóereje az OpenAI megoldásaihoz hasonló, érveléscentrikus modellek lettek.

Mit jelent, ha egy MI érvel?

Az MI-kutatás egyik fő célja, hogy a gépi gondolkodás minél inkább közelítsen a humán intelligenciához. Egyes kutatók ugyan óvatosan fogalmaznak abban, hogy az MI-k érvelése valóban megegyezik-e az emberi gondolkodással, de a többség inkább azt tartja fontosnak, hogy az eredmények hasznosak és látványosak legyenek. Nathan Lambert, az AI2 kutatója szerint például az MI érvelése olyan, mint a repülő “repülése” a madáréhoz képest: más mechanizmusokon alapul, de hasonló eredményekhez vezet. Ennek alapján a lényegi kérdés az MI haszna és alkalmazhatósága.

A terület vezető kutatói, köztük az OpenAI, az Anthropic és a Google DeepMind szakemberei is egyetértenek abban, hogy az MI-modellek érvelése még nem teljesen feltárt terület, további mélyreható kutatást igényel.

A következő kihívás: szubjektív feladatok

Az MI-ügynökök ma még az egyértelműen ellenőrizhető területeken, például a programkód-generálásban a leghatékonyabbak. Ilyen például az OpenAI Codex nevű rendszere, vagy az Anthropic Claude Code-ja, amelyekkel a fejlesztők valós munkafolyamatokat automatizálnak. A komplexebb, szubjektív feladatok – például online vásárlás vagy parkolóhely keresés – azonban már megakasztják a jelenlegi ügynököket: lassabbak, nem mindig tudnak pontos, emberi szempontokat is figyelembe vevő döntést hozni.

Lényeges hangsúlyozni, hogy a kutatók ezt adatproblémának tartják: a tanításhoz sokszor hiányzik a megfelelő, kevésbé ellenőrizhető feladatokra vonatkozó információ. Az OpenAI a legújabb MI-modelleknél – mint például az IMO-aranyérmet szerző rendszernél – már egyszerre több ügynököt futtat, amelyek versenyeztetik elképzeléseiket, majd kiválasztják a legjobb megoldást.

Noam Brown, az OpenAI egyik kutatója szerint ezek a modellek nemcsak matematikában, hanem más érvelési feladatokban is gyors ütemben fejlődnek, és semmi nem utal arra, hogy ez a haladás belátható időn belül lassulna.

Az MI-ügynökök jövője: készül a mindenre képes ChatGPT?

A következő nagy előrelépés az OpenAI GPT-5 modellje lehet, amely várhatóan újabb területeken nyújt majd példátlan teljesítményt, fejlesztőknek és felhasználóknak egyaránt. A cél emellett az, hogy az MI-ügynökök intuitív módon, rövid utasításokból is automatikusan felismerjék, mit vár a felhasználó, és mindig a legjobb eszközökhöz nyúljanak, anélkül, hogy a beállításokat külön kéne módosítani.

Az igazi végcél egy olyan ChatGPT-típusú MI-ügynök, amely az interneten bármilyen feladatot el tud végezni helyetted – ráadásul pontosan úgy, ahogy azt te szeretnéd. Ez azonban már sokkal több annál, mint amit a mai ChatGPT tud, de a fejlesztési irány egyértelműen ebbe tart. Az MI-piac forrong: az OpenAI mellett olyan riválisok dolgoznak a mindenre képes MI-ügynök elérésén, mint a Google, az Anthropic, az xAI vagy épp a Meta. A kérdés már nem csak az: képes lesz-e valaha az OpenAI elhozni az ügynökkorszakot, hanem az is, hogy megelőzik-e őket a versenytársak?

2025, adminboss, techcrunch.com alapján

  • Te szerinted mennyire etikus, ha egy MI teljesen önállóan dönt az emberek helyett?
  • Te mit tennél, ha egy MI hibázna egy fontos döntésben?
  • Szerinted lesznek olyan helyzetek, ahol jobb lenne, ha csak ember hozna végső döntést?


Legfrissebb posztok

szerda 21:56

Az óriásbankok is ringbe szállnak az előrejelzési piacokon?

A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...

szerda 21:46

Az új csodapirula, a Foundayo, felforgatja a fogyókúrapiacot

Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...

szerda 21:26

Az űrtoalett áttörése: kényelmi forradalom a Hold felé

🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...

szerda 20:46

Az extrém időjárás már enyhe melegedésnél is könyörtelenül csap le

🌫 Felmerül a kérdés, hogy mennyire vagyunk biztonságban, ha a globális felmelegedést sikerül mérsékelt szinten tartani...

szerda 20:23

Az udvar koronázatlan királya: a Ninja Fireside360 mindent felfűt

A tavaszi esték hűvös leheletére legtöbben gyorsan visszavonulnak a négy fal közé, amikor kint elfogy a meleg...

szerda 20:12

Az iráni hekkerek imádnak hencegni, de ritkán ütnek nagyot

Képzeld el, hogy mindenki arról beszél, mennyire menők az iráni hekkerek, miközben a valóság egészen más képet mutat...

szerda 20:02

Az okosotthonod végre nem falja fel a sávszélt

Az okos otthoni biztonsági rendszered mostantól sokkal hatékonyabb lehet: a legújabb Matter 1...

szerda 19:58

A svéd iskolák visszatérnek a tankönyvekhez: újra hódít a papír

📚 Svédországban egyre inkább háttérbe szorulnak a digitális eszközök a tantermekben: a hagyományos könyvek és a kézírás ismét előtérbe kerülnek...

szerda 19:45

A Hershey visszahozza a Reese’s eredeti ízét – végre!

🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...

szerda 19:35

Az átlátható DNS, ami nem kémkedik: 1.1.1.1

Nyolc évvel ezelőtt indult útjára az 1.1.1.1 nyilvános DNS-feloldó, amelynek célja nem kevesebb volt, mint a világ leggyorsabb, a magánszférát tiszteletben tartó szolgáltatásának létrehozása...

szerda 19:23

Az új Gmail MI‑postaláda tényleg csak a gazdagoké?

Felmerül a kérdés, hogy vajon tényleg mindenkinek szüksége lenne-e a Gmail vadonatúj, MI-alapú postaládájára...

szerda 19:12

Az MI nem elveszi a munkánkat, átformálja – az Nvidia-vezér tanácsai

A fehérgalléros dolgozók közül sokan aggódnak, hogy az MI miatt veszélybe kerülhetnek a munkahelyeik...

szerda 18:57

Az ügyfélszolgálati MI: jó ötlet vagy csapnivaló élmény?

Az automatizált ügyfélszolgálat egyre több vállalatnál válik normává, ám a felhasználók sokszor frusztráló élményekről számolnak be...

szerda 18:45

A leszámolás ideje: Harry herceg hadat üzen a techóriásoknak

Washingtonban mondott beszédében Harry herceg kemény hangot ütött meg a közösségi oldalak működésével kapcsolatban, amikor elismerően szólt két friss, nagy horderejű perről, amelyek főként a gyerekek védelmét érintik...

szerda 18:34

Az álmos hajnalban kezdődik a műszak: segít az új gyógyszer?

😴 A korán kezdődő munkanapok milliók mindennapjait keserítik meg, hiszen a hajnalban kezdődő műszak biológiailag kényszerű kompromisszum: az agy ilyenkor még alvásra van programozva, a teljesítmény pedig jelentősen csökken...

szerda 18:23

A SpaceX tőzsdére készül? Rakétasebességgel a billiók felé

🚀 Elon Musk újra a figyelem középpontjában: a SpaceX titokban beadta a tőzsdei bevezetéshez szükséges papírokat az Egyesült Államok Értékpapír- és Tőzsdebizottságához...

szerda 17:56

Az MI diktál, vége a menedzserek korszakának?

Jack Dorsey, a Block alapítója és vezérigazgatója szerint a vállalatok egy új működési korszak küszöbén állnak, amelyben a középvezetői réteg szerepét nagyrészt a mesterséges intelligencia veheti át...

szerda 17:34

A Google újabb kritikus, nulladik napi rést zárt be a Chrome-ban

A Google sürgősséggel adott ki frissítést a Chrome böngészőhöz, miután felfedeztek egy negyedik, ebben az évben aktívan kihasznált nulladik napi hibát...

szerda 17:25

Az Apple öt legkeményebb kihívása fél évszázad után

Ez a jelenség jól illusztrálható azzal, hogy az Apple, amely évtizedeken át forradalmasította a technológiai világot és termékeivel új szokásokat teremtett, ma saját történetének egyik legkritikusabb szakaszához érkezett...

szerda 17:13

A vízallergia réme: kiütések minden egyes zuhany után

Egy kanadai tinédzser élete teljesen felborult, amikor szinte egyik napról a másikra testét ismeretlen eredetű csalánkiütések lepték el, valahányszor víz érte a bőrét...

szerda 17:01

Az intézményi tőke rohamot indít: jön a tokenizáció hulláma

Érdemes megvizsgálni, hogy a tokenizáció, vagyis eszközök blokklánc-alapú nyilvántartása és átruházása miért vált az utóbbi évek egyik legnagyobb kriptós hívószavává...

szerda 16:46

A gyerekek sincsenek biztonságban az MI által készített YouTube-videóktól

🚧 A gyerekek elképesztő mennyiségben néznek mesterséges intelligenciával gyártott meséket és videókat a YouTube-on...

szerda 16:02

Az MI-ügynökök támadása: védtelen SOC a célkeresztben

🛡 2026 tavaszán a világ legnagyobb kiberbiztonsági konferenciáján futótűzként terjedt egy nyugtalanító felismerés: soha nem volt még ilyen rövid az ablak, amelyen keresztül a védelmezők megállíthatják a támadásokat...

szerda 15:57

Az antibiotikum-rezisztens baktériumok Achilles-sarka: áttörés született

💉 Ilyen lehet például, amikor egy szokatlan molekulára bukkanunk egy rettegett ellenség felszínén...

szerda 15:45

Az új Fitbit-edző a ciklusodra és az étrendedre is figyel

💪 A Gemini-alapú Fitbit egészségügyi edzője mostantól még több funkcióval segíti a felhasználókat...

szerda 15:34

Az Artemis II indulhat, de az időjárás közbeszólhat

A NASA továbbra is április 1-re tervezi az Artemis II küldetés indítását, és jelenleg sem az űrhajóval, sem a csapattal kapcsolatban nincs jelentős technikai probléma...

szerda 15:24

A cseh lottómilliárdos, aki befektetéseivel megelőzte a világot

🎰 Csehországot legtöbben a Škoda, a Pilsner Urquell és Václav Havel nevével kötik össze, de most felkerült a listára egy új világmárka is...

szerda 15:13

Az óceán urai: így élték túl a tintahalak a tömeges kihalást

🐬 A tintahalak és a tintahalak rokonai, vagyis a szepiák (cuttlefish), a tengerek legelképesztőbb lényei közé tartoznak...

szerda 15:02

Az igazi milliárdos történet: Steve Jobs nem az Apple-ből lett szupergazdag

Steve Jobs neve egybeforrt az Apple-lel, az iPhone‑nal, iPaddal és iMaccal, mégis egészen másból származott az a vagyon, amely később milliárdossá tette...