Az MI már tényleg bármit elvégez helyetted?

Az MI már tényleg bármit elvégez helyetted?
OpenAI kutatói az elmúlt években óriási lépéseket tettek annak érdekében, hogy általános célú, önállóan feladatokat végrehajtó MI-ügynököket hozzanak létre – olyan rendszereket, amelyek egyszerű utasításokra is képesek komplex számítógépes műveleteket végrehajtani, hasonlóan egy emberhez. A folyamat egyelőre messze nem ért véget, de már most bámulatos eredményeket láthatunk.

Matematikai zseni MI-k az OpenAI-nál

Hunter Lightman 2022-ben csatlakozott az OpenAI-hoz, amikor a ChatGPT hatalmas sikereket aratott, azonban ő ekkor csendben egy olyan csapattal kezdett dolgozni, amely az OpenAI MI-modelleket tanította középiskolai matematikaversenyek feladatainak megoldására. Elmondása szerint akkoriban az MI-modellek matematikai gondolkodása még ingatag lábakon állt, a cél viszont az lett, hogy ezen változtassanak. A MathGen néven ismert csapat kulcsszerepet játszott abban, hogy az OpenAI a matematikai érvelésben az iparág élére kerüljön: egyik modelljük már aranyérmet szerzett a Nemzetközi Matematikai Olimpián (International Mathematical Olympiad, IMO) is, amelyet a világ legjobb középiskolás matematikusai számára rendeznek. Az OpenAI úgy véli, hogy ezek az eredmények más területeken is hasznosítható tudáshoz vezetnek, sőt, megalapozzák azokat az MI-ügynököket, amelyeket mindig is szerettek volna létrehozni.

Az MI-ügynökök születése

Bár a ChatGPT igazi sikertörténet, eredetileg csak egy visszafogott kutatási projektből született meg, az MI-ügynökök viszont évekig tartó, tudatos munka eredményei a cégnél. Sam Altman, az OpenAI vezérigazgatója már 2023-ban arról beszélt, hogy hamarosan a felhasználók csak rábízzák a gépre, mit szeretnének, az MI pedig mindent elvégez helyettük.

Lényeges kiemelni, hogy az OpenAI új modelljeinek kiemelkedő teljesítménye miatt kutatóik a Szilícium-völgy legkeresettebb tehetségeivé váltak. Mark Zuckerberg például öt OpenAI-s kutatót csábított át a Meta szuperintelligenciával foglalkozó részlegéhez, több mint 36 milliárd forintos (100 millió USD) ajánlatokkal.

Megújult megerősítéses tanulás

Az MI-ügynökök fejlődésének egyik kulcsa a megerősítéses tanulás (reinforcement learning, RL), amely évtizedek óta ismert: a gép visszacsatolást kap a döntései helyességéről szimulált környezetekben. A Google DeepMind már 2016-ban RL segítségével alkotta meg az AlphaGo-t, amely legyőzte a go világbajnokát.

Az OpenAI munkatársa, Andrej Karpathy már a kezdetektől arra törekedett, hogy olyan MI-ügynököt hozzon létre, amely önállóan használja a számítógépet, de ehhez éveknek kellett eltelnie, mire a megfelelő modellek megszülettek. Az első nagy áttörés 2023-ban jött el: a Strawberry (eredeti nevén Q*) elhozta azt a módszert, amely az LLM-eket (nagy nyelvi modelleket), RL-t és tesztidős számítást ötvözte. Ez az MI-nek extra időt és számítási kapacitást adott a gondolkodásra, így képessé vált a hibák felismerésére, visszalépésre, vagy akár a frusztráció „megélésére” is, mintha csak ember lenne.


Az érvelési modellek skálázása

Ezekkel az új MI-érvelési modellekkel az OpenAI két jelentős skálázási tengelyt talált: egyrészt a modellek utóképzéséhez használt számítási kapacitás növelését, másrészt pedig az MI számára biztosított extra idő és erőforrás adását a válaszadáskor.

2023-ban külön Agents (Ügynökök) csapat alakult az OpenAI-n belül Daniel Selsam vezetésével. Az Agents csapat munkája végül az o1 nevű érvelési modell fejlesztésében csúcsosodott ki, amelyet az alapítók és vezető kutatók, köztük Ilya Sutskever is koordináltak. A kutatók szerint döntő jelentőségű volt, hogy az OpenAI AGI- (általános MI) fókuszú célnak köszönhetően mindig a legokosabb MI-modellek fejlesztése volt az elsődleges, még akkor is, ha ehhez jelentős erőforrásokat kellett allokálni.

Ezzel szemben a hagyományos pretraining stratégiával dolgozó laborok előbb elérték teljesítményük plafonját, és ma a MI-fejlesztés fő hajtóereje az OpenAI megoldásaihoz hasonló, érveléscentrikus modellek lettek.

Mit jelent, ha egy MI érvel?

Az MI-kutatás egyik fő célja, hogy a gépi gondolkodás minél inkább közelítsen a humán intelligenciához. Egyes kutatók ugyan óvatosan fogalmaznak abban, hogy az MI-k érvelése valóban megegyezik-e az emberi gondolkodással, de a többség inkább azt tartja fontosnak, hogy az eredmények hasznosak és látványosak legyenek. Nathan Lambert, az AI2 kutatója szerint például az MI érvelése olyan, mint a repülő “repülése” a madáréhoz képest: más mechanizmusokon alapul, de hasonló eredményekhez vezet. Ennek alapján a lényegi kérdés az MI haszna és alkalmazhatósága.

A terület vezető kutatói, köztük az OpenAI, az Anthropic és a Google DeepMind szakemberei is egyetértenek abban, hogy az MI-modellek érvelése még nem teljesen feltárt terület, további mélyreható kutatást igényel.

A következő kihívás: szubjektív feladatok

Az MI-ügynökök ma még az egyértelműen ellenőrizhető területeken, például a programkód-generálásban a leghatékonyabbak. Ilyen például az OpenAI Codex nevű rendszere, vagy az Anthropic Claude Code-ja, amelyekkel a fejlesztők valós munkafolyamatokat automatizálnak. A komplexebb, szubjektív feladatok – például online vásárlás vagy parkolóhely keresés – azonban már megakasztják a jelenlegi ügynököket: lassabbak, nem mindig tudnak pontos, emberi szempontokat is figyelembe vevő döntést hozni.

Lényeges hangsúlyozni, hogy a kutatók ezt adatproblémának tartják: a tanításhoz sokszor hiányzik a megfelelő, kevésbé ellenőrizhető feladatokra vonatkozó információ. Az OpenAI a legújabb MI-modelleknél – mint például az IMO-aranyérmet szerző rendszernél – már egyszerre több ügynököt futtat, amelyek versenyeztetik elképzeléseiket, majd kiválasztják a legjobb megoldást.

Noam Brown, az OpenAI egyik kutatója szerint ezek a modellek nemcsak matematikában, hanem más érvelési feladatokban is gyors ütemben fejlődnek, és semmi nem utal arra, hogy ez a haladás belátható időn belül lassulna.

Az MI-ügynökök jövője: készül a mindenre képes ChatGPT?

A következő nagy előrelépés az OpenAI GPT-5 modellje lehet, amely várhatóan újabb területeken nyújt majd példátlan teljesítményt, fejlesztőknek és felhasználóknak egyaránt. A cél emellett az, hogy az MI-ügynökök intuitív módon, rövid utasításokból is automatikusan felismerjék, mit vár a felhasználó, és mindig a legjobb eszközökhöz nyúljanak, anélkül, hogy a beállításokat külön kéne módosítani.

Az igazi végcél egy olyan ChatGPT-típusú MI-ügynök, amely az interneten bármilyen feladatot el tud végezni helyetted – ráadásul pontosan úgy, ahogy azt te szeretnéd. Ez azonban már sokkal több annál, mint amit a mai ChatGPT tud, de a fejlesztési irány egyértelműen ebbe tart. Az MI-piac forrong: az OpenAI mellett olyan riválisok dolgoznak a mindenre képes MI-ügynök elérésén, mint a Google, az Anthropic, az xAI vagy épp a Meta. A kérdés már nem csak az: képes lesz-e valaha az OpenAI elhozni az ügynökkorszakot, hanem az is, hogy megelőzik-e őket a versenytársak?

2025, adminboss, techcrunch.com alapján

  • Te szerinted mennyire etikus, ha egy MI teljesen önállóan dönt az emberek helyett?
  • Te mit tennél, ha egy MI hibázna egy fontos döntésben?
  • Szerinted lesznek olyan helyzetek, ahol jobb lenne, ha csak ember hozna végső döntést?


Legfrissebb posztok

MA 11:50

Az MI-alapú játéktutorialok rémálma: a Sony új szintre lép

🤓 A videojátékok tutorialjai régóta okoznak fejfájást a játékosoknak és fejlesztőknek egyaránt...

MA 11:34

Az Alphabet tarolt a Wall Streeten: MI-őrület és pénzeső

💵 Az Alphabet lehengerlő, 65%-os árfolyam-emelkedéssel zárta a 2025-ös évet, amire 2009 óta nem volt példa...

MA 11:17

Az űr pezsgője: elképesztő galaxisütközésre bukkantak

🌌 A Champagne-halmaz névre keresztelt csillagászati jelenség szilveszter éjszakáján történt felfedezése óta ejti ámulatba a szakértőket: két hatalmas galaxishalmaz ütközése mutatkozik meg benne, a képeken pedig szinte pezsgőbuborékszerű foltok formájában láthatók a felforrósodott gázok...

MA 10:57

A januári PS Plusban autóőrület, Mickey‑újrafestés és barlangi túlélés – azonnal töltsd!

Új év, új játékok: 2026 januárjában három izgalmas címmel bővül a PlayStation Plus Essential kínálata...

MA 10:49

A NASA legnagyobb könyvtára lehúzza a rolót – hová kerül a tudás?

A NASA súlyos költségmegszorítások és telephely-összevonások közepette kénytelen bezárni a legnagyobb könyvtárát, így veszélybe kerül tízezernyi történelmi és tudományos dokumentum, amelyek jelentős része még nem digitalizált...

MA 10:43

Az amerikai dollár jövője: összeomlás vagy fordulat 2026-ban?

Az idei év kifejezetten gyengén alakult a dollár számára, hiszen a valuta több mint 9 százalékot veszített értékéből a főbb devizákkal szemben – ilyen rossz évet legutóbb nyolc éve látott...

MA 10:35

Az ütköző spirálgalaxisok még soha nem voltak ilyen lélegzetelállítóak

Lenyűgöző részletességgel sikerült megörökíteni két ütköző spirálgalaxist a NASA James Webb-űrteleszkópja (James Webb Space Telescope, JWST) és a Chandra röntgenobszervatórium (Chandra X-ray Observatory) adatainak egyesítésével...

MA 10:30

Az MI 2026-ban: Már megkerülhetetlen a digitális inas

🤖 Az elmúlt év végleg átalakította az MI helyét: a kezdeti mutatványokból állandó társunk lett a mindennapokban, és az emberek már nem csupán újdonságként tekintenek rá...

MA 10:23

Az új brit dróntörvények 2026-tól mindent fenekestül felforgatnak

Érdemes megérteni, hogy az Egyesült Királyságban jelentősen átalakultak a drónokra vonatkozó szabályok, amelyek 2026...

MA 10:15

Az MI 2026-ra tényleg elveszi a munkánkat?

🤔 Egyre nagyobb a bizonytalanság a munkaerőpiacon az MI rohamos fejlődése miatt...

MA 10:10

Az év, amikor a játékosok álma valóra válik: 2026

2026 már most bombasikerű gamer évnek ígérkezik: seregnyi folytatás, új franchise, nagy visszatérő és izgalmas sztori vár mindenkire...

MA 09:57

Az ősi perui trófeafej rejtélyének kulcsa: egy ritka rendellenesség

Egy mumifikálódott fej vizsgálata új megvilágításba helyezi az andoki társadalmak hozzáállását a születési rendellenességekkel élőkhöz...

MA 09:50

A hiányzó fehérje, amely felgyorsítja immunrendszered idő előtti öregedését

Ahogyan telnek az évek, az ősz hajszálak és a gyengülő izmok mellett az immunrendszerünk is változik...

MA 09:44

Az univerzum mégis kockajáték: Bohr diadalmaskodott Einstein felett

🎲 Egy lényeges szempont, hogy a kínai tudósoknak most először sikerült megvalósítaniuk azt a híres gondolatkísérletet, amellyel Albert Einstein majdnem száz éve próbálta cáfolni Niels Bohr elméletét a kvantummechanikában...

MA 09:36

Az Nvidia H200-ért kitört a vásárlási őrület Kínában

🔥 Az Nvidia H200-as gyorsítókra sosem látott kereslet alakult ki Kínában, miután enyhítettek az amerikai exportkorlátozásokon...

MA 09:30

Az új New York-i polgármester beiktatásán száműzik a techkütyüket

🚫 A 2026-os New York-i polgármesteri beiktatáson, ahol Zohran Mamdani lép hivatalba, szigorú tiltólistát hirdettek, amelyen meglepő módon külön megnevezték a Flipper Zero-t és a Raspberry Pi-t...

MA 09:22

Az Eaton lemaradt az MI‑őrületről – most jön a nagy visszatérés?

🚀 Érdekes, hogy az MI-berobbanás éveiben szerzett lendület ellenére az Eaton részvényárfolyama 2025-ben nem tudta tartani a lépést a többi ipari óriással...

MA 09:16

A fény hajtja az arany nanorészecskéket: tisztább ammónia a végeredmény

💡 A kutatók azt vizsgálják, miként lehetne fenntarthatóbban előállítani az egyik legfontosabb ipari vegyületet, az ammóniát, amely a műtrágyák, tisztítószerek és robbanóanyagok gyártásának is alapja...

MA 09:09

Az Amazon rejtett filmes gyöngyszemei, amikről nem hallottál

🎥 Az Amazon Prime Video kínálata valóságos kincsesbánya azok számára, akik szeretik a mozifilmeket – különösen a 2011 előtti alkotásokat...