2025. 08. 04., 09:02

Az MI már tényleg bármit elvégez helyetted?

Az MI már tényleg bármit elvégez helyetted?
OpenAI kutatói az elmúlt években óriási lépéseket tettek annak érdekében, hogy általános célú, önállóan feladatokat végrehajtó MI-ügynököket hozzanak létre – olyan rendszereket, amelyek egyszerű utasításokra is képesek komplex számítógépes műveleteket végrehajtani, hasonlóan egy emberhez. A folyamat egyelőre messze nem ért véget, de már most bámulatos eredményeket láthatunk.

Matematikai zseni MI-k az OpenAI-nál

Hunter Lightman 2022-ben csatlakozott az OpenAI-hoz, amikor a ChatGPT hatalmas sikereket aratott, azonban ő ekkor csendben egy olyan csapattal kezdett dolgozni, amely az OpenAI MI-modelleket tanította középiskolai matematikaversenyek feladatainak megoldására. Elmondása szerint akkoriban az MI-modellek matematikai gondolkodása még ingatag lábakon állt, a cél viszont az lett, hogy ezen változtassanak. A MathGen néven ismert csapat kulcsszerepet játszott abban, hogy az OpenAI a matematikai érvelésben az iparág élére kerüljön: egyik modelljük már aranyérmet szerzett a Nemzetközi Matematikai Olimpián (International Mathematical Olympiad, IMO) is, amelyet a világ legjobb középiskolás matematikusai számára rendeznek. Az OpenAI úgy véli, hogy ezek az eredmények más területeken is hasznosítható tudáshoz vezetnek, sőt, megalapozzák azokat az MI-ügynököket, amelyeket mindig is szerettek volna létrehozni.

Az MI-ügynökök születése

Bár a ChatGPT igazi sikertörténet, eredetileg csak egy visszafogott kutatási projektből született meg, az MI-ügynökök viszont évekig tartó, tudatos munka eredményei a cégnél. Sam Altman, az OpenAI vezérigazgatója már 2023-ban arról beszélt, hogy hamarosan a felhasználók csak rábízzák a gépre, mit szeretnének, az MI pedig mindent elvégez helyettük.

Lényeges kiemelni, hogy az OpenAI új modelljeinek kiemelkedő teljesítménye miatt kutatóik a Szilícium-völgy legkeresettebb tehetségeivé váltak. Mark Zuckerberg például öt OpenAI-s kutatót csábított át a Meta szuperintelligenciával foglalkozó részlegéhez, több mint 36 milliárd forintos (100 millió USD) ajánlatokkal.

Megújult megerősítéses tanulás

Az MI-ügynökök fejlődésének egyik kulcsa a megerősítéses tanulás (reinforcement learning, RL), amely évtizedek óta ismert: a gép visszacsatolást kap a döntései helyességéről szimulált környezetekben. A Google DeepMind már 2016-ban RL segítségével alkotta meg az AlphaGo-t, amely legyőzte a go világbajnokát.

Az OpenAI munkatársa, Andrej Karpathy már a kezdetektől arra törekedett, hogy olyan MI-ügynököt hozzon létre, amely önállóan használja a számítógépet, de ehhez éveknek kellett eltelnie, mire a megfelelő modellek megszülettek. Az első nagy áttörés 2023-ban jött el: a Strawberry (eredeti nevén Q*) elhozta azt a módszert, amely az LLM-eket (nagy nyelvi modelleket), RL-t és tesztidős számítást ötvözte. Ez az MI-nek extra időt és számítási kapacitást adott a gondolkodásra, így képessé vált a hibák felismerésére, visszalépésre, vagy akár a frusztráció „megélésére” is, mintha csak ember lenne.


Az érvelési modellek skálázása

Ezekkel az új MI-érvelési modellekkel az OpenAI két jelentős skálázási tengelyt talált: egyrészt a modellek utóképzéséhez használt számítási kapacitás növelését, másrészt pedig az MI számára biztosított extra idő és erőforrás adását a válaszadáskor.

2023-ban külön Agents (Ügynökök) csapat alakult az OpenAI-n belül Daniel Selsam vezetésével. Az Agents csapat munkája végül az o1 nevű érvelési modell fejlesztésében csúcsosodott ki, amelyet az alapítók és vezető kutatók, köztük Ilya Sutskever is koordináltak. A kutatók szerint döntő jelentőségű volt, hogy az OpenAI AGI- (általános MI) fókuszú célnak köszönhetően mindig a legokosabb MI-modellek fejlesztése volt az elsődleges, még akkor is, ha ehhez jelentős erőforrásokat kellett allokálni.

Ezzel szemben a hagyományos pretraining stratégiával dolgozó laborok előbb elérték teljesítményük plafonját, és ma a MI-fejlesztés fő hajtóereje az OpenAI megoldásaihoz hasonló, érveléscentrikus modellek lettek.

Mit jelent, ha egy MI érvel?

Az MI-kutatás egyik fő célja, hogy a gépi gondolkodás minél inkább közelítsen a humán intelligenciához. Egyes kutatók ugyan óvatosan fogalmaznak abban, hogy az MI-k érvelése valóban megegyezik-e az emberi gondolkodással, de a többség inkább azt tartja fontosnak, hogy az eredmények hasznosak és látványosak legyenek. Nathan Lambert, az AI2 kutatója szerint például az MI érvelése olyan, mint a repülő “repülése” a madáréhoz képest: más mechanizmusokon alapul, de hasonló eredményekhez vezet. Ennek alapján a lényegi kérdés az MI haszna és alkalmazhatósága.

A terület vezető kutatói, köztük az OpenAI, az Anthropic és a Google DeepMind szakemberei is egyetértenek abban, hogy az MI-modellek érvelése még nem teljesen feltárt terület, további mélyreható kutatást igényel.

A következő kihívás: szubjektív feladatok

Az MI-ügynökök ma még az egyértelműen ellenőrizhető területeken, például a programkód-generálásban a leghatékonyabbak. Ilyen például az OpenAI Codex nevű rendszere, vagy az Anthropic Claude Code-ja, amelyekkel a fejlesztők valós munkafolyamatokat automatizálnak. A komplexebb, szubjektív feladatok – például online vásárlás vagy parkolóhely keresés – azonban már megakasztják a jelenlegi ügynököket: lassabbak, nem mindig tudnak pontos, emberi szempontokat is figyelembe vevő döntést hozni.

Lényeges hangsúlyozni, hogy a kutatók ezt adatproblémának tartják: a tanításhoz sokszor hiányzik a megfelelő, kevésbé ellenőrizhető feladatokra vonatkozó információ. Az OpenAI a legújabb MI-modelleknél – mint például az IMO-aranyérmet szerző rendszernél – már egyszerre több ügynököt futtat, amelyek versenyeztetik elképzeléseiket, majd kiválasztják a legjobb megoldást.

Noam Brown, az OpenAI egyik kutatója szerint ezek a modellek nemcsak matematikában, hanem más érvelési feladatokban is gyors ütemben fejlődnek, és semmi nem utal arra, hogy ez a haladás belátható időn belül lassulna.

Az MI-ügynökök jövője: készül a mindenre képes ChatGPT?

A következő nagy előrelépés az OpenAI GPT-5 modellje lehet, amely várhatóan újabb területeken nyújt majd példátlan teljesítményt, fejlesztőknek és felhasználóknak egyaránt. A cél emellett az, hogy az MI-ügynökök intuitív módon, rövid utasításokból is automatikusan felismerjék, mit vár a felhasználó, és mindig a legjobb eszközökhöz nyúljanak, anélkül, hogy a beállításokat külön kéne módosítani.

Az igazi végcél egy olyan ChatGPT-típusú MI-ügynök, amely az interneten bármilyen feladatot el tud végezni helyetted – ráadásul pontosan úgy, ahogy azt te szeretnéd. Ez azonban már sokkal több annál, mint amit a mai ChatGPT tud, de a fejlesztési irány egyértelműen ebbe tart. Az MI-piac forrong: az OpenAI mellett olyan riválisok dolgoznak a mindenre képes MI-ügynök elérésén, mint a Google, az Anthropic, az xAI vagy épp a Meta. A kérdés már nem csak az: képes lesz-e valaha az OpenAI elhozni az ügynökkorszakot, hanem az is, hogy megelőzik-e őket a versenytársak?

2025, adminboss, techcrunch.com alapján

  • Te szerinted mennyire etikus, ha egy MI teljesen önállóan dönt az emberek helyett?
  • Te mit tennél, ha egy MI hibázna egy fontos döntésben?
  • Szerinted lesznek olyan helyzetek, ahol jobb lenne, ha csak ember hozna végső döntést?


Legfrissebb posztok

MA 10:29

Az üzemanyagár-horror visszatér: jön az újabb történelmi csúcs?

🚗 Az autósok Amerikában újabb, még súlyosabb üzemanyagáremelkedésre készülhetnek, ahogy az olajárak példátlan ugrást produkáltak egyik napról a másikra...

MA 10:21

A hosszú karú törpedínó átírja a mini őshüllők történetét

Különös dinoszauruszcsontváz került elő Argentínából: az Alnashetri cerropoliciensis nevű, alig 700 grammos állat megdönti a korábbi elméleteket a miniatűr, rovarevő őshüllők fejlődéséről...

MA 09:56

Az infláció hároméves csúcson Kínában – kifullad-e a lendület?

Felmerül a kérdés, mennyire változik Kínában a fogyasztói árak helyzete, miután februárban az infláció nagyobb mértékű növekedést mutatott, mint bármikor az elmúlt három évben...

MA 09:47

Az emberi agysejtek most már Doomot is játszanak

Egy ausztrál cég, a Cortical Labs, sikeresen összekötött nagyjából 200 ezer élő emberi agysejtet egy szilíciumlapkával, hogy azok elboldoguljanak a legendás Doom játékban...

MA 09:20

Az ősi élet nyomai a legváratlanabb helyen kerültek elő

Marokkó mélyén, a Közép-Atlasz hegyvonulataiban egészen különös felfedezésre bukkantak a kutatók...

MA 09:10

A mesterséges intelligencia az észak-koreai hekkerek új csodafegyvere

🛡 Érdemes megvizsgálni, hogy napjainkban az MI-ügynökök jelentősen megkönnyítik a kiberbűnözők és állami hekkerek dolgát...

MA 09:01

Az olaj kilő, a Bitcoin szakad – Mi történik?

Nem hiszem el, de a hétvégi hírek még mindig semmi békülésről nem szólnak az iráni fronton, úgyhogy az olajpiac teljesen bepörgött...

MA 08:46

A Kansas City repülőtéren: rövid pánik, aztán minden a régi

Nem mindennapi vasárnapja volt a Kansas City Nemzetközi Repülőtérnek: órákra kiürítették a terminált egy vélt fenyegetés miatt...

MA 08:37

A grafén ihlette a mágnesek új korszakát

💡 A kétdimenziós anyagok különleges elektronikai és mágneses tulajdonságaik miatt komoly figyelmet kapnak, hiszen ezek a jövő technológiáit is forradalmasíthatják...

MA 08:29

Az Einstein-féle téridő mégsem úgy hajlik, ahogy hittük?

🤔 A modern fizika két legfontosabb elméletének, a kvantumelméletnek és az általános relativitáselméletnek az összeegyeztetése régóta várat magára...

MA 08:19

A Bitcoin tovább szakad: közeleg az amerikai tőzsdepánik?

A Bitcoin ára egyelőre stabilan 67 000 dollár (kb. 24,3 millió Ft) körül mozog, miközben a világ tőzsdéin komoly eladási hullámok indultak, az olaj ára meghaladta a 100 dollárt (36 ezer Ft) hordónként, és az USA-dollár egy éve nem látott erősödést produkált...

MA 08:01

Az agyszkennelés felfedi, mit művel a ketamin a depresszióval

A depresszió világszerte az egyik vezető egészségügyi probléma, nem véletlen, hogy az érintettek mintegy 30 százaléka a hagyományos antidepresszánsokra sem reagál...

MA 07:55

Az ázsiai tőzsdéket csak részben hűti le az olajárzuhanás

📈 Dél-Koreában a Kospi index hétfő délelőtt négy napon belül másodszor aktiválta a kereskedést felfüggesztő automatizmust, amikor a piac több mint 8 százalékot zuhant, miután az olajár hordónként közel 120 dollárig (kb...

MA 07:37

A gyermekkori elhízás mögött gyakran a szülők stressze áll

👶 Miközben a gyermekkori elhízás továbbra is riasztó ütemben terjed: 2024-ben az USA-ban minden ötödik gyerek és kamasz túlsúlyos lett...

MA 07:28

Az EU odacsap: a bankoknak azonnal kártalanítaniuk kell az adathalászat áldozatait

Az Európai Unió Bíróságának főtanácsnoka, Athanasios Rantos szerint a pénzintézeteknek haladéktalanul vissza kell téríteniük azokat a számlatulajdonosokat, akik jogosulatlan tranzakciók áldozatai lettek – akkor is, ha ebben részben saját hibájuk is közrejátszott...

MA 07:19

Az univerzum dübörög: megduplázódott a fekete lyuk–neutroncsillag ütközések száma

A Laser Interferometer Gravitational-Wave Observatory (LIGO) példátlan módon először a téridő hullámain keresztül érzékelte az ütköző fekete lyukakat...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 3/9

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Castle Zombiestein – 3D FPS (iPhone/iPad)A Zombiestein egy fizikára épülő akciójáték, melynek főhőse Yuri “Tarzan” Agron, az orosz Spetsnaz elit katonája...

MA 07:10

A nagy óceántakarítás: tényleg ez menti meg a klímát?

Bekeményítettünk a klímaváltozással szemben, de úgy néz ki, még mindig szorít a sarok, amibe magunkat festettük...

MA 07:01

A következő nagy dobás: 3D-nyomtatott iPhone és Apple Watch?

Na most kapaszkodj, mert az Apple tényleg azon dolgozik, hogy alumíniumból 3D-nyomtatott iPhone-okkal és Apple Watch-okkal hódítsa meg a világot...

MA 06:55

Az Apple megnyitja az Ultra-korszakot: jönnek a csúcskütyük

Úgy tűnik, az olcsó MacBook rövid időre lekerült a színről, mert az Apple most visszatér a luxuskategóriához...

MA 06:46

Az óraátállítás kicsinál: így éld túl

🕑 Minden márciusban sokan tapasztalják meg, milyen, ha az óraátállítás miatt kevesebbet alszanak éjszaka...

MA 06:37

Az örök adattárolás kulcsa: hódít a DNS‑merevlemez

🔑 A Missouri Egyetem kutatói áttörést jelentettek be: egy olyan DNS-alapú tárolót fejlesztettek, amelyet újra és újra lehet törölni és felülírni, ráadásul az adatok akár több száz évig is megőrizhetők benne...

MA 06:06

Történelmi események a mai napon (Március 9.)

Mi történt ezen a napon a történelemben? Erős nap ez a történelemben: a tokiói éjszakai gyújtóbombázás pusztítása, Brazília felfedezésének kezdete és a Francia Idegenlégió megalapítása mind ide köthető...

vasárnap 18:03

Az új csalási hullám: .arpa DNS és IPv6 a célkeresztben

🔴 Az internetes bűnözők egyre kifinomultabb módszerekkel igyekeznek megkerülni a hagyományos adathalászat elleni védelmeket: most az ...

vasárnap 17:39

Az OpenAI hardverigazgatója lemondott a Védelmi Minisztériummal kötött szerződés miatt

Caitlin Kalinowski, az OpenAI robotikai részlegének hardverért felelős vezetője benyújtotta lemondását, miután a vállalat sietve szerződést kötött az amerikai Védelmi Minisztériummal...

vasárnap 17:21

A mesterséges intelligencia felforgatja a kibertámadásokat minden szinten

💻 A kiberbűnözők soha nem voltak ilyen leleményesek: egyre kifinomultabb módszerekkel vetik be a mesterséges intelligenciát, hogy felgyorsítsák a támadások előkészítését, növeljék támadásaik hatékonyságát, és lecsökkentsék a szükséges technikai tudás szintjét...

vasárnap 17:02

Az amerikai kriptotörvény körül elszabadultak az indulatok

Kérdés, hogy a digitális eszközök piacát szabályozó új törvény, a Clarity Act valóban az áttörés küszöbén áll-e a szenátusban...

vasárnap 16:58

A kellemetlen igazság a hibrid autókról: nem az, aminek látszik

⚠ Hibrid autók – mindenki imádja őket, legalábbis amíg rá nem jön, mennyire illúzió az egész, ha a tulajok fele lusta töltőre dugni őket...

vasárnap 16:42

Az autóporszívók nagy csatája: négy bajnok, váratlan győztes

Megvizsgáltuk, mennyit számít az ár, a márkanév vagy a dizájn, ha a kocsi belseje tisztaságáról van szó...