Az MI már tényleg bármit elvégez helyetted?

Az MI már tényleg bármit elvégez helyetted?
OpenAI kutatói az elmúlt években óriási lépéseket tettek annak érdekében, hogy általános célú, önállóan feladatokat végrehajtó MI-ügynököket hozzanak létre – olyan rendszereket, amelyek egyszerű utasításokra is képesek komplex számítógépes műveleteket végrehajtani, hasonlóan egy emberhez. A folyamat egyelőre messze nem ért véget, de már most bámulatos eredményeket láthatunk.

Matematikai zseni MI-k az OpenAI-nál

Hunter Lightman 2022-ben csatlakozott az OpenAI-hoz, amikor a ChatGPT hatalmas sikereket aratott, azonban ő ekkor csendben egy olyan csapattal kezdett dolgozni, amely az OpenAI MI-modelleket tanította középiskolai matematikaversenyek feladatainak megoldására. Elmondása szerint akkoriban az MI-modellek matematikai gondolkodása még ingatag lábakon állt, a cél viszont az lett, hogy ezen változtassanak. A MathGen néven ismert csapat kulcsszerepet játszott abban, hogy az OpenAI a matematikai érvelésben az iparág élére kerüljön: egyik modelljük már aranyérmet szerzett a Nemzetközi Matematikai Olimpián (International Mathematical Olympiad, IMO) is, amelyet a világ legjobb középiskolás matematikusai számára rendeznek. Az OpenAI úgy véli, hogy ezek az eredmények más területeken is hasznosítható tudáshoz vezetnek, sőt, megalapozzák azokat az MI-ügynököket, amelyeket mindig is szerettek volna létrehozni.

Az MI-ügynökök születése

Bár a ChatGPT igazi sikertörténet, eredetileg csak egy visszafogott kutatási projektből született meg, az MI-ügynökök viszont évekig tartó, tudatos munka eredményei a cégnél. Sam Altman, az OpenAI vezérigazgatója már 2023-ban arról beszélt, hogy hamarosan a felhasználók csak rábízzák a gépre, mit szeretnének, az MI pedig mindent elvégez helyettük.

Lényeges kiemelni, hogy az OpenAI új modelljeinek kiemelkedő teljesítménye miatt kutatóik a Szilícium-völgy legkeresettebb tehetségeivé váltak. Mark Zuckerberg például öt OpenAI-s kutatót csábított át a Meta szuperintelligenciával foglalkozó részlegéhez, több mint 36 milliárd forintos (100 millió USD) ajánlatokkal.

Megújult megerősítéses tanulás

Az MI-ügynökök fejlődésének egyik kulcsa a megerősítéses tanulás (reinforcement learning, RL), amely évtizedek óta ismert: a gép visszacsatolást kap a döntései helyességéről szimulált környezetekben. A Google DeepMind már 2016-ban RL segítségével alkotta meg az AlphaGo-t, amely legyőzte a go világbajnokát.

Az OpenAI munkatársa, Andrej Karpathy már a kezdetektől arra törekedett, hogy olyan MI-ügynököt hozzon létre, amely önállóan használja a számítógépet, de ehhez éveknek kellett eltelnie, mire a megfelelő modellek megszülettek. Az első nagy áttörés 2023-ban jött el: a Strawberry (eredeti nevén Q*) elhozta azt a módszert, amely az LLM-eket (nagy nyelvi modelleket), RL-t és tesztidős számítást ötvözte. Ez az MI-nek extra időt és számítási kapacitást adott a gondolkodásra, így képessé vált a hibák felismerésére, visszalépésre, vagy akár a frusztráció „megélésére” is, mintha csak ember lenne.


Az érvelési modellek skálázása

Ezekkel az új MI-érvelési modellekkel az OpenAI két jelentős skálázási tengelyt talált: egyrészt a modellek utóképzéséhez használt számítási kapacitás növelését, másrészt pedig az MI számára biztosított extra idő és erőforrás adását a válaszadáskor.

2023-ban külön Agents (Ügynökök) csapat alakult az OpenAI-n belül Daniel Selsam vezetésével. Az Agents csapat munkája végül az o1 nevű érvelési modell fejlesztésében csúcsosodott ki, amelyet az alapítók és vezető kutatók, köztük Ilya Sutskever is koordináltak. A kutatók szerint döntő jelentőségű volt, hogy az OpenAI AGI- (általános MI) fókuszú célnak köszönhetően mindig a legokosabb MI-modellek fejlesztése volt az elsődleges, még akkor is, ha ehhez jelentős erőforrásokat kellett allokálni.

Ezzel szemben a hagyományos pretraining stratégiával dolgozó laborok előbb elérték teljesítményük plafonját, és ma a MI-fejlesztés fő hajtóereje az OpenAI megoldásaihoz hasonló, érveléscentrikus modellek lettek.

Mit jelent, ha egy MI érvel?

Az MI-kutatás egyik fő célja, hogy a gépi gondolkodás minél inkább közelítsen a humán intelligenciához. Egyes kutatók ugyan óvatosan fogalmaznak abban, hogy az MI-k érvelése valóban megegyezik-e az emberi gondolkodással, de a többség inkább azt tartja fontosnak, hogy az eredmények hasznosak és látványosak legyenek. Nathan Lambert, az AI2 kutatója szerint például az MI érvelése olyan, mint a repülő “repülése” a madáréhoz képest: más mechanizmusokon alapul, de hasonló eredményekhez vezet. Ennek alapján a lényegi kérdés az MI haszna és alkalmazhatósága.

A terület vezető kutatói, köztük az OpenAI, az Anthropic és a Google DeepMind szakemberei is egyetértenek abban, hogy az MI-modellek érvelése még nem teljesen feltárt terület, további mélyreható kutatást igényel.

A következő kihívás: szubjektív feladatok

Az MI-ügynökök ma még az egyértelműen ellenőrizhető területeken, például a programkód-generálásban a leghatékonyabbak. Ilyen például az OpenAI Codex nevű rendszere, vagy az Anthropic Claude Code-ja, amelyekkel a fejlesztők valós munkafolyamatokat automatizálnak. A komplexebb, szubjektív feladatok – például online vásárlás vagy parkolóhely keresés – azonban már megakasztják a jelenlegi ügynököket: lassabbak, nem mindig tudnak pontos, emberi szempontokat is figyelembe vevő döntést hozni.

Lényeges hangsúlyozni, hogy a kutatók ezt adatproblémának tartják: a tanításhoz sokszor hiányzik a megfelelő, kevésbé ellenőrizhető feladatokra vonatkozó információ. Az OpenAI a legújabb MI-modelleknél – mint például az IMO-aranyérmet szerző rendszernél – már egyszerre több ügynököt futtat, amelyek versenyeztetik elképzeléseiket, majd kiválasztják a legjobb megoldást.

Noam Brown, az OpenAI egyik kutatója szerint ezek a modellek nemcsak matematikában, hanem más érvelési feladatokban is gyors ütemben fejlődnek, és semmi nem utal arra, hogy ez a haladás belátható időn belül lassulna.

Az MI-ügynökök jövője: készül a mindenre képes ChatGPT?

A következő nagy előrelépés az OpenAI GPT-5 modellje lehet, amely várhatóan újabb területeken nyújt majd példátlan teljesítményt, fejlesztőknek és felhasználóknak egyaránt. A cél emellett az, hogy az MI-ügynökök intuitív módon, rövid utasításokból is automatikusan felismerjék, mit vár a felhasználó, és mindig a legjobb eszközökhöz nyúljanak, anélkül, hogy a beállításokat külön kéne módosítani.

Az igazi végcél egy olyan ChatGPT-típusú MI-ügynök, amely az interneten bármilyen feladatot el tud végezni helyetted – ráadásul pontosan úgy, ahogy azt te szeretnéd. Ez azonban már sokkal több annál, mint amit a mai ChatGPT tud, de a fejlesztési irány egyértelműen ebbe tart. Az MI-piac forrong: az OpenAI mellett olyan riválisok dolgoznak a mindenre képes MI-ügynök elérésén, mint a Google, az Anthropic, az xAI vagy épp a Meta. A kérdés már nem csak az: képes lesz-e valaha az OpenAI elhozni az ügynökkorszakot, hanem az is, hogy megelőzik-e őket a versenytársak?

2025, adminboss, techcrunch.com alapján

  • Te szerinted mennyire etikus, ha egy MI teljesen önállóan dönt az emberek helyett?
  • Te mit tennél, ha egy MI hibázna egy fontos döntésben?
  • Szerinted lesznek olyan helyzetek, ahol jobb lenne, ha csak ember hozna végső döntést?



Legfrissebb posztok

Az MI-kutatók fizetése már az űrversenyt is zsebből veri

MA 20:27

Az MI-kutatók fizetése már az űrversenyt is zsebből veri

Silicon Valley-ben a mesterséges intelligencia kutatók díjazása olyan szintet ért el, amit még a tudománytörténelem legnagyobb alakjai is csak irigykedve nézhetnének. Matt Deitke, a Meta új kutatója négy...

Az áttörés pillanata: így gyorsítható a zöld fordulat

MA 20:01

Az áttörés pillanata: így gyorsítható a zöld fordulat

🌱 A klímaváltozás egyre súlyosabb károkat okoz, ezért különösen fontos, hogy megtaláljuk azokat a „pozitív áttörési pontokat”, amelyek hirtelen és tartós környezeti javulást hozhatnak. Ezek az események apró lökésekkel...

A nagyseggű tengeri csillag és egyéb argentin mélytengeri furcsaságok

MA 19:51

A nagyseggű tengeri csillag és egyéb argentin mélytengeri furcsaságok

🐬 Argentína partjainál, Mar del Plata víz alatti kanyonjában különleges mélytengeri expedíció zajlik, amelynek során több mint 40 eddig ismeretlen élőlényt sikerült lencsevégre kapni. Az egyik legnagyobb sztár egy...

Az új Tesla MI: Most tényleg jön az önvezetés?

MA 19:25

Az új Tesla MI: Most tényleg jön az önvezetés?

Elon Musk bejelentette, hogy a Tesla egy jelentősen fejlesztett, teljes önvezető (Full Self-Driving, FSD) rendszert tréningez, amely akár már a következő hónap végén megérkezhet a felhasználókhoz. Az új...

Az újranyomható borosüveg forradalom átírja Oregon boriparát

MA 19:02

Az újranyomható borosüveg forradalom átírja Oregon boriparát

🍷 Oregonban egy úttörő vállalkozás, a Revino megmutatta, hogyan lehet a borosüvegek újrahasználatával fenntarthatóbbá tenni az egész borágazatot. Az elsőként újrahasználható borosüveget bevezető amerikai cég három éve indult, és...

A brit bíróság keményen odacsapott a Pfizernek

MA 18:50

A brit bíróság keményen odacsapott a Pfizernek

💥 A londoni fellebbviteli bíróság megerősítette, hogy a Pfizer és a BioNTech megsértették a Moderna egyik szabadalmát a Covid–19 vakcinájuk fejlesztése során. Az mRNS-technológiára épülő Comirnaty (Comirnaty) vakcina esetében...

Az MI-biztonság luxussá vált, a hackerek dörzsölik a kezüket

MA 18:25

Az MI-biztonság luxussá vált, a hackerek dörzsölik a kezüket

A vállalatok világszerte rohamtempóban vezetik be a mesterséges intelligenciát, de közben szinte senki sem figyel az MI-rendszerek biztonságára és megfelelő felügyeletére. Az IBM friss jelentése szerint a támadók...

Az Intel vezére alatt remeg a föld Trump miatt

MA 18:00

Az Intel vezére alatt remeg a föld Trump miatt

💥 Donald Trump felszólítására az Intel részvényei csütörtökön zuhantak: az egykori amerikai elnök azt követelte, hogy Lip-Bu Tan, a vállalat vezérigazgatója azonnal mondjon le. Indoklása szerint Tan erősen érintett...

Az újabb Dell-botrány: Kockázatban a Broadcom chipes laptopok

MA 17:50

Az újabb Dell-botrány: Kockázatban a Broadcom chipes laptopok

Több tízmillió Dell laptop van veszélyben, miután súlyos biztonsági hibákat fedeztek fel a Broadcom chipjeiben. Ezek a sebezhetőségek több mint 100 típust érintenek, olyan támadásoknak kitéve a felhasználókat,...