2025. 08. 04., 09:02

Az MI már tényleg bármit elvégez helyetted?

Az MI már tényleg bármit elvégez helyetted?
OpenAI kutatói az elmúlt években óriási lépéseket tettek annak érdekében, hogy általános célú, önállóan feladatokat végrehajtó MI-ügynököket hozzanak létre – olyan rendszereket, amelyek egyszerű utasításokra is képesek komplex számítógépes műveleteket végrehajtani, hasonlóan egy emberhez. A folyamat egyelőre messze nem ért véget, de már most bámulatos eredményeket láthatunk.

Matematikai zseni MI-k az OpenAI-nál

Hunter Lightman 2022-ben csatlakozott az OpenAI-hoz, amikor a ChatGPT hatalmas sikereket aratott, azonban ő ekkor csendben egy olyan csapattal kezdett dolgozni, amely az OpenAI MI-modelleket tanította középiskolai matematikaversenyek feladatainak megoldására. Elmondása szerint akkoriban az MI-modellek matematikai gondolkodása még ingatag lábakon állt, a cél viszont az lett, hogy ezen változtassanak. A MathGen néven ismert csapat kulcsszerepet játszott abban, hogy az OpenAI a matematikai érvelésben az iparág élére kerüljön: egyik modelljük már aranyérmet szerzett a Nemzetközi Matematikai Olimpián (International Mathematical Olympiad, IMO) is, amelyet a világ legjobb középiskolás matematikusai számára rendeznek. Az OpenAI úgy véli, hogy ezek az eredmények más területeken is hasznosítható tudáshoz vezetnek, sőt, megalapozzák azokat az MI-ügynököket, amelyeket mindig is szerettek volna létrehozni.

Az MI-ügynökök születése

Bár a ChatGPT igazi sikertörténet, eredetileg csak egy visszafogott kutatási projektből született meg, az MI-ügynökök viszont évekig tartó, tudatos munka eredményei a cégnél. Sam Altman, az OpenAI vezérigazgatója már 2023-ban arról beszélt, hogy hamarosan a felhasználók csak rábízzák a gépre, mit szeretnének, az MI pedig mindent elvégez helyettük.

Lényeges kiemelni, hogy az OpenAI új modelljeinek kiemelkedő teljesítménye miatt kutatóik a Szilícium-völgy legkeresettebb tehetségeivé váltak. Mark Zuckerberg például öt OpenAI-s kutatót csábított át a Meta szuperintelligenciával foglalkozó részlegéhez, több mint 36 milliárd forintos (100 millió USD) ajánlatokkal.

Megújult megerősítéses tanulás

Az MI-ügynökök fejlődésének egyik kulcsa a megerősítéses tanulás (reinforcement learning, RL), amely évtizedek óta ismert: a gép visszacsatolást kap a döntései helyességéről szimulált környezetekben. A Google DeepMind már 2016-ban RL segítségével alkotta meg az AlphaGo-t, amely legyőzte a go világbajnokát.

Az OpenAI munkatársa, Andrej Karpathy már a kezdetektől arra törekedett, hogy olyan MI-ügynököt hozzon létre, amely önállóan használja a számítógépet, de ehhez éveknek kellett eltelnie, mire a megfelelő modellek megszülettek. Az első nagy áttörés 2023-ban jött el: a Strawberry (eredeti nevén Q*) elhozta azt a módszert, amely az LLM-eket (nagy nyelvi modelleket), RL-t és tesztidős számítást ötvözte. Ez az MI-nek extra időt és számítási kapacitást adott a gondolkodásra, így képessé vált a hibák felismerésére, visszalépésre, vagy akár a frusztráció „megélésére” is, mintha csak ember lenne.


Az érvelési modellek skálázása

Ezekkel az új MI-érvelési modellekkel az OpenAI két jelentős skálázási tengelyt talált: egyrészt a modellek utóképzéséhez használt számítási kapacitás növelését, másrészt pedig az MI számára biztosított extra idő és erőforrás adását a válaszadáskor.

2023-ban külön Agents (Ügynökök) csapat alakult az OpenAI-n belül Daniel Selsam vezetésével. Az Agents csapat munkája végül az o1 nevű érvelési modell fejlesztésében csúcsosodott ki, amelyet az alapítók és vezető kutatók, köztük Ilya Sutskever is koordináltak. A kutatók szerint döntő jelentőségű volt, hogy az OpenAI AGI- (általános MI) fókuszú célnak köszönhetően mindig a legokosabb MI-modellek fejlesztése volt az elsődleges, még akkor is, ha ehhez jelentős erőforrásokat kellett allokálni.

Ezzel szemben a hagyományos pretraining stratégiával dolgozó laborok előbb elérték teljesítményük plafonját, és ma a MI-fejlesztés fő hajtóereje az OpenAI megoldásaihoz hasonló, érveléscentrikus modellek lettek.

Mit jelent, ha egy MI érvel?

Az MI-kutatás egyik fő célja, hogy a gépi gondolkodás minél inkább közelítsen a humán intelligenciához. Egyes kutatók ugyan óvatosan fogalmaznak abban, hogy az MI-k érvelése valóban megegyezik-e az emberi gondolkodással, de a többség inkább azt tartja fontosnak, hogy az eredmények hasznosak és látványosak legyenek. Nathan Lambert, az AI2 kutatója szerint például az MI érvelése olyan, mint a repülő “repülése” a madáréhoz képest: más mechanizmusokon alapul, de hasonló eredményekhez vezet. Ennek alapján a lényegi kérdés az MI haszna és alkalmazhatósága.

A terület vezető kutatói, köztük az OpenAI, az Anthropic és a Google DeepMind szakemberei is egyetértenek abban, hogy az MI-modellek érvelése még nem teljesen feltárt terület, további mélyreható kutatást igényel.

A következő kihívás: szubjektív feladatok

Az MI-ügynökök ma még az egyértelműen ellenőrizhető területeken, például a programkód-generálásban a leghatékonyabbak. Ilyen például az OpenAI Codex nevű rendszere, vagy az Anthropic Claude Code-ja, amelyekkel a fejlesztők valós munkafolyamatokat automatizálnak. A komplexebb, szubjektív feladatok – például online vásárlás vagy parkolóhely keresés – azonban már megakasztják a jelenlegi ügynököket: lassabbak, nem mindig tudnak pontos, emberi szempontokat is figyelembe vevő döntést hozni.

Lényeges hangsúlyozni, hogy a kutatók ezt adatproblémának tartják: a tanításhoz sokszor hiányzik a megfelelő, kevésbé ellenőrizhető feladatokra vonatkozó információ. Az OpenAI a legújabb MI-modelleknél – mint például az IMO-aranyérmet szerző rendszernél – már egyszerre több ügynököt futtat, amelyek versenyeztetik elképzeléseiket, majd kiválasztják a legjobb megoldást.

Noam Brown, az OpenAI egyik kutatója szerint ezek a modellek nemcsak matematikában, hanem más érvelési feladatokban is gyors ütemben fejlődnek, és semmi nem utal arra, hogy ez a haladás belátható időn belül lassulna.

Az MI-ügynökök jövője: készül a mindenre képes ChatGPT?

A következő nagy előrelépés az OpenAI GPT-5 modellje lehet, amely várhatóan újabb területeken nyújt majd példátlan teljesítményt, fejlesztőknek és felhasználóknak egyaránt. A cél emellett az, hogy az MI-ügynökök intuitív módon, rövid utasításokból is automatikusan felismerjék, mit vár a felhasználó, és mindig a legjobb eszközökhöz nyúljanak, anélkül, hogy a beállításokat külön kéne módosítani.

Az igazi végcél egy olyan ChatGPT-típusú MI-ügynök, amely az interneten bármilyen feladatot el tud végezni helyetted – ráadásul pontosan úgy, ahogy azt te szeretnéd. Ez azonban már sokkal több annál, mint amit a mai ChatGPT tud, de a fejlesztési irány egyértelműen ebbe tart. Az MI-piac forrong: az OpenAI mellett olyan riválisok dolgoznak a mindenre képes MI-ügynök elérésén, mint a Google, az Anthropic, az xAI vagy épp a Meta. A kérdés már nem csak az: képes lesz-e valaha az OpenAI elhozni az ügynökkorszakot, hanem az is, hogy megelőzik-e őket a versenytársak?

2025, adminboss, techcrunch.com alapján

  • Te szerinted mennyire etikus, ha egy MI teljesen önállóan dönt az emberek helyett?
  • Te mit tennél, ha egy MI hibázna egy fontos döntésben?
  • Szerinted lesznek olyan helyzetek, ahol jobb lenne, ha csak ember hozna végső döntést?


Legfrissebb posztok

MA 17:02

A Rhythm Heaven Groove fél ütemmel kullog a vetélytársak mögött

Ha valaki több mint egy évtizede játszott a Rhythm Heavennel, valószínűleg sosem felejtette el azt a különös, szürreális világot, ahol dadogó pankrátorok és furcsa madarak ugrálnak egy lélekmelengető popdallamra...

MA 16:31

Az antwerpeni társasháztűzben legalább hatan meghaltak

🔥 Legalább hatan életüket vesztették, amikor tűz ütött ki egy tízemeletes társasházban Antwerpen Linkeroever városrészében...

MA 16:01

A brit üvegszálfronton új csavar: gyorsítottan kebeleznék be a Netomniát

A brit távközlési piac gigantikus átalakulása zajlik: az ország versenyhatósága kiemelt vizsgálatot indított annak kapcsán, hogy a Netomnia anyavállalatát, a Substantialt a Liberty Global, a Telefonica és az InfraVia konzorciuma felvásárolja...

MA 15:31

Az étteremláncok titkos háborúja az új márkák bekebelezéséért

Egy márka felvásárlása mindig izgalmas hír, de az igazi próbatétel csak akkor kezdődik, amikor a háttérben elindul a két vállalkozás összefésülése...

MA 15:01

A Meta limitet szab az okosszemüvegek Conversation Focusának

👑 A Meta okosszemüvegei új korlátozást kaptak: már csak havi három órán át használható ingyen a Conversation Focus nevű funkció...

MA 14:31

Az amerikai kormány újra zöld utat ad Anthropic Mythos és Fable MI‑modelljeinek

Az Egyesült Államok Kereskedelmi Minisztériuma feloldotta az exporttilalmat az Anthropic két fejlett MI-modellje, a Mythos 5 és a Fable 5 esetében...

MA 10:25

Az amerikai kormány zöld utat ad a legerősebb Claude-oknak

Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...

MA 10:01

A Meta-leépítések után is cáfolja az MI miatti állásfélelmeket Zuckerberg

A technológiai iparban egyre nagyobb félelem övezi azt, hogy az MI széles körű elterjedése mennyi munkahely megszűnéséhez vezethet...

MA 09:25

A rejtélyesen eltűnő chatek: felháborodtak a Claude Code-felhasználók

Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...

MA 09:14

A Pokémon GO júliusa: új raidfőnökök, kiemelt órák, GO Fest-őrület

Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 7/1

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...

MA 09:01

Az MI rejtett szívkockázati jelre bukkant a százéves EKG-ban

❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...

MA 08:37

A NASA négy új robotküldetéssel tör utat a holdbázisnak

🚀 Megemlíthető, hogy az amerikai űrügynökség egyre nagyobb lendülettel dolgozik azon, hogy hosszú távú emberi jelenlétet teremtsen a Holdon...

MA 08:25

Az MI-lökéshullám felpörgeti a Dell bevételeit, de messze nem aranybánya

Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...

MA 08:13

A 6 milliós Pokémon-kártyalopásért több mint tíz év börtönt kapott

💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...

MA 08:01

A Szamóca-hold ma este: az év legalacsonyabb, apró teliholdja

🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...

MA 07:48

Az Android 17 új zárképernyő-trükkje bárkit elbuktat betöréskor

Az Android 17 jelentős szigorításokat vezet be a zárolóképernyőn, amellyel gyakorlatilag ellehetetleníti a PIN vagy jelszó feltörését...

MA 07:36

A kínai Lineshine szuperszámítógép világrekorder: közel 2 kvadrillió művelet/mp

A kínai LineShine szuperszámítógép most először szerezte meg a világelsőséget a számítási sebesség terén...

MA 07:25

Az amerikai agrárminisztérium 180 millió legyet enged szabadon – íme, miért

A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...

MA 07:13

A Microsoft felpörgeti kvantumbiztos ütemtervét, nőnek a kockázatok

⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...

MA 06:49

Az MI‑böngészők új réme: a BioShocking-adatlopás

Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...

MA 06:37

A Samsung szó szerint átformálja a hajlítható telefonjait?

Ahogy beköszönt a nyár, egyre hangosabbak a pletykák a Samsung legújabb összehajtható telefonjairól...

MA 06:06

Történelmi események a mai napon (Július 1.)

Ma háborúk fordulópontjai, birodalmak átrendeződései és új korszakokat nyitó tudományos, társadalmi mérföldkövek találkoznak...

MA 06:01

Az okosabb botvédelem mostantól megóvja a Teams-megbeszéléseket

🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...

kedd 18:32

A Cleveland-i Fed elnöke szerint MI fűti az inflációt – jöhet újabb kamatemelés

A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...

kedd 18:01

A Samsung Messages júliusban leáll: ezt az 5 dolgot tedd meg azonnal!

⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...

kedd 17:02

Az új CRISPR az epigenomot célozza, átírja a gének kapcsolóit

🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..

kedd 16:31

A Tata Electronicsnál múlt héten kiszivárogtak érzékeny iPhone-beszállítói adatok

Az elmúlt héten hatalmas adatlopás történt az indiai Tata Electronicsnál, ahol közel 630 GB-nyi bizalmas információ került illetéktelen kezekbe...

kedd 16:01

A YouTube-on már nézhető a Peacock – épp a vb-re!

A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...