2025. 08. 04., 09:02

Az MI már tényleg bármit elvégez helyetted?

Az MI már tényleg bármit elvégez helyetted?
OpenAI kutatói az elmúlt években óriási lépéseket tettek annak érdekében, hogy általános célú, önállóan feladatokat végrehajtó MI-ügynököket hozzanak létre – olyan rendszereket, amelyek egyszerű utasításokra is képesek komplex számítógépes műveleteket végrehajtani, hasonlóan egy emberhez. A folyamat egyelőre messze nem ért véget, de már most bámulatos eredményeket láthatunk.

Matematikai zseni MI-k az OpenAI-nál

Hunter Lightman 2022-ben csatlakozott az OpenAI-hoz, amikor a ChatGPT hatalmas sikereket aratott, azonban ő ekkor csendben egy olyan csapattal kezdett dolgozni, amely az OpenAI MI-modelleket tanította középiskolai matematikaversenyek feladatainak megoldására. Elmondása szerint akkoriban az MI-modellek matematikai gondolkodása még ingatag lábakon állt, a cél viszont az lett, hogy ezen változtassanak. A MathGen néven ismert csapat kulcsszerepet játszott abban, hogy az OpenAI a matematikai érvelésben az iparág élére kerüljön: egyik modelljük már aranyérmet szerzett a Nemzetközi Matematikai Olimpián (International Mathematical Olympiad, IMO) is, amelyet a világ legjobb középiskolás matematikusai számára rendeznek. Az OpenAI úgy véli, hogy ezek az eredmények más területeken is hasznosítható tudáshoz vezetnek, sőt, megalapozzák azokat az MI-ügynököket, amelyeket mindig is szerettek volna létrehozni.

Az MI-ügynökök születése

Bár a ChatGPT igazi sikertörténet, eredetileg csak egy visszafogott kutatási projektből született meg, az MI-ügynökök viszont évekig tartó, tudatos munka eredményei a cégnél. Sam Altman, az OpenAI vezérigazgatója már 2023-ban arról beszélt, hogy hamarosan a felhasználók csak rábízzák a gépre, mit szeretnének, az MI pedig mindent elvégez helyettük.

Lényeges kiemelni, hogy az OpenAI új modelljeinek kiemelkedő teljesítménye miatt kutatóik a Szilícium-völgy legkeresettebb tehetségeivé váltak. Mark Zuckerberg például öt OpenAI-s kutatót csábított át a Meta szuperintelligenciával foglalkozó részlegéhez, több mint 36 milliárd forintos (100 millió USD) ajánlatokkal.

Megújult megerősítéses tanulás

Az MI-ügynökök fejlődésének egyik kulcsa a megerősítéses tanulás (reinforcement learning, RL), amely évtizedek óta ismert: a gép visszacsatolást kap a döntései helyességéről szimulált környezetekben. A Google DeepMind már 2016-ban RL segítségével alkotta meg az AlphaGo-t, amely legyőzte a go világbajnokát.

Az OpenAI munkatársa, Andrej Karpathy már a kezdetektől arra törekedett, hogy olyan MI-ügynököt hozzon létre, amely önállóan használja a számítógépet, de ehhez éveknek kellett eltelnie, mire a megfelelő modellek megszülettek. Az első nagy áttörés 2023-ban jött el: a Strawberry (eredeti nevén Q*) elhozta azt a módszert, amely az LLM-eket (nagy nyelvi modelleket), RL-t és tesztidős számítást ötvözte. Ez az MI-nek extra időt és számítási kapacitást adott a gondolkodásra, így képessé vált a hibák felismerésére, visszalépésre, vagy akár a frusztráció „megélésére” is, mintha csak ember lenne.


Az érvelési modellek skálázása

Ezekkel az új MI-érvelési modellekkel az OpenAI két jelentős skálázási tengelyt talált: egyrészt a modellek utóképzéséhez használt számítási kapacitás növelését, másrészt pedig az MI számára biztosított extra idő és erőforrás adását a válaszadáskor.

2023-ban külön Agents (Ügynökök) csapat alakult az OpenAI-n belül Daniel Selsam vezetésével. Az Agents csapat munkája végül az o1 nevű érvelési modell fejlesztésében csúcsosodott ki, amelyet az alapítók és vezető kutatók, köztük Ilya Sutskever is koordináltak. A kutatók szerint döntő jelentőségű volt, hogy az OpenAI AGI- (általános MI) fókuszú célnak köszönhetően mindig a legokosabb MI-modellek fejlesztése volt az elsődleges, még akkor is, ha ehhez jelentős erőforrásokat kellett allokálni.

Ezzel szemben a hagyományos pretraining stratégiával dolgozó laborok előbb elérték teljesítményük plafonját, és ma a MI-fejlesztés fő hajtóereje az OpenAI megoldásaihoz hasonló, érveléscentrikus modellek lettek.

Mit jelent, ha egy MI érvel?

Az MI-kutatás egyik fő célja, hogy a gépi gondolkodás minél inkább közelítsen a humán intelligenciához. Egyes kutatók ugyan óvatosan fogalmaznak abban, hogy az MI-k érvelése valóban megegyezik-e az emberi gondolkodással, de a többség inkább azt tartja fontosnak, hogy az eredmények hasznosak és látványosak legyenek. Nathan Lambert, az AI2 kutatója szerint például az MI érvelése olyan, mint a repülő “repülése” a madáréhoz képest: más mechanizmusokon alapul, de hasonló eredményekhez vezet. Ennek alapján a lényegi kérdés az MI haszna és alkalmazhatósága.

A terület vezető kutatói, köztük az OpenAI, az Anthropic és a Google DeepMind szakemberei is egyetértenek abban, hogy az MI-modellek érvelése még nem teljesen feltárt terület, további mélyreható kutatást igényel.

A következő kihívás: szubjektív feladatok

Az MI-ügynökök ma még az egyértelműen ellenőrizhető területeken, például a programkód-generálásban a leghatékonyabbak. Ilyen például az OpenAI Codex nevű rendszere, vagy az Anthropic Claude Code-ja, amelyekkel a fejlesztők valós munkafolyamatokat automatizálnak. A komplexebb, szubjektív feladatok – például online vásárlás vagy parkolóhely keresés – azonban már megakasztják a jelenlegi ügynököket: lassabbak, nem mindig tudnak pontos, emberi szempontokat is figyelembe vevő döntést hozni.

Lényeges hangsúlyozni, hogy a kutatók ezt adatproblémának tartják: a tanításhoz sokszor hiányzik a megfelelő, kevésbé ellenőrizhető feladatokra vonatkozó információ. Az OpenAI a legújabb MI-modelleknél – mint például az IMO-aranyérmet szerző rendszernél – már egyszerre több ügynököt futtat, amelyek versenyeztetik elképzeléseiket, majd kiválasztják a legjobb megoldást.

Noam Brown, az OpenAI egyik kutatója szerint ezek a modellek nemcsak matematikában, hanem más érvelési feladatokban is gyors ütemben fejlődnek, és semmi nem utal arra, hogy ez a haladás belátható időn belül lassulna.

Az MI-ügynökök jövője: készül a mindenre képes ChatGPT?

A következő nagy előrelépés az OpenAI GPT-5 modellje lehet, amely várhatóan újabb területeken nyújt majd példátlan teljesítményt, fejlesztőknek és felhasználóknak egyaránt. A cél emellett az, hogy az MI-ügynökök intuitív módon, rövid utasításokból is automatikusan felismerjék, mit vár a felhasználó, és mindig a legjobb eszközökhöz nyúljanak, anélkül, hogy a beállításokat külön kéne módosítani.

Az igazi végcél egy olyan ChatGPT-típusú MI-ügynök, amely az interneten bármilyen feladatot el tud végezni helyetted – ráadásul pontosan úgy, ahogy azt te szeretnéd. Ez azonban már sokkal több annál, mint amit a mai ChatGPT tud, de a fejlesztési irány egyértelműen ebbe tart. Az MI-piac forrong: az OpenAI mellett olyan riválisok dolgoznak a mindenre képes MI-ügynök elérésén, mint a Google, az Anthropic, az xAI vagy épp a Meta. A kérdés már nem csak az: képes lesz-e valaha az OpenAI elhozni az ügynökkorszakot, hanem az is, hogy megelőzik-e őket a versenytársak?

2025, adminboss, techcrunch.com alapján

  • Te szerinted mennyire etikus, ha egy MI teljesen önállóan dönt az emberek helyett?
  • Te mit tennél, ha egy MI hibázna egy fontos döntésben?
  • Szerinted lesznek olyan helyzetek, ahol jobb lenne, ha csak ember hozna végső döntést?


Legfrissebb posztok

MA 12:56

Az igazán ijesztő: az ellopott bankkártyád olcsóbb, mint egy kávé

💸 A digitális világban minden eddiginél könnyebb pénztárca nélkül áldozattá válni. Egy friss kutatás szerint a sötét weben mindössze 4500 forintért hozzá lehet jutni egy brit bankkártya teljes adataihoz, míg egy teljes digitális azonosítócsomag 15 ezer forintba kerül...

MA 12:34

Az agyátültetés még mindig lehetetlen – miért?

Jellemző példa erre, hogy Arizonában több mint 150 levágott fejet tárolnak kriogén kamrákban abban a reményben, hogy a jövő orvostudománya egyszer újra életre keltheti őket egy másik testben...

MA 11:12

Az elveszett, 1200 éves kézirat az első angol verset rejti

Egy tizenkilencedik századi kézirat került elő Rómában, amely igazi szenzációnak számít a nyelvészek és irodalomtudósok körében: a Trinity College Dublin kutatóinak sikerült azonosítani az egyik legkorábbi, ma ismert angol vers egyik legrégebbi változatát...

MA 11:01

A Riválisok 2 elkezdődött – a csúszást egy váratlan csavar indokolja

A Riválisok (Rivals) második évadának első három epizódja már elérhető a Hulu-n és a Disney+-on, viszont a rajongók csalódottan tapasztalhatják, hogy a szezon második felére idén még várni kell...

MA 10:55

Az ok, amiért egyes daganatok mégis túlélik a kemoterápiát

💉 A rákos sejtek makacs túlélése régóta okoz fejtörést az orvosoknak, különösen, amikor a legerősebb terápiák is hatástalanok maradnak...

MA 10:46

Az új kutatás lerombolja a jojódiéta legnagyobb félelmét

Érdemes megvizsgálni, hogy tényleg mindenáron kerülni kell-e a jojódiétát. Az évek óta tartó rettegés, miszerint az ismétlődő fogyás és visszahízás árthat az egészségnek, úgy tűnik, nem támasztható alá meggyőző tudományos bizonyítékokkal...

MA 10:27

A 150 millió éves, lenyűgöző sztégoszaurusz-koponya átírja a dinoszauruszok történetét

Egy Spanyolországban talált, 150 millió éves, elképesztően jól megmaradt sztégoszaurusz-koponya alapjaiban változtatja meg mindazt, amit eddig a dinoszauruszok fejlődéséről tudtunk...

MA 10:19

A világ folyói fulladoznak: vészesen fogy az oxigén, veszélyben az élővilág

Tipikus esete annak, hogy az éghajlatváltozás alattomos hatásait csak akkor vesszük észre, amikor már drámaian romlanak a természeti rendszerek...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     100 Plants – Grow & Learn (iPhone/iPad)A 100 Plants – Grow & Learn oktató alkalmazásban 100 különféle növényt lehet nevelni magtól virágzásig, öt fejlődési szakaszban (mag, csíra, levél, bimbó, virág)...

MA 09:01

A WHO globális vészhelyzetet hirdet a kongói ebola miatt – 80 haláleset

A Kongói Demokratikus Köztársaság és Uganda területén kitört ebola-járványt vasárnap nemzetközi jelentőségű egészségügyi vészhelyzetnek minősítette az Egészségügyi Világszervezet...

MA 08:55

A Forza Horizon 6 máris rekordot döntött, pedig még meg sem jelent

🏁 A Forza Horizon 6 még hivatalosan meg sem jelent, de már most népszerűbb, mint az előző, ötödik rész...

MA 08:28

Az MI-vel írók váltsanak pályát – üzeni Seth Rogen

💬 Felmerül a kérdés, hogy a hagyományos írás vagy az MI használata hordoz-e valódi kreativitást...

MA 08:18

A Survivor Görögország forgatását leállították: egy versenyző majdnem elvesztette a lábát

A Survivor – Görögország (Survivor Greece) forgatását azonnali hatállyal leállították, miután egy fiatal versenyző, Stavros Floros életveszélyes balesetet szenvedett...

MA 07:55

A veterán Final Fantasy XI 24 év után is tartogat újdonságokat

Több mint két évtizeddel a debütálása után a Final Fantasy XI továbbra is kitart az online szerepjátékok világában...

MA 07:37

Az üzleti vakfolt: az MI kiiktatja a saját tanítómestereit

A technológiai átalakulás új korszakát éljük, ahol a fejlett algoritmusok már nemcsak támogatják, hanem egyre inkább kiváltják azokat a szakértői feladatokat, amelyekben az embereknek fejlődniük kellene...

MA 07:28

A hivatalos Garfield-crossover végre megérkezett a Magic: The Gatheringbe

A világ talán leghíresebb macskája, Garfield végre hivatalosan is beköszön a Magic: The Gathering különkiadásai közé...

MA 07:19

Az érettségi ajándéklista: menő kütyük és kolis alapcuccok

Az iskolapadból az egyetemi életbe kilépni mindig izgalmas, egy jó ajándék pedig még könnyebbé teheti az átállást...

MA 07:02

A GameSir G8+ MFi végre kijavította az elődje hibáit?

A GameSir G8+ MFi jelentős előrelépés a mobil játékvezérlők világában, amely a G8 Galileo bevált tulajdonságait vette alapul, majd szinte minden kritikus ponton továbbfejlesztette azt...

MA 06:55

A Mixtape nem kerül le: a kiadó cáfolja a zenelicenc-pánikot

Kételyek merültek fel, hogy a nemrég megjelent, Mixtape című történetközpontú játék hamarosan eltűnhet a digitális boltokból a zeneszámok licencproblémái miatt...

MA 06:46

Az adatközpontok ára: 16 millió otthonnyi áram – ki nyer?

Hihetetlen, de mégis igaz, hogy az Egyesült Államokban működő adatközpontok évente annyi áramot fogyasztanak, amellyel több mint 16 millió otthon energiaigényét lehetne fedezni...

MA 06:37

A Microsoft AI-központja Kenyában az ország felét lekapcsolná

Kenya elképesztő technológiai ugrásra készült, amikor májusban bejelentették a G42 és a Microsoft közös, 1 milliárd dolláros adatközpont-beruházását...

MA 06:28

Az utolsó kör: jövő héten lekerül a LEGO 2K Drive

Csak három évvel a megjelenése után végleg eltűnik a digitális boltok polcairól a LEGO 2K Gyorsulás (LEGO 2K Drive), az a nyílt világú versenyjáték, ahol saját építésű járgányaiddal száguldozhatsz...

MA 06:19

Az egykori Valve-író a Half-Life 3-hoz hozzá sem nyúlna

😐 Ez a jelenség jól illusztrálható azzal, hogy ha egy alkotó bármilyen megjegyzést tesz egy legendás játék folytatásáról, az internetes rajongók azonnal az új rész bejelentését vizionálják...

MA 06:05

Történelmi események a mai napon (Május 17.)

Mi fűzte össze ezt a napot? Alkotmányok 📜, háborúk ⚔️ és történelmi első alkalmak 🚆 formálták a világot: Norvégia alkotmánya, a Boshin-háború lezárása, a Watergate-ügy nyilvános szenátusi meghallgatásai és az első legális azonos nemű házasságok mind ide kötődnek...

MA 06:01

A Swatchnál boltzár és zavargás egy nem limitált műanyag óráért

A Swatch új órakollekciójának megjelenése váratlan zavargásokat okozott több városban, emiatt több üzletnek ideiglenesen be kellett zárnia...

szombat 21:46

Az otthoni iroda trónja: gamer szék, ami mindent túlél

💪 Ami kezdetben ártalmatlannak tűnt, az utóbbi években jelentősen megváltozott: világszerte milliók home office-ba kényszerültek, ami alaposan átrajzolta, mit várunk el az irodabútortól...

szombat 21:01

Az Andes-vírus rejtett kockázatai: mi számít közeli kontaktusnak?

A közelmúltban egy tengerjáró hajón történt hantavírus-kitörés miatt jelenleg mintegy 150 utast figyelnek meg, illetve akár hathetes karanténba is helyeznek...

szombat 20:56

Az XRP lenyomta a Bitcoint, de a nagy ralihoz kell a Kongresszus

📈 Az XRP ára jelentősen megugrott, miután az amerikai szenátus bankügyi bizottsága előrelépést tett a Digital Asset Market Clarity Act ügyében...

szombat 20:46

A nyolcéves afroamerikai kisfiú rejtélye: fehér telepesek közé temetve Marylandben

🕵 Egy 17. századi marylandi temető különös titkot rejtett: egy mindössze nyolcéves fiú földi maradványait találták meg, aki túlnyomórészt afrikai származású volt...