2025. 08. 23., 07:15

Az MI könnyedén legyőzi a tinédzsereket a Nemzetközi Matematikai Olimpián

Az MI könnyedén legyőzi a tinédzsereket a Nemzetközi Matematikai Olimpián
Az OpenAI fejlesztői idén szintet léptek: olyan általános célú MI-modellt képeztek ki, amely a Nemzetközi Matematikai Olimpia (IMO – International Mathematical Olympiad) aranyérmes szintjét érte el, méghozzá teljesen külső segítség nélkül. Ezzel nemcsak a bonyolult matematikai feladatmegoldás terén történt áttörés, hanem azt is bizonyították, hogy az MI egyre közelebb kerül az emberi logikai gondolkodás elsajátításához.

Az első MI az élmezőnyben: minek kell ehhez felkötni a gatyát?

Júliusban rendezték meg Ausztráliában, a Sunshine Coaston az idei IMO-t, ahol több mint 100 országból érkező diákok kaptak hat elképesztően nehéz feladatot, hogy két nap alatt bizonyítsák, ki a legjobb matematikából. A feladványok abban különböznek a megszokottaktól, hogy rövid válasz helyett oldalakon átívelő, egyedi logikai fejtegetésekre van szükség – ez az a szint, amire az MI-k eddig ritkán voltak képesek.

Egy háromfős OpenAI csapat (Alex Wei, Sheryl Hsu, Noam Brown) azonban nagyot kockáztatott: általános célú, lépésről lépésre gondolkodó modellt tanítottak be a problémák megoldására. A szabályok szigorúak voltak: semmilyen eszközt, internetkapcsolatot, keresőt vagy speciális matematikai szoftvert nem használhattak. Az MI a diákokhoz hasonlóan két 4,5 órás etapban dolgozott, és a dolgozatai értékelését három korábbi IMO-érmes, valamint egy vezető matematikus végezte.

Az eredmény döbbenetes: a hat feladatból ötöt hibátlanul oldott meg, és 35 pontot szerzett a maximális 42-ből – pontosan azt a minimumot, amelyért aranyérem jár. Összehasonlításként: a 630 résztvevő közül csak 26-an tudtak nála jobbat elérni, közülük is csupán öt diák érte el a maximális pontszámot. Az OpenAI MI-je néhány évvel korábban még általános iskolai matekpéldákkal is megszenvedett – ilyen gyors fejlődést ritkán látni ezen a területen.

Általános célok, nem szimpla matekrobot

A csapat nem pusztán matematikai MI-t akart fejleszteni. A cél az volt, hogy olyan rendszert hozzanak létre, amely képes bármilyen összetett, árnyalatokkal teli problémán keresztül gondolkodni, vagyis közelítsen az emberi értelmező és problémamegoldó képességhez. Ezzel szemben a legtöbb alkalmazott MI eddig csak egy szűk területen – például képfelismerés vagy adatbáziskezelés – volt igazán jó.

Azért választották az IMO-t, mert ott objektív, egyértelműen értékelhető bizonyításokat kell írni. Ez kiváló próbaterepe az MI fejlődésének. Azt is hangsúlyozták, hogy a fejlesztés során minden részmegoldást úgy dolgoztak ki, hogy az ne csak matematikában, hanem más területeken is alkalmazható legyen.

Meddig tart egy MI “gondolkodása”?

A fejlődés abban is meglátszik, hogy mennyi ideig képes az MI folyamatosan, fókuszáltan dolgozni egy összetett feladaton. Míg korábban például a ChatGPT csak gyors, egyszerű kérdésekre tudott válaszolni, mostanra eljutottak oda, hogy akár egy-egy matematikai problémát 90 percen keresztül is képesek elemezni, minden lépést ellenőrizni, a hibákat kijavítani, és akár oldalakon át írni logikailag összefüggő megoldásokat. Ennek következtében az MI kifinomultabb, hosszabb távú problémák megoldására is alkalmas lehet a jövőben, nemcsak az azonnali, könnyen ellenőrizhető válaszokra.


Miért jó, ha az MI azt is tudja, ha valamit nem tud?

A tapasztalatok szerint a modell egyik nagy előnye, hogy képes felismerni: ha nem biztos a helyes válaszban, inkább nem ír le semmit. Ez különösen fontos, mivel ezzel az MI jelentős lépést tesz a hírhedt “hallucinációs” problémák leküzdésében. Ezzel szemben a legtöbb nyelvi MI még hajlamos hasraütésszerűen válaszolni akkor is, ha fogalma sincs a helyes megoldásról. Ha ezt a tulajdonságot sikerül stabilan beépíteni, az MI használata a mindennapokban is sokkal biztonságosabbá válhat.

Tanulságok és következő lépcsők

Az OpenAI munkája általánosítható: az MI hosszabb ideig, összetettebb problémákon is képes dolgozni, közben rendszeresen ellenőrzi önmagát, és aránylag kevés hibával produkál órákon átívelő, összefüggő szövegeket. Egy-egy megoldás akár 5–10 oldal hosszú is lehet – olyan egységes minőségben, amire a korábbi mesterséges intelligencia modellek még nem voltak képesek.

Fontos, hogy bár a mostani fejlesztések nem részei például a GPT-5-nek, a csapat már dolgozik azon, hogy ezek a képességek hamarosan a szélesebb körben használható MI-modellekben is megjelenjenek. Ennek köszönhetően egyre közelebb kerülünk ahhoz, hogy az MI ne csak ügyes segéd legyen, hanem valódi, emberi szintű partner a gondolkodásban és problémamegoldásban.

2025, adminboss, www.scientificamerican.com alapján

  • Te milyen problémát bíznál legszívesebben egy mesterséges intelligenciára?
  • Ha te lennél az, aki hibázik egy nehéz feladatban, hogyan ellenőriznéd magad?
  • Szerinted etikus, ha az ember a döntéseit részben egy ilyen MI-re bízza?


Legfrissebb posztok

MA 14:20

A Pfizer új, havi injekciója forradalmasíthatja a fogyást

A Pfizer legújabb humán kísérlete biztató eredményeket mutat egy új, havonta adható elhízás elleni injekcióval kapcsolatban...

MA 14:02

Az új Switch csúcsra ért, történelmet ír a Nintendo

A Switch végre letaszította a DS-t a trónról, így minden idők legkelendőbb Nintendo konzolja lett: 2025...

MA 13:38

A SpaceX bekebelezte az xAI-t – MI forradalom az űrben

🚀 Elon Musk újabb meghökkentő lépése alapjaiban formálja át a technológiai világot: a SpaceX váratlanul felvásárolta a három éve alapított xAI-t, így egyesült a rakétatechnológia, az MI és az űrinternet világa...

MA 13:19

Az orosz hekkerek ismét célba vették a Microsoft Office-t

🕵 A napokban orosz hackerek, az APT28 (más néven Fancy Bear vagy Sofacy), kihasználták a Microsoft Office egy frissen javított sérülékenységét (CVE-2026-21509) célzott támadásokhoz Ukrajnában és más európai szervezetek ellen...

MA 13:02

A szíved otthoni ellenőrzésének két pofonegyszerű módja

Érdekes felvetés, hogy a szívbetegségek, amelyek ma Magyarországon is vezető haláloknak számítanak, sok esetben megelőzhetők lennének egy kis odafigyeléssel...

MA 12:55

Az MI még nem gyújtotta be a kriptó rakétáit

Az MI és a kriptopiac összefonódása rengeteg izgalmat vált ki, de egyelőre hiányzik az a világos és közérthető alkalmazás, amely valódi áttörést hozna...

MA 12:37

Az X francia irodáira is rajtaütött a rendőrség

A francia hatóságok kibervédelmi egységei, az Europol támogatásával, razziát tartottak Elon Musk közösségi platformjának, az X-nek a párizsi irodáiban...

MA 12:02

Az óceán közepe sem menedék: műanyag üldözi a halakat

🐠 A Csendes-óceán legtávolabbi, érintetlennek hitt vizei sem tudják már megóvni a halakat a műanyaghulladék terjedésétől...

MA 11:56

Az Artemis II holdküldetés megint késik – a NASA-t sokkolta az ok

Ezek után érthető, hogy a NASA ismét elhalasztja az Artemis II küldetést, amely négy űrhajóst indítana a Hold köré...

MA 11:38

Az MMS „csodaszere”: az ára a súlyos sejtkárosodás

Az úgynevezett Miracle Mineral Solution (MMS) évek óta kering mint univerzális gyógymód rákra, autizmusra és COVID-19-re...

MA 10:57

Az új Google Home-frissítés végre ér valamit?

💡 A Google Home új frissítésének köszönhetően a kamerák legfrissebb felvételei most már sokkal megbízhatóbban lejátszhatók, így a bosszantó “A videó nem érhető el” hibák ritkábban fordulnak majd elő...

MA 10:49

A SpaceX Elon Muskkal az űrbe viszi a mesterséges intelligenciát

Elon Musk egyesíti a SpaceX-et és az xAI-t (amely az X-et is birtokolja), hogy létrehozza a Földön (és azon túl) a legambiciózusabb, egységes innovációs gépezetet...

MA 10:42

A Waymo 5800 milliárd forintot húzott be az önvezető taxi‑világhódításra

A Waymo friss tőkebevonása 5800 milliárd forintot hozott a cég kasszájába, hogy önvezető taxiparkját az USA számos új városába, sőt a világ több pontjára is eljuttassa...

MA 10:17

A Moltbook MI-kultusza: új őrület vagy mesterséges botrány?

🕵 Az elmúlt napokban a Moltbook nevű közösségi oldal hirtelen mindenki figyelmét felkeltette a techvilágban...

MA 10:01

Az új, csirkeméretű dinoszaurusz átírja a dinoszauruszok történetét

Egy apró növényevő dinoszaurusz, a Foskeia pelendonum különös anatómiája alaposan meglepte a kutatókat...

MA 09:49

A mesterséges intelligencia űrutazása: a SpaceX felvásárolta az xAI-t

Elon Musk újra megkeverte a lapokat: a SpaceX bekebelezte saját MI-cégét, az xAI-t, így egy fedél alá kerülnek a rakéták, a műholdas internet, a mesterséges intelligencia és a világelső, szólásszabadságot hirdető közösségi platform...

MA 09:41

Megint drágít a Crunchyroll: az animések pénztárcája bánja

💸 A Crunchyroll ismét árat emel minden előfizetési csomagján – ráadásul a változás minden szintet érint...

MA 09:34

A Galaxy Z TriFold elfogyott – mit jelent ez a Galaxy S26-nak?

Érdekes kérdés, mivel készül a Samsung az okostelefon-piacon: néhány nap alatt teljesen elfogyott a Galaxy Z TriFold, amely minden előjel nélkül, csekély hírveréssel került forgalomba, és meglepően magas, 1 070 000 forint körüli áron talált gazdára...

MA 09:25

A bitcoin visszavág: új kriptohullám a hétvégi zuhanás után

Az elmúlt napokban a bitcoin árfolyama hatalmas hullámvasútra ült, miután hétvégén 74 000 dollár (kb...

MA 09:10

Az űridőjárás tombol: brutális napkitörések közelegnek

🌌 Az elmúlt 24 órában a Nap 4366-os aktív foltja elképesztő, 27 napkitörést produkált, ráadásul ezek között volt az utóbbi évek legerősebb kitörése is...

MA 09:01

Az új szabály véget vet Kínában a rejtett kilincsek korszakának

Kína hamarosan betiltja az elektromos autókon az elrejtett ajtókilincseket, miután több tragikus baleset nyomán világszerte megkérdőjelezték ezt a megoldást, amelyet a Tesla tett elterjedtté...

MA 08:49

Az évszázad legnagyobb napkitörése – tanúi lehettünk

Vasárnap a Nap hatalmas kitörésekkel lepte meg a Földet: az elmúlt harminc év egyik legerősebb napkitörése beragyogta a világűr sötétjét...

MA 08:41

Az MI memóriáját forradalmasítja a SoftBank–Intel szövetség

💻 A SoftBank leányvállalata, a Saimemory és az Intel közös fejlesztésbe kezd, hogy megalkossa a következő generációs MI-hez és nagyteljesítményű számítástechnikához készült memóriatechnológiát...

MA 08:33

A kínai hatóságok betiltják az eltűnő autókilincseket

A kínai hatóságok betiltották a rejtett, karosszériába süllyesztett autókilincseket, amelyek az utóbbi években egyre népszerűbbé váltak az autógyártók körében, főként aerodinamikai és dizájn okokból...

MA 08:17

Végre kikapcsolhatod az MI-t a Firefoxban

A Firefox új frissítése végre lehetőséget ad a felhasználóknak arra, amire már régóta várnak: teljesen kikapcsolhatóvá vált minden MI-funkció...

MA 08:01

A Google Telefon új trükkje, amire senki sem várt

📱 Az okostelefonok szoftverei folyamatosan frissülnek, ezért néha nehéz követni, mikor és miért változik meg egy-egy alkalmazás kinézete vagy működése...

MA 07:57

Az ólom sötét öröksége: tisztábbak vagyunk, de még nincs vége

🔫 Az emberi haj többet mesél rólunk, mint hinnénk: egy évszázadon át gyűjtött hajtincsek alapján utahi kutatók most lenyűgöző eredményre jutottak...

MA 07:50

A Notepad++ frissítéseivel kémkedett Kína?

🕵 A népszerű Notepad++ szöveg- és kódszerkesztő felhasználói hónapokon át veszélyben voltak, miután a szoftver frissítéseit terjesztő szervereket tavaly feltörték...

MA 07:42

A Waymo 5,7 billió forintos dobása: jönnek a robottaxik világszerte

🚗 A Waymo, az Alphabet önvezető autós cége újabb óriási befektetést kapott: 5,7 billió forint (16 milliárd USD) tőkét vont be, amellyel globálisan, több mint egy tucat új városban – köztük Tokióban és Londonban – terjeszti ki sofőr nélküli taxiszolgáltatását még az idén...