Az MI könnyedén legyőzi a tinédzsereket a Nemzetközi Matematikai Olimpián

Az MI könnyedén legyőzi a tinédzsereket a Nemzetközi Matematikai Olimpián
Az OpenAI fejlesztői idén szintet léptek: olyan általános célú MI-modellt képeztek ki, amely a Nemzetközi Matematikai Olimpia (IMO – International Mathematical Olympiad) aranyérmes szintjét érte el, méghozzá teljesen külső segítség nélkül. Ezzel nemcsak a bonyolult matematikai feladatmegoldás terén történt áttörés, hanem azt is bizonyították, hogy az MI egyre közelebb kerül az emberi logikai gondolkodás elsajátításához.

Az első MI az élmezőnyben: minek kell ehhez felkötni a gatyát?

Júliusban rendezték meg Ausztráliában, a Sunshine Coaston az idei IMO-t, ahol több mint 100 országból érkező diákok kaptak hat elképesztően nehéz feladatot, hogy két nap alatt bizonyítsák, ki a legjobb matematikából. A feladványok abban különböznek a megszokottaktól, hogy rövid válasz helyett oldalakon átívelő, egyedi logikai fejtegetésekre van szükség – ez az a szint, amire az MI-k eddig ritkán voltak képesek.

Egy háromfős OpenAI csapat (Alex Wei, Sheryl Hsu, Noam Brown) azonban nagyot kockáztatott: általános célú, lépésről lépésre gondolkodó modellt tanítottak be a problémák megoldására. A szabályok szigorúak voltak: semmilyen eszközt, internetkapcsolatot, keresőt vagy speciális matematikai szoftvert nem használhattak. Az MI a diákokhoz hasonlóan két 4,5 órás etapban dolgozott, és a dolgozatai értékelését három korábbi IMO-érmes, valamint egy vezető matematikus végezte.

Az eredmény döbbenetes: a hat feladatból ötöt hibátlanul oldott meg, és 35 pontot szerzett a maximális 42-ből – pontosan azt a minimumot, amelyért aranyérem jár. Összehasonlításként: a 630 résztvevő közül csak 26-an tudtak nála jobbat elérni, közülük is csupán öt diák érte el a maximális pontszámot. Az OpenAI MI-je néhány évvel korábban még általános iskolai matekpéldákkal is megszenvedett – ilyen gyors fejlődést ritkán látni ezen a területen.

Általános célok, nem szimpla matekrobot

A csapat nem pusztán matematikai MI-t akart fejleszteni. A cél az volt, hogy olyan rendszert hozzanak létre, amely képes bármilyen összetett, árnyalatokkal teli problémán keresztül gondolkodni, vagyis közelítsen az emberi értelmező és problémamegoldó képességhez. Ezzel szemben a legtöbb alkalmazott MI eddig csak egy szűk területen – például képfelismerés vagy adatbáziskezelés – volt igazán jó.

Azért választották az IMO-t, mert ott objektív, egyértelműen értékelhető bizonyításokat kell írni. Ez kiváló próbaterepe az MI fejlődésének. Azt is hangsúlyozták, hogy a fejlesztés során minden részmegoldást úgy dolgoztak ki, hogy az ne csak matematikában, hanem más területeken is alkalmazható legyen.

Meddig tart egy MI “gondolkodása”?

A fejlődés abban is meglátszik, hogy mennyi ideig képes az MI folyamatosan, fókuszáltan dolgozni egy összetett feladaton. Míg korábban például a ChatGPT csak gyors, egyszerű kérdésekre tudott válaszolni, mostanra eljutottak oda, hogy akár egy-egy matematikai problémát 90 percen keresztül is képesek elemezni, minden lépést ellenőrizni, a hibákat kijavítani, és akár oldalakon át írni logikailag összefüggő megoldásokat. Ennek következtében az MI kifinomultabb, hosszabb távú problémák megoldására is alkalmas lehet a jövőben, nemcsak az azonnali, könnyen ellenőrizhető válaszokra.


Miért jó, ha az MI azt is tudja, ha valamit nem tud?

A tapasztalatok szerint a modell egyik nagy előnye, hogy képes felismerni: ha nem biztos a helyes válaszban, inkább nem ír le semmit. Ez különösen fontos, mivel ezzel az MI jelentős lépést tesz a hírhedt “hallucinációs” problémák leküzdésében. Ezzel szemben a legtöbb nyelvi MI még hajlamos hasraütésszerűen válaszolni akkor is, ha fogalma sincs a helyes megoldásról. Ha ezt a tulajdonságot sikerül stabilan beépíteni, az MI használata a mindennapokban is sokkal biztonságosabbá válhat.

Tanulságok és következő lépcsők

Az OpenAI munkája általánosítható: az MI hosszabb ideig, összetettebb problémákon is képes dolgozni, közben rendszeresen ellenőrzi önmagát, és aránylag kevés hibával produkál órákon átívelő, összefüggő szövegeket. Egy-egy megoldás akár 5–10 oldal hosszú is lehet – olyan egységes minőségben, amire a korábbi mesterséges intelligencia modellek még nem voltak képesek.

Fontos, hogy bár a mostani fejlesztések nem részei például a GPT-5-nek, a csapat már dolgozik azon, hogy ezek a képességek hamarosan a szélesebb körben használható MI-modellekben is megjelenjenek. Ennek köszönhetően egyre közelebb kerülünk ahhoz, hogy az MI ne csak ügyes segéd legyen, hanem valódi, emberi szintű partner a gondolkodásban és problémamegoldásban.

2025, adminboss, www.scientificamerican.com alapján

  • Te milyen problémát bíznál legszívesebben egy mesterséges intelligenciára?
  • Ha te lennél az, aki hibázik egy nehéz feladatban, hogyan ellenőriznéd magad?
  • Szerinted etikus, ha az ember a döntéseit részben egy ilyen MI-re bízza?



Legfrissebb posztok

Az Erin hurrikán lecsap az esővel sújtott Karib-térségre

MA 10:27

Az Erin hurrikán lecsap az esővel sújtott Karib-térségre

🌀 A Karib-térség több szigetét újabb, intenzív vihar sújtja: az Erin hurrikánt vasárnapra visszasorolták a harmadik kategóriába, de továbbra is heves esőzéseket és erős szélviharokat hoz magával, miközben a...

Az MI végre tényleg szinkronizál: Meta beindult

MA 10:13

Az MI végre tényleg szinkronizál: Meta beindult

A Meta új MI-alapú hangfordító funkciója mostantól világszerte elérhető, első körben angol és spanyol között használható oda-vissza. A szolgáltatás egy MI által generált hangot hoz létre, amely az...

Az új iPhone 17 bemutató: Mire készül az Apple idén?

MA 10:01

Az új iPhone 17 bemutató: Mire készül az Apple idén?

📱 A technológiai világ legnagyobb eseménye minden évben az Apple szeptemberi rendezvénye, ahol az új iPhone-generáció debütál. Idén is rengetegen várják már az iPhone 17 sorozat érkezését – és...

Kiderült, közelebb van a világegyetem legfényesebb rádióvillanása, mint gondoltuk

MA 09:53

Kiderült, közelebb van a világegyetem legfényesebb rádióvillanása, mint gondoltuk

Fantasztikus áttörés egy titokzatos űrjel eredetéről Megdöbbentő eredménnyel zárult egy nemzetközi csillagászati kutatás: a James Webb űrteleszkóp és Kanada CHIME távcsöve közösen beazonosította minden idők egyik legfényesebb rádiókitörésének...

Bonobók, akik pontosan emlékeznek, kikkel találkoztak

MA 09:40

Bonobók, akik pontosan emlékeznek, kikkel találkoztak

🐒 Kevésbé ismert, de a bonobók figyelemre méltóan összetett társas intelligenciával rendelkeznek: képesek fejben követni több ismerősük tartózkodási helyét akkor is, ha azok nincsenek szem előtt. Egy különleges kísérletsorozat,...

Az afrikai MI-bűnözőknek most nem sok szerencséjük volt

MA 09:26

Az afrikai MI-bűnözőknek most nem sok szerencséjük volt

🔒 Afrika-szerte összehangolt akcióban csaptak le a rendőrök a határokat átlépő MI-bűnözői bandákra: az INTERPOL vezette „Serengeti 2.0” műveletben 2025 júniusa és augusztusa között 1209 gyanúsítottat vettek őrizetbe. Az...

Mi lehet a titka az univerzum legrejtélyesebb piros pöttyének

MA 09:14

Mi lehet a titka az univerzum legrejtélyesebb piros pöttyének

🔴 Évmilliárdokkal ezelőtt, amikor a világegyetem csupán néhány százmillió éves volt, egy különös galaxistípus kezdett feltűnni a kozmikus színpadon. Ezek a kicsi, ám rendkívül fényes, vörös pöttyök már évek...

APPok, Amik Ingyenesek MA, 8/23
APP

MA 09:11

APPok, Amik Ingyenesek MA, 8/23

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Clumsy Bomb (iPhone/iPad)A Clumsy Bomb egy lendületes, egyszerűen elsajátítható, mégis rendkívül addiktív ügyességi játék. Feladatod, hogy...

A Google naptármeghívók veszélyes trükkje: a Gemini-t is átverik

MA 08:53

A Google naptármeghívók veszélyes trükkje: a Gemini-t is átverik

A Google nemrég egy súlyos hibát javított, miután kutatók kiderítették: rosszindulatúan szerkesztett Google Naptár (Google Calendar) eseménymeghívók segítségével távolról átvehető volt a Gemini ügynökök irányítása a célpont eszközén,...