Az MI könnyedén legyőzi a tinédzsereket a Nemzetközi Matematikai Olimpián

Az MI könnyedén legyőzi a tinédzsereket a Nemzetközi Matematikai Olimpián
Az OpenAI fejlesztői idén szintet léptek: olyan általános célú MI-modellt képeztek ki, amely a Nemzetközi Matematikai Olimpia (IMO – International Mathematical Olympiad) aranyérmes szintjét érte el, méghozzá teljesen külső segítség nélkül. Ezzel nemcsak a bonyolult matematikai feladatmegoldás terén történt áttörés, hanem azt is bizonyították, hogy az MI egyre közelebb kerül az emberi logikai gondolkodás elsajátításához.

Az első MI az élmezőnyben: minek kell ehhez felkötni a gatyát?

Júliusban rendezték meg Ausztráliában, a Sunshine Coaston az idei IMO-t, ahol több mint 100 országból érkező diákok kaptak hat elképesztően nehéz feladatot, hogy két nap alatt bizonyítsák, ki a legjobb matematikából. A feladványok abban különböznek a megszokottaktól, hogy rövid válasz helyett oldalakon átívelő, egyedi logikai fejtegetésekre van szükség – ez az a szint, amire az MI-k eddig ritkán voltak képesek.

Egy háromfős OpenAI csapat (Alex Wei, Sheryl Hsu, Noam Brown) azonban nagyot kockáztatott: általános célú, lépésről lépésre gondolkodó modellt tanítottak be a problémák megoldására. A szabályok szigorúak voltak: semmilyen eszközt, internetkapcsolatot, keresőt vagy speciális matematikai szoftvert nem használhattak. Az MI a diákokhoz hasonlóan két 4,5 órás etapban dolgozott, és a dolgozatai értékelését három korábbi IMO-érmes, valamint egy vezető matematikus végezte.

Az eredmény döbbenetes: a hat feladatból ötöt hibátlanul oldott meg, és 35 pontot szerzett a maximális 42-ből – pontosan azt a minimumot, amelyért aranyérem jár. Összehasonlításként: a 630 résztvevő közül csak 26-an tudtak nála jobbat elérni, közülük is csupán öt diák érte el a maximális pontszámot. Az OpenAI MI-je néhány évvel korábban még általános iskolai matekpéldákkal is megszenvedett – ilyen gyors fejlődést ritkán látni ezen a területen.

Általános célok, nem szimpla matekrobot

A csapat nem pusztán matematikai MI-t akart fejleszteni. A cél az volt, hogy olyan rendszert hozzanak létre, amely képes bármilyen összetett, árnyalatokkal teli problémán keresztül gondolkodni, vagyis közelítsen az emberi értelmező és problémamegoldó képességhez. Ezzel szemben a legtöbb alkalmazott MI eddig csak egy szűk területen – például képfelismerés vagy adatbáziskezelés – volt igazán jó.

Azért választották az IMO-t, mert ott objektív, egyértelműen értékelhető bizonyításokat kell írni. Ez kiváló próbaterepe az MI fejlődésének. Azt is hangsúlyozták, hogy a fejlesztés során minden részmegoldást úgy dolgoztak ki, hogy az ne csak matematikában, hanem más területeken is alkalmazható legyen.

Meddig tart egy MI “gondolkodása”?

A fejlődés abban is meglátszik, hogy mennyi ideig képes az MI folyamatosan, fókuszáltan dolgozni egy összetett feladaton. Míg korábban például a ChatGPT csak gyors, egyszerű kérdésekre tudott válaszolni, mostanra eljutottak oda, hogy akár egy-egy matematikai problémát 90 percen keresztül is képesek elemezni, minden lépést ellenőrizni, a hibákat kijavítani, és akár oldalakon át írni logikailag összefüggő megoldásokat. Ennek következtében az MI kifinomultabb, hosszabb távú problémák megoldására is alkalmas lehet a jövőben, nemcsak az azonnali, könnyen ellenőrizhető válaszokra.


Miért jó, ha az MI azt is tudja, ha valamit nem tud?

A tapasztalatok szerint a modell egyik nagy előnye, hogy képes felismerni: ha nem biztos a helyes válaszban, inkább nem ír le semmit. Ez különösen fontos, mivel ezzel az MI jelentős lépést tesz a hírhedt “hallucinációs” problémák leküzdésében. Ezzel szemben a legtöbb nyelvi MI még hajlamos hasraütésszerűen válaszolni akkor is, ha fogalma sincs a helyes megoldásról. Ha ezt a tulajdonságot sikerül stabilan beépíteni, az MI használata a mindennapokban is sokkal biztonságosabbá válhat.

Tanulságok és következő lépcsők

Az OpenAI munkája általánosítható: az MI hosszabb ideig, összetettebb problémákon is képes dolgozni, közben rendszeresen ellenőrzi önmagát, és aránylag kevés hibával produkál órákon átívelő, összefüggő szövegeket. Egy-egy megoldás akár 5–10 oldal hosszú is lehet – olyan egységes minőségben, amire a korábbi mesterséges intelligencia modellek még nem voltak képesek.

Fontos, hogy bár a mostani fejlesztések nem részei például a GPT-5-nek, a csapat már dolgozik azon, hogy ezek a képességek hamarosan a szélesebb körben használható MI-modellekben is megjelenjenek. Ennek köszönhetően egyre közelebb kerülünk ahhoz, hogy az MI ne csak ügyes segéd legyen, hanem valódi, emberi szintű partner a gondolkodásban és problémamegoldásban.

2025, adminboss, www.scientificamerican.com alapján

  • Te milyen problémát bíznál legszívesebben egy mesterséges intelligenciára?
  • Ha te lennél az, aki hibázik egy nehéz feladatban, hogyan ellenőriznéd magad?
  • Szerinted etikus, ha az ember a döntéseit részben egy ilyen MI-re bízza?



Legfrissebb posztok

A legolcsóbb ChatGPT-előfizetésről most lemaradunk

MA 13:01

A legolcsóbb ChatGPT-előfizetésről most lemaradunk

🙁 India kivételével a világ minden részén várni kell az OpenAI új fizetős ChatGPT-csomagjára. A GPT Go előfizetés csak 4 dollárba (kb. 1460 forint) kerül, Indiában pedig 399 rúpiáért...

Laborban jött létre az üstökösből született szupergyémánt

MA 12:51

Laborban jött létre az üstökösből született szupergyémánt

💎 Különösen fontos hangsúlyozni, hogy kínai kutatóknak végre sikerült előállítaniuk a lonsdaleit nevű, vagyis meteoritgyémánt néven ismert anyag laboratóriumi változatát, amely várhatóan akár 50%-kal is keményebb lehet a Földön...

Az Office 365 ismét leállt: egyetlen apró beállítás kavarta fel Amerikát

MA 12:26

Az Office 365 ismét leállt: egyetlen apró beállítás kavarta fel Amerikát

⚠ Szerdán, brit idő szerint dél körül, újabb komoly leállás érte a Microsoft felhőalapú irodai szolgáltatását: a felhasználók nem fértek hozzá az Office.com-hoz, és órákon át problémákkal szembesültek. A...


MA 11:50

Az új MI étteremkereső 180 országban támad

A Google MI Módja már 180 országban elérhető, messze túllépve az USA, az Egyesült Királyság és India határain, és hamarosan további régiók is csatlakoznak. A mesterséges intelligencia egyre...

Az új Meta okosszemüveg végre nem kerül egy vagyonba

MA 11:26

Az új Meta okosszemüveg végre nem kerül egy vagyonba

A Meta hamarosan bemutatkozó, kijelzős okosszemüvege várhatóan jóval olcsóbban érkezik, mint ahogy eddig pletykálták: a friss értesülések szerint 800 dollárért, átszámítva körülbelül 292 ezer forintért lesz elérhető, nem...

Az arcfelismerés csak a laborban működik jól?

MA 11:01

Az arcfelismerés csak a laborban működik jól?

Az arcfelismerő technológiát világszerte egyre több helyen vezetik be, arra hivatkozva, hogy a laboratóriumi tesztek kiemelkedő eredményeket mutatnak. A valóságban azonban, az Oxfordi Egyetem kutatóinak tapasztalatai szerint, ezek...

Az ott felejtett kütyük – ezeket most nem gyártja a Google

MA 10:53

Az ott felejtett kütyük – ezeket most nem gyártja a Google

A Google jelenleg semmilyen tabletet, okosgyűrűt, hajlítható kagylótelefont vagy okosszemüveget nem fejleszt. Bár partnerei, például a Samsung és a Motorola, egyre több hajlítható kijelzős mobillal állnak elő –...


MA 10:39

Az angliai vízhiány tényleg lehetséges?

Az angliai víztározók kapacitása mindössze 67,7%-ra csökkent, ami évtizedes negatív rekord. Az ország folyói és felszín alatti vizei is kivételesen alacsonyak, emiatt egész Angliában locsolási tilalom lépett életbe,...

Az Erin hurrikán lecsap az esővel sújtott Karib-térségre

MA 10:27

Az Erin hurrikán lecsap az esővel sújtott Karib-térségre

🌀 A Karib-térség több szigetét újabb, intenzív vihar sújtja: az Erin hurrikánt vasárnapra visszasorolták a harmadik kategóriába, de továbbra is heves esőzéseket és erős szélviharokat hoz magával, miközben a...