Az MI könnyedén legyőzi a tinédzsereket a Nemzetközi Matematikai Olimpián

Az MI könnyedén legyőzi a tinédzsereket a Nemzetközi Matematikai Olimpián
Az OpenAI fejlesztői idén szintet léptek: olyan általános célú MI-modellt képeztek ki, amely a Nemzetközi Matematikai Olimpia (IMO – International Mathematical Olympiad) aranyérmes szintjét érte el, méghozzá teljesen külső segítség nélkül. Ezzel nemcsak a bonyolult matematikai feladatmegoldás terén történt áttörés, hanem azt is bizonyították, hogy az MI egyre közelebb kerül az emberi logikai gondolkodás elsajátításához.

Az első MI az élmezőnyben: minek kell ehhez felkötni a gatyát?

Júliusban rendezték meg Ausztráliában, a Sunshine Coaston az idei IMO-t, ahol több mint 100 országból érkező diákok kaptak hat elképesztően nehéz feladatot, hogy két nap alatt bizonyítsák, ki a legjobb matematikából. A feladványok abban különböznek a megszokottaktól, hogy rövid válasz helyett oldalakon átívelő, egyedi logikai fejtegetésekre van szükség – ez az a szint, amire az MI-k eddig ritkán voltak képesek.

Egy háromfős OpenAI csapat (Alex Wei, Sheryl Hsu, Noam Brown) azonban nagyot kockáztatott: általános célú, lépésről lépésre gondolkodó modellt tanítottak be a problémák megoldására. A szabályok szigorúak voltak: semmilyen eszközt, internetkapcsolatot, keresőt vagy speciális matematikai szoftvert nem használhattak. Az MI a diákokhoz hasonlóan két 4,5 órás etapban dolgozott, és a dolgozatai értékelését három korábbi IMO-érmes, valamint egy vezető matematikus végezte.

Az eredmény döbbenetes: a hat feladatból ötöt hibátlanul oldott meg, és 35 pontot szerzett a maximális 42-ből – pontosan azt a minimumot, amelyért aranyérem jár. Összehasonlításként: a 630 résztvevő közül csak 26-an tudtak nála jobbat elérni, közülük is csupán öt diák érte el a maximális pontszámot. Az OpenAI MI-je néhány évvel korábban még általános iskolai matekpéldákkal is megszenvedett – ilyen gyors fejlődést ritkán látni ezen a területen.

Általános célok, nem szimpla matekrobot

A csapat nem pusztán matematikai MI-t akart fejleszteni. A cél az volt, hogy olyan rendszert hozzanak létre, amely képes bármilyen összetett, árnyalatokkal teli problémán keresztül gondolkodni, vagyis közelítsen az emberi értelmező és problémamegoldó képességhez. Ezzel szemben a legtöbb alkalmazott MI eddig csak egy szűk területen – például képfelismerés vagy adatbáziskezelés – volt igazán jó.

Azért választották az IMO-t, mert ott objektív, egyértelműen értékelhető bizonyításokat kell írni. Ez kiváló próbaterepe az MI fejlődésének. Azt is hangsúlyozták, hogy a fejlesztés során minden részmegoldást úgy dolgoztak ki, hogy az ne csak matematikában, hanem más területeken is alkalmazható legyen.

Meddig tart egy MI “gondolkodása”?

A fejlődés abban is meglátszik, hogy mennyi ideig képes az MI folyamatosan, fókuszáltan dolgozni egy összetett feladaton. Míg korábban például a ChatGPT csak gyors, egyszerű kérdésekre tudott válaszolni, mostanra eljutottak oda, hogy akár egy-egy matematikai problémát 90 percen keresztül is képesek elemezni, minden lépést ellenőrizni, a hibákat kijavítani, és akár oldalakon át írni logikailag összefüggő megoldásokat. Ennek következtében az MI kifinomultabb, hosszabb távú problémák megoldására is alkalmas lehet a jövőben, nemcsak az azonnali, könnyen ellenőrizhető válaszokra.


Miért jó, ha az MI azt is tudja, ha valamit nem tud?

A tapasztalatok szerint a modell egyik nagy előnye, hogy képes felismerni: ha nem biztos a helyes válaszban, inkább nem ír le semmit. Ez különösen fontos, mivel ezzel az MI jelentős lépést tesz a hírhedt “hallucinációs” problémák leküzdésében. Ezzel szemben a legtöbb nyelvi MI még hajlamos hasraütésszerűen válaszolni akkor is, ha fogalma sincs a helyes megoldásról. Ha ezt a tulajdonságot sikerül stabilan beépíteni, az MI használata a mindennapokban is sokkal biztonságosabbá válhat.

Tanulságok és következő lépcsők

Az OpenAI munkája általánosítható: az MI hosszabb ideig, összetettebb problémákon is képes dolgozni, közben rendszeresen ellenőrzi önmagát, és aránylag kevés hibával produkál órákon átívelő, összefüggő szövegeket. Egy-egy megoldás akár 5–10 oldal hosszú is lehet – olyan egységes minőségben, amire a korábbi mesterséges intelligencia modellek még nem voltak képesek.

Fontos, hogy bár a mostani fejlesztések nem részei például a GPT-5-nek, a csapat már dolgozik azon, hogy ezek a képességek hamarosan a szélesebb körben használható MI-modellekben is megjelenjenek. Ennek köszönhetően egyre közelebb kerülünk ahhoz, hogy az MI ne csak ügyes segéd legyen, hanem valódi, emberi szintű partner a gondolkodásban és problémamegoldásban.

2025, adminboss, www.scientificamerican.com alapján

  • Te milyen problémát bíznál legszívesebben egy mesterséges intelligenciára?
  • Ha te lennél az, aki hibázik egy nehéz feladatban, hogyan ellenőriznéd magad?
  • Szerinted etikus, ha az ember a döntéseit részben egy ilyen MI-re bízza?



Legfrissebb posztok

MA 08:36

Kalifornia végleg búcsút int a szénnek: mi jön most?

Kalifornia hamarosan teljesen megszünteti a szénalapú áramtermelést, miután jövő hónapban leáll az utolsó, szénnel működő Intermountain erőműből (Közép-Utah-i Intermountain Erőmű, eredetiben: Intermountain Power Plant) érkező villamos energia...

Az internet, ahol igazolnod kell magad
MA 08:28

Az internet, ahol igazolnod kell magad

Az online pornó elérése egyre szigorúbb korhatár-ellenőrzéshez kötött, de hamarosan a közösségi médiában is hasonló szabályozás várható...

Az egész világ zöldül, miközben az USA hátráltat
MA 08:19

Az egész világ zöldül, miközben az USA hátráltat

🌱 A globális megújulóenergia-piac minden amerikai politikai akadály ellenére új rekordot döntött az idei év első felében: világszerte soha nem látott mértékű beruházás érkezett a szél- és napenergiába...

Oscal Tank 1: A telefon, amely félig trükkből lett szörnyeteg
MA 08:10

Oscal Tank 1: A telefon, amely félig trükkből lett szörnyeteg

Brutális, 20 000 mAh kapacitású akkumulátorával az Oscal Tank 1 új szintre emeli a strapabírás fogalmát...

Az air fryer használatánál sokan elkövetik ezeket a hibákat, te is?
MA 08:03

Az air fryer használatánál sokan elkövetik ezeket a hibákat, te is?

Az air fryerek az elmúlt tíz évben óriási fejlődésen mentek keresztül: ma már minden pénztárcához és igényhez találni megfelelőt, ráadásul sokkal több funkcióval, mint kezdetben...

Az inflációs visszatérítésre hivatkozó átverés csapja be a New York-iakat
MA 07:55

Az inflációs visszatérítésre hivatkozó átverés csapja be a New York-iakat

💸 New York államban újabb digitális átverési hullám indult, amely ezúttal az úgynevezett „inflációs visszatérítés” nevében próbálja átverni a lakosokat...

A Samsung háromszor hajlítható mobilja jön, vagy nem jön?
MA 07:46

A Samsung háromszor hajlítható mobilja jön, vagy nem jön?

Egyre valószínűbb, hogy a hónapok óta pletykált Samsung Galaxy háromszor hajlítható telefonja (tri-fold mobilja) nemcsak Dél-Koreában és Kínában lesz elérhető, hanem akár világszerte is bemutatkozhat...

Veszélyben a Föld, ha eltűnnek a korallzátonyok
MA 07:38

Veszélyben a Föld, ha eltűnnek a korallzátonyok

🌍 A Föld drámai „új valóságba” lépett, miután a meleg vizes korallzátonyok elérték első jelentős klímafordulópontjukat...

Az Apple M5 chipje már ezen a héten berobbanhat
MA 07:28

Az Apple M5 chipje már ezen a héten berobbanhat

Napokon belül megérkezhetnek az első készülékek, amelyekben az Apple vadonatúj M5 processzora dolgozik...