Az MI zsenivé válik: döbbent matematikusok kapitulálnak

Az MI zsenivé válik: döbbent matematikusok kapitulálnak
Május közepén harminc világhírű matematikus gyűlt össze egy titkos matematikai találkozóra Berkeleyben. Volt, aki az Egyesült Királyságból utazott Kaliforniába, hogy részt vegyen a különleges eseményen, ahol nemcsak egymással, hanem egy rendkívül fejlett MI-alapú chatbot ellen is versenyeztek. Az MI feladata az volt, hogy olyan matematikai kihívásokat oldjon meg, amelyeket kifejezetten azért dolgoztak ki, hogy próbára tegyék a képességeit. Két napon át PhD-szintű vagy annál is nehezebb példákkal bombázták a rendszert, és meglepődve tapasztalták, hogy az MI sok esetben gyorsan, kreatívan és helyesen válaszolt.

Kiemelkedő képességek az MI-től – ijesztő profizmus

A központi szereplő egy érvelő nagy nyelvi modell (reasoning large language model), konkrétan az OpenAI által fejlesztett o4-mini volt, amelyet speciálisan összetettebb problémamegoldásra programoztak. Ehhez hasonló rendszert a Google is fejleszt. Ezek a chatek nemcsak szöveget generálnak, hanem valódi, mély következtetéseket képesek levonni, gyorsan és logikusan oldanak meg bonyolult matematikai feladványokat.

A korábbi nagy nyelvi modellek (LLM-ek) csak a következő szó “kitalálására” voltak jók. Újabban azonban specializált adathalmazokon, emberi visszacsatolással fejlesztik őket, ami érezhetően javította a teljesítményüket. Az OpenAI saját megítélése szerint ezek a modellek ma már megoldatlan matematikai problémákkal is megbirkóznak.

Különleges kihívás: csak a legjobbak próbálkozhattak

A teszteléshez az Epoch AI választotta ki Elliot Glazer matematikust, hogy több szintű, egyre nehezedő feladatsorokat állítson össze az MI számára. Az első három szintet már 2025 tavaszán sikerült teljesítenie a rendszernek: az o4-mini a feladatok mintegy 20 százalékát megfejtette, köztük olyat is, amire csak kutatói szintű matematikusok képesek. Ezután következett a negyedik szint, amely a világon is csak néhány specialistának jelentene kihívást.

A résztvevőknek titoktartási szerződést kellett aláírniuk, és kizárólag a Signal alkalmazáson keresztül kommunikálhattak. Minden olyan példáért, amellyel az o4-mini végül nem boldogult, a beküldő 2,7 millió forintot (kb. 7 500 dollárt) kapott. Ennek ellenére nehezen találtak olyan kérdést, amivel az MI-t zavarba lehetett volna hozni.

Az MI valós időben megelőzi a legjobbakat

Május 17–18-án tehát élőben is összemérhették erejüket a kutatók az MI-vel. Hatfős csapatokban próbáltak olyan csapdákat állítani, amelyeket az ember még felfog, de az MI már nem tud kijátszani. Ken Ono, a Virginiai Egyetem professzora külön is kiemelte, hogy egy doktoranduszoknak is komoly kihívást jelentő példát adott fel az o4-nek, amely aztán tíz perc alatt hibátlan, jól dokumentált megoldással állt elő. Az MI előbb átfutotta a témakör összes elérhető szakirodalmát, majd kísérleti alapkérdéseken gyakorolt, mielőtt a bonyolultabb problémára tért volna át. Az MI magabiztos, néha szarkasztikus stílusban kommunikált: a végén odabiggyesztette, hogy nem szükséges hivatkozás, mert a rejtélyes számot ő maga számolta ki!

Ono elismeri: teljesen ledöbbent az MI gondolatmenetén; szerinte ilyen, emberi kutatói szintű érvelési képességet még egyetlen modellnél sem tapasztalt.


Kutatók kontra MI: elhalványul a különbség

Bár végül tíz olyan kérdést sikerült találni, amire az MI nem tudott válaszolni, minden jelenlévőt lenyűgözött, milyen kevésszer hibázott az MI egyetlen év fejlődése alatt. Ono ezt ahhoz hasonlította, mint amikor az ember egy tehetséges társszerzővel dolgozik; Yang Hui He, a londoni Mathematical Sciences Intézet matematikusa hozzátette: az MI többet oldott meg, mint amit egy kiváló doktorandusz el tudna végezni – és sokkal gyorsabban.

A kutatók ugyanakkor aggódnak az MI túlságosan magabiztos válaszstílusa miatt. He szerint az MI már most is képes “meggyőzés útján” bizonyítani: ha valaki túl határozottan állít valamit, a laikusok hajlamosak elhinni.

A találkozó végén már arról beszéltek: mi történik majd, ha a technológia a következő szintű problémákhoz, vagyis az ember számára is megoldhatatlan kérdésekhez ér. Lehet, hogy a matematikusok idővel inkább “ötletgazdák” és tanácsadók lesznek, az MI pedig új matematikai igazságokat tár fel. Ono szerint a jövő matematikusai számára a képzelőerő és a kreativitás fejlesztése lesz a kulcs az egyetemeken.

Az a gondolat, hogy az MI általános intelligenciája soha nem érheti el ezt a szintet, hibás és naiv – állítja Ono. Sőt, már most el kell ismerni: teljesítményével a világ legtöbb doktoranduszán is túlmutat.

2025, adminboss, www.livescience.com alapján

  • Te örülnél annak, ha az MI helyetted megoldaná a bonyolult feladatokat?
  • Te mit tennél, ha az MI túl magabiztosan állítana valamit, amit te nem értesz teljesen?
  • Szerinted etikus lenne, ha egy ember az MI-től származó eredményt a sajátjaként használná fel?


Legfrissebb posztok

MA 20:49

A botrány az OpenAI-nál: jönnek a reklámok a ChatGPT-be?

💥 A ChatGPT felhasználói az utóbbi hetekben bosszankodhattak, amikor a népszerű csevegőalkalmazás váratlanul népszerűsített bizonyos szolgáltatásokat...

MA 20:18

Az MI csiszolja a diákok írását, de a jegyeken nem segít

A brit Warwicki Egyetem csaknem 5000 hallgatói dolgozatot vizsgált tíz éven át, és azt találta, hogy 2022 óta, a ChatGPT megjelenése nyomán a diákok írása sokkal kifinomultabb, formálisabb és pozitívabb lett – miközben a jegyek gyakorlatilag nem változtak...

MA 20:02

A fordulat: az európai felhasználók visszavágnak a célzott reklámoknak

Az Instagram és a Facebook felhasználói az Európai Unióban hamarosan korlátozhatják, mennyi személyes adat alapján jelenjenek meg nekik hirdetések...

MA 19:49

Az Amazon MI-kollégákkal csábít, miközben tömegesen leépít

Az Amazon éves re:Invent konferenciáján Las Vegasban új munkahelyi jövőképet festett: az MI-ügynökök mostantól nem pusztán eszközök, hanem igazi kollégák lehetnek – miközben a cég újabb jelentős létszámleépítést hajt végre...

MA 19:34

Az újabb leminősítés padlóra küldte a Tesla részvényeit

📈 A Tesla részvényei 3%-ot estek hétfő reggel, miután a Morgan Stanley új elemzője, Andrew Percoco leminősítette a vállalat papírjait, visszavéve korábbi optimista álláspontját...

MA 19:19

Az olcsó óriás e-bringa: mire képes a Lectric XPress 750?

Nem mindennapi öröm, ha egy e-bike tényleg képes jól kiszolgálni a magasabb bicikliseket is...

MA 19:02

Az arany ára elszállt: ékszertulajdonosok, most figyeljenek!

💎 Az elmúlt évben az arany és más nemesfémek ára soha nem látott magasságokba emelkedett, ami az ékszerek értékét is jelentősen megdobta...

MA 18:49

A Paramount bekebelezné a teljes Warner Bros. Discoveryt

📦 A Paramount most 38 400 milliárd forint összegű, agresszív felvásárlási ajánlattal próbálja megszerezni a teljes Warner Bros...

MA 18:33

A bélflóra titkos fegyvere: a TMA és a cukorbetegség

🧠 Érdemes megvizsgálni, milyen fontos szerepet játszik az egészséges emésztőrendszer a cukorbetegség megelőzésében és kezelésében...

MA 18:18

A dugódíj véget vet a káosznak: fellélegezhet Manhattan

Lényeges, hogy a New York-i dugódíj 2025 eleji bevezetése látványos változásokat hozott a város életébe...

MA 16:34

Az igazi sokk: távozik Buffett befektetési jobbkeze

💸 Warren Buffett, a Berkshire Hathaway legendás vezére idén visszavonul, ennek előkészítéseként jelentős átalakításokat hajt végre a cégnél...

MA 16:18

A Tejútrendszer nem ütközésből született: kettős kémiai lenyomat árulkodik

🌌 Rejtélyes kémiai mintázatok bukkantak fel a Tejútrendszer csillagai között: két jól elkülöníthető csillagcsoport létezik, amelyek vas- és magnéziumtartalma jelentősen eltér...

MA 15:34

Az oroszok megint szigorítanak: tiltólistára kerül a FaceTime

Az orosz hatóságok újabb szintre emelték az online kommunikáció ellenőrzését: csütörtökön bejelentették, hogy korlátozzák az Apple videóhívó szolgáltatását, a FaceTime-ot...

MA 15:18

Az MI-böngészők tiltólistán: veszélyben az adataink

Egyre több szervezet kerül szembe az úgynevezett ügynökjellegű böngészőkkel, amelyek már messze túlmutatnak a megszokott böngészési élményen...

MA 15:02

A szárazság végezhetett az igazi hobbitokkal

🧙 A Homo floresiensis, ismertebb nevén a hobbit, egy kis termetű, ősi emberfaj képviselője, amely körülbelül 50 ezer évvel ezelőtt tűnt el a Föld színéről...

MA 14:49

A tűzoltás hanggal: víz nélkül is legyőzi a lángokat?

A heves erdőtűz gyorsan terjed a száraz bokrok között, és megközelíti a házakat, de az egyik otthon makacsul ellenáll a lángoknak...

MA 14:34

A Tesla új frissítése: túrázz a Mikulással, MI-vel

Megérkezett a Tesla 2025-ös ünnepi frissítése, amely minden eddiginél több újdonságot ígér...

MA 14:17

Az első olvadéksó-üzemanyag forradalmasítja az atomreaktorokat

Az amerikai Idaho Nemzeti Laboratórium előállította a világ első kloridalapú, olvadt sóból készült üzemanyagát gyorsreaktorokhoz...

MA 14:02

Az éghajlati válság házhoz jön – és végre észbe kapunk

🏖 A kommunikáció apró módosítása, például ha megemlítik a lakóhelyedet egy figyelmeztetésben, drámai módon növelheti a felkészülési hajlandóságot a természeti katasztrófákkal szemben...