Az MI zsenivé válik: döbbent matematikusok kapitulálnak

Az MI zsenivé válik: döbbent matematikusok kapitulálnak
Május közepén harminc világhírű matematikus gyűlt össze egy titkos matematikai találkozóra Berkeleyben. Volt, aki az Egyesült Királyságból utazott Kaliforniába, hogy részt vegyen a különleges eseményen, ahol nemcsak egymással, hanem egy rendkívül fejlett MI-alapú chatbot ellen is versenyeztek. Az MI feladata az volt, hogy olyan matematikai kihívásokat oldjon meg, amelyeket kifejezetten azért dolgoztak ki, hogy próbára tegyék a képességeit. Két napon át PhD-szintű vagy annál is nehezebb példákkal bombázták a rendszert, és meglepődve tapasztalták, hogy az MI sok esetben gyorsan, kreatívan és helyesen válaszolt.

Kiemelkedő képességek az MI-től – ijesztő profizmus

A központi szereplő egy érvelő nagy nyelvi modell (reasoning large language model), konkrétan az OpenAI által fejlesztett o4-mini volt, amelyet speciálisan összetettebb problémamegoldásra programoztak. Ehhez hasonló rendszert a Google is fejleszt. Ezek a chatek nemcsak szöveget generálnak, hanem valódi, mély következtetéseket képesek levonni, gyorsan és logikusan oldanak meg bonyolult matematikai feladványokat.

A korábbi nagy nyelvi modellek (LLM-ek) csak a következő szó “kitalálására” voltak jók. Újabban azonban specializált adathalmazokon, emberi visszacsatolással fejlesztik őket, ami érezhetően javította a teljesítményüket. Az OpenAI saját megítélése szerint ezek a modellek ma már megoldatlan matematikai problémákkal is megbirkóznak.

Különleges kihívás: csak a legjobbak próbálkozhattak

A teszteléshez az Epoch AI választotta ki Elliot Glazer matematikust, hogy több szintű, egyre nehezedő feladatsorokat állítson össze az MI számára. Az első három szintet már 2025 tavaszán sikerült teljesítenie a rendszernek: az o4-mini a feladatok mintegy 20 százalékát megfejtette, köztük olyat is, amire csak kutatói szintű matematikusok képesek. Ezután következett a negyedik szint, amely a világon is csak néhány specialistának jelentene kihívást.

A résztvevőknek titoktartási szerződést kellett aláírniuk, és kizárólag a Signal alkalmazáson keresztül kommunikálhattak. Minden olyan példáért, amellyel az o4-mini végül nem boldogult, a beküldő 2,7 millió forintot (kb. 7 500 dollárt) kapott. Ennek ellenére nehezen találtak olyan kérdést, amivel az MI-t zavarba lehetett volna hozni.

Az MI valós időben megelőzi a legjobbakat

Május 17–18-án tehát élőben is összemérhették erejüket a kutatók az MI-vel. Hatfős csapatokban próbáltak olyan csapdákat állítani, amelyeket az ember még felfog, de az MI már nem tud kijátszani. Ken Ono, a Virginiai Egyetem professzora külön is kiemelte, hogy egy doktoranduszoknak is komoly kihívást jelentő példát adott fel az o4-nek, amely aztán tíz perc alatt hibátlan, jól dokumentált megoldással állt elő. Az MI előbb átfutotta a témakör összes elérhető szakirodalmát, majd kísérleti alapkérdéseken gyakorolt, mielőtt a bonyolultabb problémára tért volna át. Az MI magabiztos, néha szarkasztikus stílusban kommunikált: a végén odabiggyesztette, hogy nem szükséges hivatkozás, mert a rejtélyes számot ő maga számolta ki!

Ono elismeri: teljesen ledöbbent az MI gondolatmenetén; szerinte ilyen, emberi kutatói szintű érvelési képességet még egyetlen modellnél sem tapasztalt.


Kutatók kontra MI: elhalványul a különbség

Bár végül tíz olyan kérdést sikerült találni, amire az MI nem tudott válaszolni, minden jelenlévőt lenyűgözött, milyen kevésszer hibázott az MI egyetlen év fejlődése alatt. Ono ezt ahhoz hasonlította, mint amikor az ember egy tehetséges társszerzővel dolgozik; Yang Hui He, a londoni Mathematical Sciences Intézet matematikusa hozzátette: az MI többet oldott meg, mint amit egy kiváló doktorandusz el tudna végezni – és sokkal gyorsabban.

A kutatók ugyanakkor aggódnak az MI túlságosan magabiztos válaszstílusa miatt. He szerint az MI már most is képes “meggyőzés útján” bizonyítani: ha valaki túl határozottan állít valamit, a laikusok hajlamosak elhinni.

A találkozó végén már arról beszéltek: mi történik majd, ha a technológia a következő szintű problémákhoz, vagyis az ember számára is megoldhatatlan kérdésekhez ér. Lehet, hogy a matematikusok idővel inkább “ötletgazdák” és tanácsadók lesznek, az MI pedig új matematikai igazságokat tár fel. Ono szerint a jövő matematikusai számára a képzelőerő és a kreativitás fejlesztése lesz a kulcs az egyetemeken.

Az a gondolat, hogy az MI általános intelligenciája soha nem érheti el ezt a szintet, hibás és naiv – állítja Ono. Sőt, már most el kell ismerni: teljesítményével a világ legtöbb doktoranduszán is túlmutat.

2025, adminboss, www.livescience.com alapján

  • Te örülnél annak, ha az MI helyetted megoldaná a bonyolult feladatokat?
  • Te mit tennél, ha az MI túl magabiztosan állítana valamit, amit te nem értesz teljesen?
  • Szerinted etikus lenne, ha egy ember az MI-től származó eredményt a sajátjaként használná fel?


Legfrissebb posztok

vasárnap 20:50

A lenyűgöző égi csoda, amely vetekszik a Teremtés oszlopaival

💫 Lenyűgöző felvételt közölt a Gemini Obszervatórium fennállásának 25. évfordulóján: a fotón az NGC 6820 jelű emissziós köd és az NGC 6823 nyílt csillaghalmaz ragyog, mintha a híres Teremtés oszlopai (Pillars of Creation) párját látnánk...

vasárnap 20:33

A legsúlyosabb ciklon csapott le: ezrek otthona dőlt romba, százak haltak meg

💧 A legsúlyosabb természeti katasztrófa rázta meg Sri Lankát, ahol heves ciklon pusztított; a hegyvidéki tartományokban még mindig földcsuszamlások és áradások fenyegetik a lakosságot...

vasárnap 20:20

A monstrum Doogee V Max LR: telefon vagy szerszámosláda?

A Doogee V Max LR egészen új szintre emeli a strapatelefon fogalmát: nemcsak elképesztően masszív, de igazi energiabajnok is a 20500 mAh-s akkumulátorával...

vasárnap 20:02

Az elveszett indián falvak előkerültek – tényleg igaza volt John Smithnek?

🌍 Emellett a Rappahannock folyó mentén, Virginiában végzett ásatások során végre sikerült azonosítani azokat az ősi indián falvakat, amelyeket a Jamestownból ismert John Smith több mint 400 éve említett...

vasárnap 19:49

A Simogo új csomagja visszarepít az iPhone-játékok aranykorába

🎮 A mobiljátékok világában ma már ritkaságszámba mennek az igazán kreatív indie alkotások, de volt idő, amikor az App Store-nak köszönhetően a kis fejlesztőcsapatok is hatalmas közönséghez tudták eljuttatni ötleteiket...

vasárnap 19:34

Az elveszett szavak nyomában: miért fordíthatatlan néha a nyelv?

Több nyelvet beszélve feltűnhet, hogy bizonyos szavakat egyszerűen képtelenség lefordítani. Egy japán tervező vágyódik a mono no aware iránt, amely egyfajta letisztult, időtlen szépség – angolul, sőt magyarul sincs rá igazán megfelelő szó...

vasárnap 19:17

Az évszázad játéka visszatért – kezdődik a láz!

Az év vége felé közeledve senki sem unatkozik, hiszen a legendás játék, amely hosszú évek óta sokak toplistáján szerepel, most újra hódít...

vasárnap 19:02

Az Amazon nagy fúziója az MI-szuperszerverekkel

Tipikus eset, amikor a technológiai verseny nem az egyediség felé visz, hanem a legjobb, működő mintát másolják a nagyok...

vasárnap 18:51

Az olcsó boltok ára a szegények bőrére megy

Az Egyesült Államokban rengeteg család támaszkodik olyan bolthálózatokra, mint a Family Dollar vagy a Dollar General, hiszen ezek a boltok ígérik a legalacsonyabb árakat alapvető háztartási cikkekből...

vasárnap 18:33

Az okosszemüveg, amely rémálommá vált: 13 év Google Glass után

Amikor a Google Glass 13 évvel ezelőtt megjelent, az egész világ álmodozni kezdett arról, milyen lesz, ha számítógép költözik az arcunkra...

vasárnap 18:18

Az ABCC4 titkos hálózata: új trükk a sejtszabályozásban

Amikor egy sejt kívülről üzenetet kap, egy ciklikus AMP (cAMP) nevű molekulával közvetíti ezt a jelzést...

vasárnap 17:50

Az újszülöttek B-hepatitisz oltása kikerülhet a kötelezőkből

Az Egyesült Államok járványügyi központjának (CDC) oltási tanácsadó bizottsága az eddigi gyakorlattól eltérően már nem javasolja egységesen, hogy minden újszülött kapjon hepatitis B elleni oltást születése után...

vasárnap 16:49

Vége lehet Hollywood aranykorának az új Netflix–Warner Bros.-óriással?

🎥 Nehéz elhinni, de a Netflix és a Warner Bros. közötti friss felvásárlási megállapodás máris felforgatta a teljes hollywoodi piacot...

vasárnap 16:34

A házi csodachip: több mint ezerszeres ugrás a garázslaborban

Fontos kérdés, hogy meddig juthat el egy lelkes egyetemista, ha házilag, garázsban barkácsolja össze saját integrált áramköreit...

vasárnap 16:18

A pénzed turbója: egyszerű lépések a gyorsabb célokért

Rendszeres pénzügyi stressz: nem kell mindent túlbonyolítani A pénzügyek kezelése rengeteg ember számára jár állandó lelkiismeret-furdalással: folyamatosan azt sugallják, hogy a megtakarításon, a befektetésen és persze az adók optimalizálásán is dolgozni kell...

vasárnap 16:04

Az Xgimi Horizon 20 Max: Luxusmozi és gamer élmény egy projektorban

Ebből következően érdemes megérteni, hogy a hordozható projektorok piacán is megjelentek a valódi prémium modellek...

vasárnap 15:50

Az oroszországi aranyáldozatok rejtélye: 2400 éves kincs került elő

🏁 A dél-uráli Vysokaya Mogila sírmezőn egyedülálló, 2 400 éves áldozati komplexumot tártak fel orosz régészek, amely új fényt vet a nomádok temetkezési rítusaira...

vasárnap 15:35

Az ingatlanpiac, amely még Warren Buffettet is szabályszegésre csábította

Érdekes felvetés, hogy még a legendás Warren Buffett is hajlandó volt felrúgni saját, kőbe vésett szabályait a mostani ingatlanpiaci körforgásban...

vasárnap 15:04

Az óriás Doogee V Max Play: túlélőmobil vagy hordozható tégla?

A Doogee V Max Play nem aprózta el a strapatelefon fogalmát: ez a készülék méretével, tömegével és funkciókínálatával messze túlmutat a rutinos túrázók és kalandorok elvárásain...