2025. 07. 20., 08:40

Az MI zsenivé válik: döbbent matematikusok kapitulálnak

Az MI zsenivé válik: döbbent matematikusok kapitulálnak
Május közepén harminc világhírű matematikus gyűlt össze egy titkos matematikai találkozóra Berkeleyben. Volt, aki az Egyesült Királyságból utazott Kaliforniába, hogy részt vegyen a különleges eseményen, ahol nemcsak egymással, hanem egy rendkívül fejlett MI-alapú chatbot ellen is versenyeztek. Az MI feladata az volt, hogy olyan matematikai kihívásokat oldjon meg, amelyeket kifejezetten azért dolgoztak ki, hogy próbára tegyék a képességeit. Két napon át PhD-szintű vagy annál is nehezebb példákkal bombázták a rendszert, és meglepődve tapasztalták, hogy az MI sok esetben gyorsan, kreatívan és helyesen válaszolt.

Kiemelkedő képességek az MI-től – ijesztő profizmus

A központi szereplő egy érvelő nagy nyelvi modell (reasoning large language model), konkrétan az OpenAI által fejlesztett o4-mini volt, amelyet speciálisan összetettebb problémamegoldásra programoztak. Ehhez hasonló rendszert a Google is fejleszt. Ezek a chatek nemcsak szöveget generálnak, hanem valódi, mély következtetéseket képesek levonni, gyorsan és logikusan oldanak meg bonyolult matematikai feladványokat.

A korábbi nagy nyelvi modellek (LLM-ek) csak a következő szó “kitalálására” voltak jók. Újabban azonban specializált adathalmazokon, emberi visszacsatolással fejlesztik őket, ami érezhetően javította a teljesítményüket. Az OpenAI saját megítélése szerint ezek a modellek ma már megoldatlan matematikai problémákkal is megbirkóznak.

Különleges kihívás: csak a legjobbak próbálkozhattak

A teszteléshez az Epoch AI választotta ki Elliot Glazer matematikust, hogy több szintű, egyre nehezedő feladatsorokat állítson össze az MI számára. Az első három szintet már 2025 tavaszán sikerült teljesítenie a rendszernek: az o4-mini a feladatok mintegy 20 százalékát megfejtette, köztük olyat is, amire csak kutatói szintű matematikusok képesek. Ezután következett a negyedik szint, amely a világon is csak néhány specialistának jelentene kihívást.

A résztvevőknek titoktartási szerződést kellett aláírniuk, és kizárólag a Signal alkalmazáson keresztül kommunikálhattak. Minden olyan példáért, amellyel az o4-mini végül nem boldogult, a beküldő 2,7 millió forintot (kb. 7 500 dollárt) kapott. Ennek ellenére nehezen találtak olyan kérdést, amivel az MI-t zavarba lehetett volna hozni.

Az MI valós időben megelőzi a legjobbakat

Május 17–18-án tehát élőben is összemérhették erejüket a kutatók az MI-vel. Hatfős csapatokban próbáltak olyan csapdákat állítani, amelyeket az ember még felfog, de az MI már nem tud kijátszani. Ken Ono, a Virginiai Egyetem professzora külön is kiemelte, hogy egy doktoranduszoknak is komoly kihívást jelentő példát adott fel az o4-nek, amely aztán tíz perc alatt hibátlan, jól dokumentált megoldással állt elő. Az MI előbb átfutotta a témakör összes elérhető szakirodalmát, majd kísérleti alapkérdéseken gyakorolt, mielőtt a bonyolultabb problémára tért volna át. Az MI magabiztos, néha szarkasztikus stílusban kommunikált: a végén odabiggyesztette, hogy nem szükséges hivatkozás, mert a rejtélyes számot ő maga számolta ki!

Ono elismeri: teljesen ledöbbent az MI gondolatmenetén; szerinte ilyen, emberi kutatói szintű érvelési képességet még egyetlen modellnél sem tapasztalt.


Kutatók kontra MI: elhalványul a különbség

Bár végül tíz olyan kérdést sikerült találni, amire az MI nem tudott válaszolni, minden jelenlévőt lenyűgözött, milyen kevésszer hibázott az MI egyetlen év fejlődése alatt. Ono ezt ahhoz hasonlította, mint amikor az ember egy tehetséges társszerzővel dolgozik; Yang Hui He, a londoni Mathematical Sciences Intézet matematikusa hozzátette: az MI többet oldott meg, mint amit egy kiváló doktorandusz el tudna végezni – és sokkal gyorsabban.

A kutatók ugyanakkor aggódnak az MI túlságosan magabiztos válaszstílusa miatt. He szerint az MI már most is képes “meggyőzés útján” bizonyítani: ha valaki túl határozottan állít valamit, a laikusok hajlamosak elhinni.

A találkozó végén már arról beszéltek: mi történik majd, ha a technológia a következő szintű problémákhoz, vagyis az ember számára is megoldhatatlan kérdésekhez ér. Lehet, hogy a matematikusok idővel inkább “ötletgazdák” és tanácsadók lesznek, az MI pedig új matematikai igazságokat tár fel. Ono szerint a jövő matematikusai számára a képzelőerő és a kreativitás fejlesztése lesz a kulcs az egyetemeken.

Az a gondolat, hogy az MI általános intelligenciája soha nem érheti el ezt a szintet, hibás és naiv – állítja Ono. Sőt, már most el kell ismerni: teljesítményével a világ legtöbb doktoranduszán is túlmutat.

2025, adminboss, www.livescience.com alapján

  • Te örülnél annak, ha az MI helyetted megoldaná a bonyolult feladatokat?
  • Te mit tennél, ha az MI túl magabiztosan állítana valamit, amit te nem értesz teljesen?
  • Szerinted etikus lenne, ha egy ember az MI-től származó eredményt a sajátjaként használná fel?


Legfrissebb posztok

vasárnap 21:56

A Google Cloud újabb botránya: ügyfélfiók letiltva, leállás figyelmeztetés nélkül

A Railway, amely világszerte több mint hárommillió felhasználót szolgál ki, május 19-én este súlyos leállást észlelt rendszereiben...

vasárnap 21:45

Az Xbox Games Showcase-en robbannak a nagy bejelentések

🎉 Az idei Summer Game Fest 2026 már napok óta tart, de a legizgalmasabb pillanatok még csak most következnek...

vasárnap 21:34

Az ENSZ szerint az MI felfalhatja a világ áramának 3%-át, vízválság jöhet

⚠ Az MI robbanásszerű fejlődése óriási terhelést jelenthet a Föld energia- és vízkészleteire a következő évtized során...

vasárnap 21:23

A kirúgást úgy élte meg, mintha megölték volna a párját

Scott Pelley, a híres amerikai hírolvasó, nyíltan beszélt távozásáról a CBS News-tól...

vasárnap 21:12

A téridőkristályok a meztelen szingularitások és mikroszkopikus fekete lyukak bölcsői?

💫 Új elméleti kutatás támasztja alá azt a feltételezést, hogy a téridőben kialakuló, matematikailag szabályos hullámminták – úgynevezett téridőkristályok – lehetnek a forrásai azoknak a titokzatos jelenségeknek, mint például a meztelen szingularitások vagy a mikroszkopikus fekete lyukak...

vasárnap 21:01

Hét év után visszatér Ariana Grande: elindult az Eternal Sunshine-turné

Hét év csend után végre újra turnéra indult Ariana Grande, aki szombat este Oaklandben adta első koncertjét az Eternal Sunshine-turné keretében...

vasárnap 20:34

Az Apple WWDC 2026: hol nézheted, mire számíthatsz?

📱 Közeleg a technológiai világ egyik legfontosabb eseménye, a WWDC 2026, amelynek középpontjában idén is az Apple új szoftverei állnak...

vasárnap 20:12

Celeste Rivas családja kimarad a d4vdről szóló dokumentumfilmekből, ügyvédjük szerint

🤔 Celeste Rivas családját sorra megkeresik különböző produkciós cégek, amelyek a lánynak és az énekes d4vd-nek tulajdonított kapcsolatáról szeretnének forgatni...

vasárnap 20:01

A Wall Street következő nagy dobása: a vagyon tokenizálása

💰 Abra hamarosan tőzsdére lép, miközben alapítója, Bill Barhydt hisz abban, hogy a kripto következő nagy dobása már nem a bitcoin árfolyamában, hanem az eszközök tokenizációjában rejlik...

vasárnap 19:56

Az első ideiglenes tiltás jöhet: New York határt húz a gigászi adatközpontoknak

Az Egyesült Államokban egyre nagyobb a társadalmi ellenállás a gigantikus adatközpontok építése ellen, New York pedig történelmi lépésre készül: a képviselők megszavazták, hogy egy évre felfüggesszék minden olyan adatközpont építését, amely csúcsterheléskor legalább 20 megawattot fogyaszt...

vasárnap 19:45

A 25 éves Xbox: botrányok, exkluzívumok, démonvadászat

Eltelt egy negyedszázad az első Xbox megjelenése óta, de a Microsoft játékrészlege nemcsak ünneplésre, hanem válságkezelésre is készül...

vasárnap 19:34

A 2026-os játékok legjobb mellékküldetései: Mina the Hollower

Bár több játékkal is egyszerre zsonglőrködöm, mindet félretettem, hogy a Mina the Hollower-rel foglalkozzak...

vasárnap 19:23

Az AI-tól a tech IPO-kig: több ok húzza le a bitcoint

Az utóbbi időben a bitcoin ára jelentős visszaesést mutat, és sokan keresik a fő okot...

vasárnap 19:01

A Helldivers 2 galaktikus hadjáratokra vált, jönnek a Szuperrombolók

🚀 A Helldivers 2 előtt izgalmas változások állnak, ugyanis még ebben a hónapban drasztikusan átalakul a galaktikus háború játékmenete...

vasárnap 18:56

Az új Joy-Con 2 töltő: egyszerűen működik, extrákra ne számíts.

A Genki Dual Wield töltője megoldja azt a mindennapi problémát, amikor egyszerre két Joy-Con 2 vezérlőpárt kell tölteni...

vasárnap 18:45

A botrány csak pletyka: az időjárás miatt marad el Morgan Wallen koncertje

Morgan Wallen countryénekes határozottan cáfolja a találgatásokat, hogy saját viselkedése állt volna a pittsburghi koncertje hirtelen lemondása mögött...

vasárnap 18:34

Az Ethereumnál nem válság, hanem stratégiai tisztulás – mondja Lubin

Felmerül a kérdés, hogy mennyire jelent problémát az Ethereum Foundation költségvetésének csökkentése és a munkatársak távozása...

vasárnap 18:23

Az agentikus MI megoldotta a kódolást, és leleplezte a szoftvermérnökség gondjait

Ez a jelenség jól illusztrálható azzal, hogy a fejlesztői csapatok soha nem írtak ilyen gyorsan kódot, mint most, az új generációs MI-rendszerek megjelenésével...

vasárnap 16:02

A 2026-os Tony-díjátadót így streamelheted élőben, bárhonnan

Lényeges, hogy a Broadway legnagyobb sztárjai idén is összegyűlnek New York ikonikus Radio City Music Hallban, hogy a 79...

vasárnap 15:57

Az Airwrap szinte tökéletes kihívója: Dreame AirStyle Era

Van egy eszköz, ami mostanában egyre több figyelmet kap a hajformázás világában: a Dreame AirStyle Era nyolc különböző fejjel érkezik, amelyek a legtöbb frizurához tökéletes alternatívát kínálnak...

vasárnap 15:34

A világ legmélyebb barlangja: titkok a Föld gyomrából

Két elképesztő mélységű barlang vetekszik a világ legmélyebb címéért, és mindkettő ugyanabban a hegyvonulatban lapul...

vasárnap 15:11

Végre összeállt a százéves Schrödinger-színelmélet

Erwin Schrödinger régóta fennálló elmélete végre kulcsfontosságú kiegészítést kapott, amelyet új kutatások tettek lehetővé arra vonatkozóan, hogyan érzékeljük a színek közötti eltéréseket...

vasárnap 14:56

A kiskapu, amivel ingyen nézheted a 2026-os Roland-Garros férfi döntőjét

👀 Az idei Roland-Garros meglepetésdöntője: Zverev és Cobolli csap össze a férfi egyes fináléban...

vasárnap 14:45

A Satisfactory éves nagy frissítése: eső, üzemanyag-kamionok, jobb járműútvonalak

Több mint egy év után ismét jelentős újdonságokkal bővül az építős őrület...

vasárnap 14:34

A Black Ops 7 4. szezonjában a fegyver céloz helyetted

🔫 Az új Call of Duty: Black Ops 7 4. szezonja olyan extra kényelmet kínál, hogy a leglustább játékosok is otthon érezhetik magukat benne...

vasárnap 14:03

Az évszázad legnagyobb biztonsági próbatétele: közeleg a gigászi világbajnokság

A 48 csapatos, 104 meccses futball-világbajnokság néhány nap múlva veszi kezdetét az Egyesült Államokban, Kanadában és Mexikóban, és ezúttal elképesztő méreteket ölt: az óriási tömegeken, a több országon és a rengeteg találkozón túl soha nem látott biztonsági együttműködést igényel...

vasárnap 13:56

Az ősnaprendszer elveszett világából szakadt ez az afrikai meteorit?

🚀 Egy különleges meteoritot fedeztek fel a Szaharában, amelyről a legújabb kutatások szerint egy rég megsemmisült „protoplanéta” maradványa lehet...

vasárnap 13:23

Az új BBC-sorozat: Tigrisek rejtett élete Nepál szívében

🐯 Erre jellemző példa, hogy a BBC ismét lélegzetelállító természetfilmet készített, ezúttal Tigris-sziget (Tiger Island) címmel...

vasárnap 12:56

A Cobolli–Zverev RG-döntő: hol nézhető ingyen – tévécsatornák

A férfi francia nyílt teniszbajnokság 2026-os döntője már most sporttörténelmi pillanatnak ígérkezik, hiszen se Carlos Alcaraz, se Jannik Sinner nem jutott el idáig, így mind Flavio Cobolli, mind Alexander Zverev előtt hatalmas esély kínálkozik arra, hogy első Grand Slam-győzelmét ünnepelje...