2026. 03. 16., 20:34

Az MI áttörése: Itt a bizonyítások automatizálásának kora?

Az MI áttörése: Itt a bizonyítások automatizálásának kora?
A matematika világa épp most forradalmasodik: ahogy a mesterséges intelligencia egyre gyorsabban fejlődik, a matematikusok is egyre nehezebben látják előre, milyen szerepük marad a jövőben. Képzelj el egy korszakot, ahol minden lehetséges matematikai bizonyítás már elkészült, csupán egy kattintásra várva. De vajon mikor lesz mindez valóság, és vágynak-e egyáltalán erre a matematikusok?

Új játékosok a matematikai csatatéren

A matematikai kutatásokban kulcsszerepet játszó MI-óriások, mint az OpenAI vagy a Google DeepMind, már nem is burkolt céllal igyekeznek uralni a bizonyítások világát. A First Proof nemzetközi projekt például azért jött létre, hogy felmérje, mire képesek valójában a nagy nyelvi modellek a komoly matematikai kutatások területén. Most újabb tesztkör kezdődik, szigorú követelményekkel – csak azok az MI-cégek vehetnek részt, amelyek hajlandók teljes transzparenciát vállalni. Egészen pontosan mindenkivel szemben elvárás, hogy hozzáférést biztosítsanak a tesztelendő modellekhez.

Az elmúlt néhány hónapban a legfejlettebb nyilvános modellek már olyan érvényes bizonyításokat generáltak, amelyek ténylegesen segítik a matematikusok munkáját. Az első tesztkör minden várakozást felülmúlt: a csapat által választott tíz – addig publikálatlan – lemma közül az OpenAI modellje ötnél, a Google DeepMind Aletheia-ügynöke pedig hat esetben adott helyes bizonyítást. Ráadásul rendre más-más problémákat oldottak meg, vagyis a modellek kompetenciái egymástól jelentősen eltértek.

Mégis, mi vár ránk öt év múlva?

Sokan félik az MI térnyerését, de a szakma meghatározó szereplői között optimisták is akadnak. Daniel Litt, a Torontói Egyetem matematikusa szerint a következő öt évben a matematikusok hatékonyabbá válhatnak a technológia révén. Litt egy elképzelt világot ír le, ahol az MI által generált, végtelen matematikai bizonyítások könyvtárában bárki szabadon böngészhet. De szerinte a felfedezés és a megértés öröme mindig az emberé marad – a lényeg nem a gépies bizonyítás, hanem a megértés.

Később azonban hangsúlyozza, hogy a jelenlegi helyzet még messze nem tökéletes. Bár a modellek akár nyolc problémát is megoldottak, a próbálkozások túlnyomó része félresikerült: rengeteg oldalnyi hibás, de magabiztos szöveget állítottak elő. Az MI hajlamos hitelesen előadni tévesen értelmezett matematikai eredményeket, vagy elrejteni kritikus hibákat bonyolult számítások mélyén.

A minőség ára: Hogyan ítéljük meg a bizonyításokat?

A First Proof első köre rámutatott, milyen nehéz helyesen értékelni az MI által készített matematikai bizonyításokat. Egyes hibák annyira elemiek, hogy hozzáértő ember aligha követné el őket, a modellek azonban nem tudatosan tévednek – egyszerűen csak nem értik a teljes matematikai kontextust.

A következő körben a szervezők független, anonim matematikai szakértőket vonnak be a bírálatba, akiket támogatásokból és MI-cégek adományaiból fizetnek majd. Ugyanakkor az MI által írt, apró hibáktól hemzsegő bizonyítások mennyisége már most is az emberi értékelők kapacitását veszélyezteti: az értékelés lassú, a hibák felismerése rendkívül nehéz.


A hozzáférés szakadéka: Nyilvános kontra céges MI

Megdöbbentő különbség mutatkozott a nyílt és a céges MI-fejlesztések között. Miközben a First Proof előkészületi fázisában a legjobb nyilvános modellekkel mindössze két problémát sikerült helyesen megoldani, a Google és az OpenAI saját zárt modelljeikkel nyolcat is meg tudtak oldani. A nyílt MI-közösségi próbálkozások csak egy újabb problémát oldottak meg.

Ennek oka lehet, hogy a cégek fejlettebb, publikálatlan modelleket vagy speciális belső technikákat használnak, esetleg emberi szakértők segítségét is igénybe vették. A Google állítása szerint viszont emberi beavatkozás nélkül dolgozott. Az újabb forduló pontosan ezt az átláthatósági problémát próbálja megoldani: minden beérkező modellt közvetlenül a First Proof csapata fog tesztelni.

A matematika jövője a leggazdagabbak fókuszában

Kérdés, hogy az MI-cégek hajlandók lesznek-e teljesíteni az új feltételeket, vagy a matematikai MI-fejlesztés hamarosan visszaszorul a titkos laborok világába. A First Proof és társai az elkövetkező hónapokban akár meg is jósolhatják a matematika sorsát, hiszen most először fordult elő, hogy ez a szűk tudományos szféra a világ legvagyonosabb techcégeinek figyelmét is felkeltette.

A cél, hogy néhány éven belül magabiztosan lehessen tájékoztatni a fiatalokat arról, milyen lesz a matematikus szakma – ennek feltétele pedig az MI valódi képességeinek megértése.

2026, adminboss, www.scientificamerican.com alapján

Legfrissebb posztok

MA 20:45

A Wall Street figyelmeztet: az emberi piac nem bírja a gépsebességű kereskedést

Wall Street és a kriptovilág vezetői egyre komolyabb kihívást látnak abban, hogy a modern pénzügyi piacok az emberi tempó helyett már éjjel-nappal gépek által vezérelt, automatizált rendszerekre támaszkodnak...

MA 20:35

A Kaptár rendezője szerint Leon Kennedy hetvenévesen is visszatérhet

👷 Leon Kennedy visszatérése az A kaptár: Rekviem (Resident Evil: Requiem) ben minden rajongó számára örömteli pillanat volt...

MA 20:23

Az illat, amely egy csapásra a középkorba ránt

🚬 Van, aki szívesen költene 70 ezer forintot egy olyan parfümre, amely egy sárban dagonyázó középkori főhős világát idézi meg?..

MA 20:12

Az Edge szándékosan olvashatóan tárol jelszavakat – aranybánya közös gépeken

Érdemes megvizsgálni, hogy a Microsoft Edge böngészőjében tárolt jelszavak meglepően egyszerűen, olvasható formában jelenhetnek meg a számítógép memóriájában...

MA 20:01

A Bank of America szerint többet kellene kérni a GTA 6-ért

A Grand Theft Auto-rajongók mostanában két nagy kérdésen pörögnek: vajon csúszik-e a GTA 6 megjelenése, és mennyibe fog kerülni a játék?..

MA 19:56

A Solana felpörög, itt a Jito saját tárcás JTX-e

⚡ A Jito Labs egy vadonatúj, önőrizetű, tárcaalapú kereskedési platformot indított a Solana-hálózaton, amely villámgyors kereskedést és profi eszközöket kínál...

MA 19:46

Az iráni háború drágít: egy eldugott kaliforniai megyében 7 dollár a benzin

Kaliforniában olyan üzemanyagárak tarolják le a benzinkutakat, amire az országban máshol sincs példa: egy távoli, vidéki megyében már 7 dollár (kb...

MA 19:35

Az MI elbocsát, a Kongresszus tétlen – ki fog segíteni?

Amerikában egyre nő a bizonytalanság a munkahelyek jövőjét illetően, hiszen a mesterséges intelligencia térhódítása már nemcsak elméleti kérdés...

MA 19:23

Az Arsenal–Atlético BL-elődöntő visszavágó: hol nézhető, beharangozó

A londoni Emirates Stadionban ma este minden adott egy igazi futballünnephez: az Arsenal rendkívül közel került a Premier League trófeájához, így a szurkolók körében igazi karneváli hangulat uralkodik...

MA 19:12

Az Amazon e-mail szolgáltatásával elszabadult a tömeges adathalászat

Érdekes felvetés, hogy az Amazon egyik fontos szolgáltatása, a Simple Email Service a totális átverések célpontjává vált...

MA 18:56

A Microsoft szerint a Windows 11 frissítések most furcsák, de rendben vannak

Az utóbbi hónapokban a Windows 11 felhasználók többsége meglepődve tapasztalhatta, hogy a szokásos havi frissítések nem egy, hanem akár két-három újraindítást is igényelnek...

MA 18:45

A Coinbase a Centrifuge-re támaszkodik, részesedést is szerez

A Coinbase stratégiai partnerséget kötött a Centrifuge céggel, amely ezentúl a kriptoplatform alapértelmezett tokenizációs infrastruktúrája lesz...

MA 18:34

A kriptó igazi értéke a szabályozáson kívül van – állítja Arthur Hayes

A Bitcoin valódi ereje abban rejlik, hogy teljesen kívül áll a pénzügyi szabályozásokon...

MA 18:24

A búcsú és az új tulajdonosok: Letterman nekimegy a CBS-nek

👋 Míg az új tulajdonosok szemében a pénz a fő szempont, Letterman személyes és keserédes emlékeket idéz, és bírálja a csatorna döntéseit...

MA 17:13

Az új Spotify-trükkök: zseniális ötletek és totális mellényúlások

Az elmúlt hetekben számos fejlesztéssel rukkolt elő a Spotify, de a platform láthatóan még mindig nem lassít, hiszen hamarosan két új funkcióval bővülhet a kínálat...

MA 17:01

A Bitcoin fittyet hány a bizonytalanságokra: újra felfelé tör

💰 Fontos kérdés, hogy mennyire viseli meg a Bitcoin árfolyamát a világgazdasági bizonytalanság és az amerikai jegybanki kamatpolitika váratlan fordulata...

MA 16:56

Az új Resident Evilben tényleg újjászületnek a vérfagyasztó zombik?

Az új Resident Evil: Requiem egyik legnagyobb vonzereje Leon Kennedy, ám a zombik is szinte ugyanilyen erővel vonzzák a rajongókat...

MA 16:45

Az egyszemű óriás Matt Damonnal: a legek Odüsszeiája

Hadd ordítsam már bele a levegőbe, hogy Matt Damon ezúttal tényleg mindent belead!..

MA 16:23

Az Airwrap túl drága? Íme a legjobb feleáras alternatívák

💰 A hajformázás világát teljesen felforgatta az Airwrap megjelenése: a forró hengerek helyett irányított légárammal formázta a hajat, így kímélve azt...

MA 16:12

Az Andreessen Horowitz 800 milliárddal száll be a kriptóba

💸 Az Andreessen Horowitz (a16z) 2,2 milliárd dolláros, vagyis közel 800 milliárd forintos új kriptoalapot indított, hogy a következő tíz évben minden szakaszban segítse a blokklánc-startupokat...

MA 16:02

A mesterséges intelligencia tényleg elveszi a fiatalok munkáját?

Az MIT kutatója, Andrew McAfee szerint súlyos hiba lenne a kezdő munkaköröket teljesen automatizálni MI-vel...

MA 15:56

Az MI felforgatja a kriptovilágot: leépítésbe kezd a Coinbase

Érdekes fejlemény, hogy a kriptovaluta-ipar egyik legnagyobb szereplője jelentős létszámleépítéssel reagál a piaci kihívásokra és a mesterséges intelligencia térnyerésére...

MA 15:45

Az OpenAI majdnem Freeman lett – Muskot a Half‑Life ihlette

Az OpenAI egyik korai, kevéssé ismert fejezete most újabb részletekkel bővült: Elon Musk komolyan fontolgatta, hogy a vállalat neve Freeman legyen, utalva a Felezési idő (Half-Life) videojáték tudós főhősére...

MA 15:12

Az Nvidia Kína nélkül: stratégiai mesterhúzás vagy óriási öngól?

Az Nvidia teljesen elveszítette jelenlétét a kínai MI-chip­piacon, miután az amerikai exportkorlátozások életbe léptek...

MA 15:01

Az angol óriásbank újabb milliárdos dobása a kriptófronton

💰 Érdekes felvetés, hogy a hagyományos pénzügyi óriások egyre magabiztosabban lépnek be a kriptopiacra...

MA 14:56

Az év krimiszenzációja: összeérhetnek a Paradise-sorozatok?

Többek között évtizedek óta nem látott crossover-őrületre készülnek a BBC sikerszériái, és a Beyond Paradise negyedik évadának szereplői már teljes erőbedobással támogatják az ötletet...

MA 14:45

A Bullish az Equiniti felvásárlásával új pénzügyi infrastruktúrát épít

💰 Jól illusztrálja a trendet, hogy a nagyobb kriptoplatformok már nem csupán a digitális pénzek cseréjére koncentrálnak, hanem egyre inkább a hagyományos tőzsdei háttérinfrastruktúra teljes körű átalakítására is...

MA 14:24

Az eltűnt kanadai Emoji-tó nyomában: sosem látott katasztrófa

💧 Kanada egyik leglátványosabb tava, a Quebec tartományban található Lac Rouge, különös módon, néhány nap leforgása alatt teljesen eltűnt...

MA 13:56

Az Apple Wallet tényleg hamarosan kiváltja a plasztikkártyákat?

💳 A közelgő iOS-frissítések számos hasznos újítást hoznak az iPhone-felhasználók mindennapjaiba. Az iOS 26...