2025. 11. 11., 15:33

Az MI találkozik a matematikai bizonyítással, vajon működik a páros?

Az MI találkozik a matematikai bizonyítással, vajon működik a páros?
Marijn Heule az utóbbi évtizedben számos matematikai rejtélyt oldott meg, amelyek évtizedek óta makacsul ellenálltak a matematikusok próbálkozásainak. E problémák, amelyek gyakran sci-fi regények kémtörténeteinek címeire emlékeztetnek, valójában a geometria és a kombinatorika legnehezebb kérdései közé tartoztak. Heule révén a kielégíthetőségi (SAT) módszertant, vagyis az egyik legsokoldalúbb informatikai eszközt sikerült olyan szintre emelni, hogy immár valódi áttörések születtek segítségével. A Carnegie Mellon Egyetem MI-kutatójának meggyőződése, hogy a SAT és a nagy nyelvi modellek (LLM-ek) ötvözése még komolyabb matematikai kihívásokat is megoldhat majd.

Miért fontos a SAT, és miért jelent ez forradalmat az MI-ben?

A SAT azon kevés területek egyike, ahol az MI félelmetesen pontos eredményeket képes produkálni – emberfelettieket is. Míg az eddigi LLM-alapú MI-k például sikerrel vettek részt a Nemzetközi Matematikai Diákolimpián (International Mathematical Olympiad), ezek mind olyan feladatok voltak, amelyeket a diákok is meg tudtak oldani. Fontos megjegyezni, hogy a SAT már olyan problémákat is megoldott, amelyekre emberi bizonyítás nincs.

Ezzel szemben a SAT lényege, hogy minden állítást kettősség jellemez: igaz vagy hamis – nincs átmenet. Ha egy problémát sikerül ebből az egyszerű binaritásból felépíteni, egy SAT-megoldó program garantáltan el tudja dönteni, hogy létezik-e a megkötéseket kielégítő megoldás, vagy sem. Ebből adódóan a SAT nem hagy teret a kétértelműségnek – ezért hívják automatikus érvelésnek.

Puzzle-gépek matematikusok helyett?

Heule saját bevallása szerint nem a matematika mély összefüggéseinek mestere, hanem abban penge, hogyan lehet egy problémát logikai puzzle-formátumra átfordítani. Azt is elmondja: már egyévesen 100 darabos kirakóst rakott ki, amikor még járni sem tudott. Egyetemi évei alatt Delftben kezdett foglalkozni a kielégíthetőséggel, azóta saját SAT-szoftvert írt, majd doktorált, és társszerzője lett a terület kézikönyvének. Szerinte a legizgalmasabb kérdés ma is az, hogy meddig lehet az érvelést automatizálni, és szükséges-e, hogy a gépek úgy vezessenek le bizonyításokat, ahogyan az emberek. Eddigi tapasztalatai alapján a válasz: nem, mert a gépek egészen más módon is célt érhetnek.

Hogyan lesz egy matematikai feladatból SAT-probléma?

A SAT lényege, hogy minden feladatot egyfajta logikai táblára kell fordítani. Képzelj el egy óriási szudoku-táblát, ahol minden mező vagy igaz, vagy hamis. A szabályokat megszabják az egyes sorok és oszlopok: hány igaz vagy hamis lehet bennük. Ha minden megkötést kielégítően kitöltöd a táblát, az már maga a bizonyítás. Fontos megjegyezni, hogy a világ legkülönbözőbb problémáit – az eredetileg nem is matematikai jellegűektől a hardverhibák keresésén át az ütemezési feladatokig – át lehet alakítani ilyen formátumra.

Az egyedülálló a SAT-megoldókban az, hogy ellentétben a hagyományos szoftverekkel, itt nem a lépésről lépésre végzett számítás a lényeg, hanem a lehetőségek gyors és ügyes kizárása. A gép a puzzle összes lehetséges kitöltését átfésüli, kizárja a hibásakat, és végül vagy talál megoldást, vagy bizonyítja, hogy nincs.


Mihez ad pluszt az MI–SAT házasság?

A kulcs minden esetben a helyes „kódolás”: hogyan fordítsd le a problémát SAT-nyelvre? Ezzel eddig leginkább Heule-féle specialisták bíbelődtek, de ha MI-tanítással rá lehet venni az LLM-et, hogy a jó példák bázisán önállóan is kitalálja a helyes kódolást, az forradalmasíthatná az egész matematikai felfedezést. Ezzel szemben óriási kihívás eldönteni, biztosan jó-e az MI által készített lefordítás.

Ennek a párosításnak az előnye abban rejlik, hogy az LLM rengeteg logikailag hihető lemmát, azaz köztes lépést tud javasolni, a SAT pedig azonnal ellenőrzi ezeket. Ha egy állítás hibás, rögtön előáll egy ellenpéldával – és ami még fontosabb, rögtön a legkisebb, legszemléletesebb ellenpéldát adja. Ez felbecsülhetetlen eszköz a matematikusi intuíció fejlesztéséhez és a sejtések pontosításához.

Mi marad az emberi matematikusoknak?

Sokan aggódnak, hogy az MI automatizált bizonyításai túlságosan hosszúak, érthetetlenek lesznek, és elveszik a matematikai „megértést”. Fontos megjegyezni, hogy a mai matematika sosem egyetlen ember fejében áll össze – mindenki csak egy kisebb részhez ért, amit egy közösségi bizalom köt össze. Az MI és a SAT kombinációja épp ezt a bizalmat helyezi előtérbe: minden egyes lépés precízen ellenőrizhető, minden bizonyítás és ellenpélda automatikusan felépül. Ha egy Lean-típusú formalizált ellenőrző réteg igazolja az egész bizonyításláncot, akkor valójában megbízhatóbbak lehetünk, mint a legtöbb klasszikus papíralapú eredménynél.

A jövő tehát nem az emberi matematikusok lecseréléséről szól. A kreatív intuíció, a felismerések, a friss ötletek továbbra is az emberek területe maradnak. Az MI és az automatikus érvelés a monoton, robotikus munkát veszi át, így a kutatók az igazán nagy ötletekre koncentrálhatnak. A varázslat itt mostantól a közös munkában rejlik.

2025, adminboss, www.quantamagazine.org alapján

Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Lively Letters – Phonics (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ImgRef (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) ContactVault Pro (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) FormatX: Video Audio Converter...

APP
péntek 09:11

APPok, Amik Ingyenesek MA, 6/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     FormatX: Video Audio Converter (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) War Mongrels (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Monthly Dystopia...

APP
csütörtök 09:11

APPok, Amik Ingyenesek MA, 6/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp:...

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...