Az automatizált matematikai bizonyítás új trükkje, puzzleként közelítenek a problémákhoz

Az automatizált matematikai bizonyítás új trükkje, puzzleként közelítenek a problémákhoz
Az elmúlt évtizedben Marijn Heule nevét világszerte feljegyezték a matematikai világ legmakacsabb problémáinak megoldása kapcsán. Ezek a feladatok évtizedeken át ellenálltak minden próbálkozásnak, mígnem Heule sikerrel forgatta a matematikai automatizálás svájci bicskáját: a kielégíthetőségi (SAT) programokat. Most, a Carnegie Mellon Egyetem számítógépes bizonyításokat segítő kutatócsoportjának tagjaként úgy véli, hogy ha a SAT-eszközöket MI-nyelvi modellekkel kombinálják, olyan szintre emelhetők, ahol már tényleg az emberfeletti matematikai felfedezések is elérhetővé válnak.

Mi fán terem a SAT?

A SAT (kielégíthetőségi) probléma az MI egyik alapvető eleme, bár gyökeresen más irányból közelíti meg a mesterséges intelligencia fogalmát, mint a ChatGPT vagy a képgenerátorok. A SAT szimbolikus MI, vagyis régi vágású, szabályalapú intelligencia, amely eldöntendő állításokra épül: ezek mindössze két értéket vehetnek fel, igazat vagy hamisat, amelyeket szigorú logikai láncok kötnek össze. Ha egy kérdést ilyen alapállításokra lehet bontani, akkor a SAT-programok gyakran képesek hibátlan és zárt levezetést adni: ezt nevezzük automatikus bizonyításnak. Az ilyen bizonyítások néha több ezer vagy akár millió lépésből állnak, de logikailag kifogástalanok.

Lényeges hangsúlyozni, hogy Heule sikere abban rejlik, hogyan tudja a matematikai problémákat „jól” átállítani, hogy a SAT-eszközök ráharapjanak. Gyerekkorától vonzódik a rejtvénylogikához, első százdarabos kirakóját már egyévesen megoldotta – és a Delft Műszaki Egyetemen, majd számítástechnikai doktori tanulmányaiban tovább tökéletesítette ezt a gondolkodásmódot. Tudományos pályájának egyik sarkköve a kérdés: miként lehet a gondolkodást automatizálni? Tapasztalatai szerint a gépi bizonyítás sosem pontosan úgy működik, mint az emberi logika, hanem teljesen más szemléletmód kell hozzá.

Puzzle vagy számítás?

A SAT-feladat egy adott probléma bináris, azaz csak 0-t vagy 1-et tartalmazó állításokra való fordításából áll. Képzelj el egy óriási sudoku táblát, ahol minden négyzetbe csak 0 vagy 1 kerülhet, és adottak a szabályok is: minden sorban és oszlopban milyen eloszlásnak kell teljesülnie. Nem könnyű, de hihetetlenül erős problémákat lehet ezzel a módszerrel kezelni – legyen szó hardverellenőrzésről, szoftverellenőrzésről, munkaidő-beosztásról vagy akár absztrakt matematikai fejtörőkről.

Holott elsőre úgy hangzik, mintha sima bináris számításról lenne szó, a SAT megközelítése teljesen eltér a hagyományos programozástól. Míg a hagyományos szoftverek műveleteket hajtanak végre kiinduló adatokon, a SAT-algoritmusok lehetséges kombinációkat kutatnak fel: kizárják azt, ami nem működik, logikai ugrásokkal szűkítik a lehetőségeket, míg meg nem találják a kielégítő megoldást, vagy rá nem jönnek, hogy nincs ilyen.

Mit adhat az MI a SAT mellé?

Heule egyik fő tudománya, hogy ösztönösen ráérez a megfelelő problémareprezentációra – hogyan lehet úgy kódolni egy matematikai kérdést, hogy a SAT-program a legnagyobb erejét mutassa meg. Az igazi áttörés akkor várható, ha ezek az átváltások maguktól is, automatikusan történhetnek: vagyis ne kelljen minden alkalommal egy „kódoló zsenit” közbeiktatni. Ha a nagy nyelvi modelleket (LLM-eket) számos jó példával tanítják be ilyen átváltásokra, akkor messze a legtöbb felhasználónál jobb SAT-kódolásokat tudnak létrehozni. A legnagyobb kihívás ilyenkor annak ellenőrzése, hogy tényleg helyes-e a fordítás.


A matematikai folyamat megújulása

Lényeges hangsúlyozni, hogy a generatív MI rengeteg hihető segédtételt (lemmát) tud alkotni, ám ezek helyességét csak automatikus eszközök tudják ténylegesen ellenőrizni. Ha valami mégsem stimmel, a SAT-program konkrét ellenpéldát tud visszaadni – lehetőleg a legegyszerűbbet, ami azonnal megvilágítja a bukást. Ezek az ellenpéldák segítik az MI-t, hogy már legközelebb pontosabban találja el, mit javasoljon.

Ehhez társulhatnak a bizonyításellenőrző rendszerek, például a Lean, amely minden részletet, minden kapcsolódást leellenőriz. Így az MI szervezi a főbb lépéseket, az automatizált bizonyítás mindent átnéz, a Lean pedig azt ellenőrzi, hogy tényleg egy összefüggő egészet alkotnak a mozaikdarabok. Amíg a rendszer végig hitelesen működik, addig bátran lehet rá építeni, és tovább haladni.

Bizalom kontra érthetőség

Az automatizált bizonyítások gyakran olyan hosszúak és komplexek, hogy ember számára átláthatatlanok. Kritikusai ki is emelik: valódi értelmet veszít, ha nem fogja fel senki, mi történik. De Heule szerint az érthetőség túlértékelt, a bizalom pedig alulértékelt a matematikában. Nincs olyan élő matematikus, aki mindent átlát – de ha minden kis részletről megbízható számítógép-ellenőrzés mondja ki, hogy helyes, akkor már van mire alapozni a következő felfedezéseket. Összességében elmondható, hogy a gépi bizonyítás épp az emberi munka megbízhatóságán javíthat drámaian.

Mi marad az emberi matematikusnak?

Bár a SAT-programok a bizonyítás kulcslépéseit elvégzik, az emberi kreatív ráérzés, a konceptuális megközelítés továbbra is pótolhatatlan. A gépek egyedül nem érnek semmit, ha nincsenek olyan emberek, akik a problémát jól átlátják, új kereteket találnak, és a saját intuíciójukat átadják a rendszernek. Az MI, az automatizált bizonyítások és a matematikusok csak együtt képesek az igazán nagy áttörésekre. A varázslat az együttműködésben rejlik.

2025, adminboss, www.quantamagazine.org alapján

Legfrissebb posztok

csütörtök 12:25

A 6 legbénább szexuális célzás a marketing történelemben

A szex használata a reklámban egyidős annak létrejöttével. Ezer százalék, hogy az első reklámban ami az első kereket reklámozta, rögtön kettőt raktak egymás mellé, hogy egy pár cickóra hasonlítson...

kedd 14:10

Egy könyvvel az ellenség szívéhez – Franklin megdöbbentő módszere

Egy nap eszébe jutott valami merész és szokatlan. Tudta, hogy ellenfelének könyvtárában számos ritka és értékes kötet található, melyekre nagy becsben tartott, és az is köztudott volt, hogy igazi büszkesége egyik különleges könyv volt, amelyet csak kevesen olvashattak...

MA 10:44

Észak-koreai hackerek egy gombnyomással törölhetik az Androidodat

🕵 Az utóbbi hetekben Észak-Korea hírhedt APT37-es hackercsoportja új módszerrel támad dél-koreai célpontokat: a Google Eszközkereső (Find My Device) szolgáltatást használják arra, hogy Android-készülékeket távolról töröljenek, ellehetetlenítve az áldozatok hozzáférését adataikhoz...

MA 10:37

A Gemini asszisztens lassan indul, a Google Home még zűrzavaros

💡 A Google okosotthonos eszközein új szakasz kezdődött: a lassan elérhetővé váló Gemini hangasszisztens átveszi az irányítást a Google Home hangszórói és kijelzői felett...

MA 10:30

Izraeli MI-avatárok tarolnak, a Kaltura ismét nagyot lépett

A New York-i székhelyű, MI-alapú videoplatformjairól ismert Kaltura idén közel 10 milliárd forintért (27 millió USD, kb...

MA 10:23

Kanada elvesztette a kanyarómentes státuszát: újra terjed a járvány

😷 Kanada hivatalosan elvesztette a kanyarómentes státuszát, miután a 2024-ben kezdődött, hosszan tartó járvány megszakítás nélkül terjed az országban...

MA 10:16

Az intersztelláris üstökös nem földönkívüli, mégis izgalmasabb

Az űrkutatás világában fel-fellángolnak a találgatások, amikor egy új égi jelenség tűnik fel, és az idegenek témája szinte mindig előkerül...

MA 09:57

Kanada elveszítette a kanyarómentességet, újra itt a járvány

😷 Kanada 1998-ban még teljesen felszámolta a kanyarót, most azonban a rendkívül fertőző vírus ismét endémiásnak számít az országban...

MA 09:51

Homerek özöne lepi el Springfieldet, új Fortnite-őrület söpör végig

😂 Több mint egy hét telt el azóta, hogy Springfield beköltözött a Fortnite-ba, és máris őrületes újdonságok érkeznek...

MA 09:43

Az új MI-s Google Home, káosz vagy valódi okosotthon?

A Google új, MI-alapú Gemini hangasszisztensét fokozatosan vezetik be az okoskijelzőkre és okoshangszórókra, de a felhasználói tapasztalatok alapján egyelőre rengeteg a zavar és a hiányosság...

MA 09:37

Már az MI irányítja az első műholdat az űrben

🚀 Külön figyelmet érdemel, hogy először sikerült mesterségesintelligencia-alapú vezérlővel irányítani egy műhold helyzetét az űrben...

MA 09:29

Az agy vegyülete, amely a gyermekkori traumákat őrzi

Amerikai és kanadai kutatók egy korábban ismeretlen agyi vegyület, az SGK1 fehérje szerepét tárták fel a depresszió és az öngyilkossági gondolatok kialakulásában olyan embereknél, akik gyermekként traumát vagy komoly nehézségeket éltek át...

MA 09:15

Az új Tesla-trükk: bérlés napi 22 ezerért, Hertznek annyi?

A Tesla riválisként lép be az autókölcsönzés piacára: mostantól San Diegóban és Costa Mesában három-négy napra is bérelhetők Teslák, már napi 22 ezer forinttól (60 USD)...

MA 09:09

Az FDA leveszi a veszélyjelzést a változókori hormonkezelésekről

💪 Az Egyesült Államok Élelmiszer- és Gyógyszerügyi Hivatala (FDA) visszavonta a menopauza (változókor) idején alkalmazott hormonpótló terápiák (HRT) korábban alkalmazott, úgynevezett fekete dobozos egészségügyi figyelmeztetéseit...

MA 09:01

Az új Firefox végre keresztbe tesz a digitális nyomkövetőknek

🔒 A Firefox 145-ös verziójába érkező frissítés tovább nehezíti az internetezők követését digitális ujjlenyomat‑alapú módszerekkel...

MA 08:51

Az ókori paróka titka: 3400 éves egyiptomi hajzselé

Több mint három évezreddel ezelőtt Luxorban, az ókori Théba városában temették el Merit asszonyt, fején egy különleges, emberi hajból készült parókával...

MA 08:45

Mi történik az MI-vel, ha töröljük a memóriáját?

A mesterséges intelligencia (MI) szédületes előretörése mögött bonyolult ideghálózatok állnak, amelyek két alapvető „képességre” támaszkodnak: a memorizálásra és a következtetésre...

MA 08:37

Az ősi kelta koponyafúró szerszám újra előkerült Lengyelországban

Lengyel régészek egy különleges, 2300 éves, vaskori koponyafúró szerszámot találtak a közép-kelet-lengyelországi Mazóvia régiójában, Ysa Gra kelta településén...

MA 08:16

A Kaltura felvásárolta az izraeli MI-alapú avatarokat készítő eSelfet

👤 A New York-i székhelyű Kaltura, egy MI-vezérelt videóplatform, 27 millió dollárért (kb...