2025. 11. 11., 07:31

Az automatizált matematikai bizonyítás új trükkje, puzzleként közelítenek a problémákhoz

Az automatizált matematikai bizonyítás új trükkje, puzzleként közelítenek a problémákhoz
Az elmúlt évtizedben Marijn Heule nevét világszerte feljegyezték a matematikai világ legmakacsabb problémáinak megoldása kapcsán. Ezek a feladatok évtizedeken át ellenálltak minden próbálkozásnak, mígnem Heule sikerrel forgatta a matematikai automatizálás svájci bicskáját: a kielégíthetőségi (SAT) programokat. Most, a Carnegie Mellon Egyetem számítógépes bizonyításokat segítő kutatócsoportjának tagjaként úgy véli, hogy ha a SAT-eszközöket MI-nyelvi modellekkel kombinálják, olyan szintre emelhetők, ahol már tényleg az emberfeletti matematikai felfedezések is elérhetővé válnak.

Mi fán terem a SAT?

A SAT (kielégíthetőségi) probléma az MI egyik alapvető eleme, bár gyökeresen más irányból közelíti meg a mesterséges intelligencia fogalmát, mint a ChatGPT vagy a képgenerátorok. A SAT szimbolikus MI, vagyis régi vágású, szabályalapú intelligencia, amely eldöntendő állításokra épül: ezek mindössze két értéket vehetnek fel, igazat vagy hamisat, amelyeket szigorú logikai láncok kötnek össze. Ha egy kérdést ilyen alapállításokra lehet bontani, akkor a SAT-programok gyakran képesek hibátlan és zárt levezetést adni: ezt nevezzük automatikus bizonyításnak. Az ilyen bizonyítások néha több ezer vagy akár millió lépésből állnak, de logikailag kifogástalanok.

Lényeges hangsúlyozni, hogy Heule sikere abban rejlik, hogyan tudja a matematikai problémákat „jól” átállítani, hogy a SAT-eszközök ráharapjanak. Gyerekkorától vonzódik a rejtvénylogikához, első százdarabos kirakóját már egyévesen megoldotta – és a Delft Műszaki Egyetemen, majd számítástechnikai doktori tanulmányaiban tovább tökéletesítette ezt a gondolkodásmódot. Tudományos pályájának egyik sarkköve a kérdés: miként lehet a gondolkodást automatizálni? Tapasztalatai szerint a gépi bizonyítás sosem pontosan úgy működik, mint az emberi logika, hanem teljesen más szemléletmód kell hozzá.

Puzzle vagy számítás?

A SAT-feladat egy adott probléma bináris, azaz csak 0-t vagy 1-et tartalmazó állításokra való fordításából áll. Képzelj el egy óriási sudoku táblát, ahol minden négyzetbe csak 0 vagy 1 kerülhet, és adottak a szabályok is: minden sorban és oszlopban milyen eloszlásnak kell teljesülnie. Nem könnyű, de hihetetlenül erős problémákat lehet ezzel a módszerrel kezelni – legyen szó hardverellenőrzésről, szoftverellenőrzésről, munkaidő-beosztásról vagy akár absztrakt matematikai fejtörőkről.

Holott elsőre úgy hangzik, mintha sima bináris számításról lenne szó, a SAT megközelítése teljesen eltér a hagyományos programozástól. Míg a hagyományos szoftverek műveleteket hajtanak végre kiinduló adatokon, a SAT-algoritmusok lehetséges kombinációkat kutatnak fel: kizárják azt, ami nem működik, logikai ugrásokkal szűkítik a lehetőségeket, míg meg nem találják a kielégítő megoldást, vagy rá nem jönnek, hogy nincs ilyen.

Mit adhat az MI a SAT mellé?

Heule egyik fő tudománya, hogy ösztönösen ráérez a megfelelő problémareprezentációra – hogyan lehet úgy kódolni egy matematikai kérdést, hogy a SAT-program a legnagyobb erejét mutassa meg. Az igazi áttörés akkor várható, ha ezek az átváltások maguktól is, automatikusan történhetnek: vagyis ne kelljen minden alkalommal egy „kódoló zsenit” közbeiktatni. Ha a nagy nyelvi modelleket (LLM-eket) számos jó példával tanítják be ilyen átváltásokra, akkor messze a legtöbb felhasználónál jobb SAT-kódolásokat tudnak létrehozni. A legnagyobb kihívás ilyenkor annak ellenőrzése, hogy tényleg helyes-e a fordítás.


A matematikai folyamat megújulása

Lényeges hangsúlyozni, hogy a generatív MI rengeteg hihető segédtételt (lemmát) tud alkotni, ám ezek helyességét csak automatikus eszközök tudják ténylegesen ellenőrizni. Ha valami mégsem stimmel, a SAT-program konkrét ellenpéldát tud visszaadni – lehetőleg a legegyszerűbbet, ami azonnal megvilágítja a bukást. Ezek az ellenpéldák segítik az MI-t, hogy már legközelebb pontosabban találja el, mit javasoljon.

Ehhez társulhatnak a bizonyításellenőrző rendszerek, például a Lean, amely minden részletet, minden kapcsolódást leellenőriz. Így az MI szervezi a főbb lépéseket, az automatizált bizonyítás mindent átnéz, a Lean pedig azt ellenőrzi, hogy tényleg egy összefüggő egészet alkotnak a mozaikdarabok. Amíg a rendszer végig hitelesen működik, addig bátran lehet rá építeni, és tovább haladni.

Bizalom kontra érthetőség

Az automatizált bizonyítások gyakran olyan hosszúak és komplexek, hogy ember számára átláthatatlanok. Kritikusai ki is emelik: valódi értelmet veszít, ha nem fogja fel senki, mi történik. De Heule szerint az érthetőség túlértékelt, a bizalom pedig alulértékelt a matematikában. Nincs olyan élő matematikus, aki mindent átlát – de ha minden kis részletről megbízható számítógép-ellenőrzés mondja ki, hogy helyes, akkor már van mire alapozni a következő felfedezéseket. Összességében elmondható, hogy a gépi bizonyítás épp az emberi munka megbízhatóságán javíthat drámaian.

Mi marad az emberi matematikusnak?

Bár a SAT-programok a bizonyítás kulcslépéseit elvégzik, az emberi kreatív ráérzés, a konceptuális megközelítés továbbra is pótolhatatlan. A gépek egyedül nem érnek semmit, ha nincsenek olyan emberek, akik a problémát jól átlátják, új kereteket találnak, és a saját intuíciójukat átadják a rendszernek. Az MI, az automatizált bizonyítások és a matematikusok csak együtt képesek az igazán nagy áttörésekre. A varázslat az együttműködésben rejlik.

2025, adminboss, www.quantamagazine.org alapján

Legfrissebb posztok

MA 06:05

Történelmi események a mai napon (Május 21.)

Ezen a napon egyszerre születtek hősies repüléstörténeti mérföldkövek és tragikus katasztrófák: Charles Lindbergh első szóló, megszakítás nélküli Atlanti-óceán átrepülése, a japán Mount Unzen pusztító megatszökőárja és Kolumbiában a rabszolgaság eltörlése...

APP
szerda 09:12

APPok, Amik Ingyenesek MA, 5/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Crazy Caps (iPhone/iPad)Ez a match-3 típusú, fizika alapú puzzle játék kreatív dizájnjával tűnik ki, és új élményt nyújt a megszokott játékmechanikákhoz képest...

szerda 06:05

Történelmi események a mai napon (Május 20.)

Mi történt ezen a napon? Ritka sűrű nap a történelemben: a niceai első egyetemes zsinat megnyitásától a SI-rendszer megszületéséig, a Krakatau kitörésének kezdetétől Auschwitz első foglyain át a kozmikus mikrohullámú háttérsugárzás felfedezéséig számos fordulópont született...

kedd 14:24

A Szilícium-völgy válasza a csökkenő férfitermékenységre: spermaverseny

😱 Egy lényeges szempont, hogy az emberi spermiumok mérete mindössze 0,05 mm, vagyis akkora, mint egy hajszál vastagsága...

kedd 13:34

Az Apple-alkalmazásoknak álcázott Reaper kémvírus vadászik Mac-felhasználókra

Mac számítógépeket vett célba egy új, kifejezetten alattomos vírus, amely hivatalos Apple-összetevőket és frissítéseket imitál, hogy áldozatait megtévessze...

kedd 13:12

A Hektoria-gleccser példátlan összeomlása: 24 kilométer 15 hónap alatt

Az Antarktisz Hektoria-gleccsere döbbenetes tempóban omlott össze 2022 elejétől 2023 tavaszáig...

kedd 12:57

Az első bizonyíték a világon: 950 éves dingósír rituális etetéssel

🐱 950 éve temették el azt a házi dingót, amelyet az ősi Barkindji nép tagjai nemcsak elhantoltak, hanem fél évezreden át is tápláltak – legalábbis így értelmezhető az Ausztráliában, a Darling folyó partján most feltárt lelet...

kedd 12:46

A szövetségi kormány rohan a MI után – bírja a tempót?

🚀 Az elmúlt három évben látványosan felgyorsult a mesterséges intelligencia alkalmazása az amerikai államigazgatásban...

kedd 12:24

A világ első színes lidarja forradalmasítja az önvezetést és a robotikát

🚗 A jövő önvezető járművei és robotjai olyan érzékszervekhez jutnak, amelyekről eddig csak álmodhattak...

kedd 12:02

A Vezúv áldozatánál orvosi készlet került elő Pompejiben

Egy friss vizsgálat során kiderült, hogy Kr. u. 79-ben, a Vezúv kitörése idején Pompejiben elhunyt férfi orvosi felszerelést vitt magával menekülés közben...

kedd 11:45

A Spotify visszavonul: a zavaró diszkógömb-ikon hamarosan eltűnik

📷 A Spotify iOS-es változatán a napokban jelent meg a retró, diszkógömbös ikon: a változás a cég 20...

kedd 11:34

Az Oura Ring 5 három fejlesztéssel trónfoszthatja a Galaxy Ringet

💍 Bár az Oura Ring 4 nemrég jelent meg, és máris az egyik legjobb fitneszkövetőként tartják számon, még mindig akadnak területek, ahol tovább tudna fejlődni...

kedd 11:02

A húrelmélet váratlanul bukkant elő egyszerű fizikai szabályokból

🎯 Ha egy almát addig darabolsz, míg legkisebb összetevőit nem éred el, előbb molekulákat találsz, aztán atomokat, majd kvarkokat és gluonokat...

kedd 10:55

Az összekapcsolt ökoszisztémák: így hozhatjuk ki a legtöbbet a technológiából

🔗 Ebből következően fontos megérteni, hogy a vállalatok jövője nem azon fog múlni, ki vezeti be a legújabb, trendinek számító platformot, hanem azon, mennyire jól tudják egymáshoz kapcsolni meglévő technológiáikat és partnereiket...

kedd 10:47

A kiadási folyamat vakfoltja: négy MI-támadás 50 nap alatt

💡 Az elmúlt másfél hónapban egymás után négy, ellátási láncot célzó támadás érte az MI-ipar legnagyobb szereplőit, köztük az OpenAI-t, az Anthropicot és a Metát...

kedd 10:28

Az okosabb mediterrán diéta 31%-kal csökkenti a cukorbetegség kockázatát

🍊 Ez a jelenség jól illusztrálható azzal, hogy a kutatók egy jelentős spanyol vizsgálatban kimutatták: egy továbbfejlesztett mediterrán diéta – szerény kalóriamegszorítással, rendszeres testmozgással és életmódtámogatással kiegészítve – 31%-kal csökkentheti a 2-es típusú cukorbetegség kialakulásának esélyét...

kedd 10:02

A problémás tinik ipara belülről: amikor a segítség árt

Taylor Kiesel három éve nem tudta átaludni az éjszakát. Torkaszakadtából kiáltva riad fel, pánikban – mégsem adja fel: gyerekkora óta gyűjtött hüllőkkel veszi körül magát, mentett állatoknak ad otthont, így próbálja átalakítani dühét és szomorúságát valami értelmessé...

kedd 09:55

A Sony kihátrál a PC-ről – talán négy játék bánja

😰 Sony egyre szűkülő világa sok játékosnak okoz csalódást. Régen igazi menedék volt a PlayStation a rajongóknak, ma viszont egyre kevésbé ismerős az egész...

kedd 09:37

Az NYT Connections kifacsarja az agyad: tippek és megoldások

🧠 Jellemző példa erre, hogy a Connections szórejtvény napokra próbára teszi a leleményességet – a legújabb, 1073...

kedd 09:28

A kullancscsípések megugrottak: sokan a sürgősségin, térképen mutatjuk, hol

Az Amerikai Egyesült Államokban évek óta nem látott magasságba ugrott a kullancscsípések száma, ennek következtében idén szinte minden eddiginél többen jelennek meg a sürgősségi osztályokon...

APP
kedd 09:12

APPok, Amik Ingyenesek MA, 5/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ContactVault Pro (iPhone/iPad)A ContactVault egy olyan korszerű névjegymentő alkalmazás, amely a személyes adatok védelmét helyezi előtérbe...

kedd 09:01

A szőlő mindennap: természetes napvédelem a bőrnek belülről

🍇 Jelentős, hogy a szőlőfogyasztás nemcsak egészségünkre van hatással, hanem a bőr védelmét is erősítheti a nap káros sugaraival szemben...

kedd 08:46

Az idegen romok felkutatása a Subnautica 2-ben: teendők és veszélyek

Erre utal többek között az, hogy a Subnautica 2-ben az idegen romok felderítése valódi próbatételt jelent...

kedd 08:37

A mai Quordle-t így győzöd le pillanatok alatt

Négy különböző magánhangzót tartalmaz a mai Quordle, ráadásul két megoldásban ismétlődnek betűk...

kedd 08:28

A Diablo 4-nek is sok a 2 401 kincsgoblin

A Diablo IV: A Gyűlölet Ura (Lord of Hatred) legújabb fejlesztései miatt a legelszántabb kincsvadászok teljesen elvesztették a fejüket...

kedd 08:20

Az Axum baktériumkultúra megszerzésének titka a Subnautica 2-ben

🧛 A Subnautica 2 világában az Axum baktériumkultúra az egyik legnehezebben hozzáférhető alapanyag, pedig elengedhetetlen, ha Metal Farmot szeretnél építeni...

kedd 07:37

A nagybankok milliárdjai új pályára állítják a Solanát

Az év elején a Solana elképesztő tempóban veszítette el mémcoinos címkéjét, miközben a kriptovilágot hűvösebb hangulat uralta...

kedd 07:28

Az ezerszer gyorsabb, mégis hűvös chip – még várnunk kell rá

A Tokiói Egyetem kutatói egy egészen új típusú chipet fejlesztettek, amely az információkat a szokásos elektromos áram helyett az elektronok mágneses tulajdonságait felhasználva kezeli...

kedd 07:19

A kontextusarchitektúra leváltja a RAG-ot, ahogy az ügynökalapú MI előretör

Az adatvezérelt vállalati megoldások folyamatosan új kihívásokkal szembesülnek, ahogy az MI-alapú ügynökök egyre fontosabbá válnak...