MA 11:13

Az MI strukturált kérdései átírják a kódellenőrzés szabályait

Az MI strukturált kérdései átírják a kódellenőrzés szabályait
Első pillantásra úgy tűnt, hogy a mesterségesintelligencia-ügynökökkel végzett kódellenőrzés szinte megoldhatatlan probléma: minden egyes kódtárhoz költséges és bonyolult szimulált futtatási környezetet (sandboxot) kell felépíteni, emiatt folyamatosan nőnek az infrastrukturális terhek. Egyre több fejlesztő kerüli ezt azzal, hogy a kódot nyelvi MI-modellekkel vizsgáltatja, amelyek futtatás nélkül, pusztán olvasással próbálnak hibákat keresni és javításokat ellenőrizni. Ez azonban gyakran vezet megalapozatlan találgatásokhoz vagy egyszerűen blöfföléshez, amikor az MI úgy ítél meg egy problémát, hogy valójában nincs is elegendő bizonyítéka rá.

A strukturált kérdezéstechnika lényege

A Meta szakértői emiatt vezettek be egy strukturált kérdezéstechnikát. Ebben a megoldásban az MI logikai tanúsítványokat tölt ki: világosan megfogalmazza az előfeltevéseit, lépésről lépésre követi az adott függvényhívásokat, és csak konkrét, bizonyítható információk alapján von le végkövetkeztetéseket. Nem lehet egyszerűen rábökni, hogy ez vagy az a sor okozza a hibát, hanem minden lépést igazolni kell – így jelentősen nő az elemzés pontossága, és drasztikusan csökken a téves hibakeresések, félreértések száma.

Ennek eredményeként megbízhatóbb, futtatás nélküli forráskód-elemzés valósulhat meg. A strukturált formátum arra „kényszeríti” az MI-t, hogy részletesen átböngéssze a forráskódot, és összegyűjtse a bizonyítékokat, mielőtt döntést hozna.

Az ügynöki kódértelmezés új szintje

Az úgynevezett ügynöki kódértelmezés abban különleges, hogy az MI-ügynök képes egy teljes kódtárat átlátni, összefüggéseket, függőségeket visszakövetni, hogy ténylegesen mélyen értelmezze a kód működését – mindezt kód futtatása nélkül. Ez elengedhetetlen például vállalati szintű hibavadászatnál vagy patch-ellenőrzésnél, ahol gyakori, hogy a releváns információ akár több tucat fájlban szétszórva található.

A jelenlegi megközelítések közül az egyik legelterjedtebb a laza, strukturálatlan értelmezés, amikor az MI egyszerűen csak elmagyarázza a gondolatmenetét, de semmi sem kényszeríti szigorú bizonyítási láncra; emiatt meglehetősen gyakran hoz magabiztos, ám megalapozatlan döntéseket. A másik véglet a formális verifikáció volna, amikor a kódot vagy a gondolatmenetet matematikai nyelvre (például Lean, Coq vagy Datalog) alakítják, hogy gépileg leellenőrizhető legyen. Ez a vállalati gyakorlatban szinte kivitelezhetetlen, mert a valódi kódbázisok komplexitása miatt a programnyelv precíz matematikai leírása gyakorlatilag lehetetlen.

Így működik a fél-formális kérdezéstechnika

A Meta kutatói ezért dolgozták ki a fél-formális, strukturált kérdezési sablonokat. Ezekben az MI-nek minden lépésben expliciten meg kell neveznie a feltételeket, konkrét példákon kell végigkövetnie a függvényhívásokat, és kizárólag bizonyítható tények alapján hozhat döntést. A sablonok logikai tanúsítványként funkcionálnak, így a rendszer rákényszerül minden egyes érintett kódrészt visszakeresni, nem csupán felületes névazonosságokra hagyatkozni. Így sikerül megbízhatóbban kezelni az olyan helyzeteket is, amikor például zavart keltő, hasonló nevű függvények is szerepelnek.


Gyakorlati eredmények: sokkal pontosabb ellenőrzések

A fél-formális eljárást három szoftvermérnöki feladaton tesztelték: patch-ek egyenértékűségének vizsgálata, a hiba helyének bemérése és komplex kódbázison végzett kérdés–válasz feladat. Patch-eknél 78%-ról 88%-ra ugrott a pontosság a nehezített példákon. A valós, ügynök által generált patch-eknél a Sonnet-4.5 modell 93%-os ellenőrzési pontosságot ért el ezzel a módszerrel, szemben az általános, strukturálatlan módszer 86%-os és az egyszerű szövegösszehasonlító (difflib) 73%-os pontosságával.

Egy tipikus, valós példában a Django-repozitórium két patch-e közül csak az egyik tartalmazott egy könyvtári format() függvényt, amely felüldefiniálta a Python beépített függvényét – emiatt a két patch valójában eltérően működött, amit csak a strukturált kérdezési sablon alapján fedezett fel az MI.

Korlátok és tudnivalók

A strukturált kérdezés jelentősen javítja az MI döntéseinek megbízhatóságát, de nagyobb számítási igénnyel jár. Patch-ellenőrzésnél például átlagosan 2,8-szor több lépést igényel, mint a laza kérdezés. Emellett bizonyos, nagyon jól teljesítő modelleknél nem feltétlenül hoz további előrelépést, ha az adott feladatban amúgy is magas a pontosság.

Előfordul az is, hogy a rendszer túlságosan hosszan, formálisan felépített, de félrevezető bizonyítási láncot hoz létre. Ha valahol hiányzik egy lényeges információ, akkor is magabiztosan – de hibásan – fog dönteni. Harmadik féltől származó könyvtárak elemzésénél, ahol a kód nem elérhető, a megoldás visszacsúszik találgatásba.

Mindezek ellenére a fél-formális kérdezés jelentősen csökkenti a vak találgatást és az úgynevezett MI-hallucinációk arányát.

Miért éri meg bevezetni?

A fél-formális kérdezési sablon azonnal használható, nem igényel sem modellfinomhangolást, sem speciális környezetet, csupán a jól megírt kérdezési sablont kell beilleszteni az MI-ügynök működésébe. Bár számítási időben drágább, az általa elért megbízhatóság a legtöbb kódelemzési feladaton bőven behozza a költségeket.

A Meta közzétette a kérdezéssablonokat, így egyszerűen implementálhatók bármilyen alkalmazásba. Bár sokszor temetik a prompt engineeringet, ez a példa jól mutatja, hogy a jól megírt, strukturált kérdésekből még mindig rengeteg pluszt lehet kihozni a nyelvi MI-modellekből.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 12:23

Az Egyesült Királyság bekeményít: új Microsoft-trükköket vizsgálnak

A brit Verseny- és Piacfelügyeleti Hatóság (CMA) 2026 májusától átfogó vizsgálatot indít a Microsoft szoftverei kapcsán, amelyek között ott van a Windows operációs rendszer, az Office alkalmazáscsomag és a Copilot MI-asszisztens is...

MA 12:00

A döbbenetes pillanat: egy Starlink-műhold önmegsemmisült az űrben

Valami szokatlan történt a SpaceX egyik Starlink-műholdjával: 560 km-rel a Föld felett elvesztette a kapcsolatot az irányítókkal, minden jel szerint egy belső, nagy energiájú esemény miatt, nem pedig ütközés következtében...

MA 11:34

Az első HKD-stabilcoin-licencre még mindig vár Hongkong

Márciusban életbe lépett volna Hongkong vadonatúj szabályozása, amely a hongkongi dollárhoz kötött stabilcoin-kibocsátókat engedélyezné...

MA 11:23

Az eltűnt net: tényleg hoppon maradnak a Google Fi-ügyfelek?

Na most kapaszkodj, mert egész sor Google Fi-előfizető kapott hidegzuhanyt: a mobilnet egy csapásra megszűnt, mintha a SIM-kártyájuk eltűnt volna a semmibe...

MA 11:03

A sarkvidék váratlan mellékhatása: tisztább lett Kína levegője

Kína a közelmúltban drasztikusan csökkentette a légszennyezést okozó aeroszol-kibocsátását. Ez a lépés nemcsak hazai szinten hozott látványos változásokat, hanem egészen a sarkvidékig hullámzott tovább, meglepő következményeket okozva...

MA 11:00

Eltűnt az ázsiai szmog, mégis veszélyben az északi-sarki jég

Kína az elmúlt évtizedben radikális lépéseket tett a légszennyezés visszaszorítása érdekében, ennek nyomán azonban meglepő hatások jelentek meg az Északi-sarkvidéken...

MA 10:50

Az év munkahelyi élménye: most ingyen kipróbálhatod a tech support poklát

Ha szeretnél nevetve (vagy épp rettegve) próbára tenni a barátságodat valakivel, itt egy új játék, ami garantáltan kizökkent a komfortzónádból...

MA 10:01

A hatalmas Anthropic-baki: kiszivárgott a Claude Code titka

Képzeld el: 500 ezer sornyi kód, majdnem 2 ezer fájl, és mindez csak úgy kikerült egy szimpla reggelen – mintha valaki véletlenül feltenné a titkos naplóját az Insta-sztorijába!..

MA 09:50

Az Anthropicnál véletlenül kikerült a Claude Code forráskódja

Az Anthropic nagy hibát követett el: a nyílt forráskód iránti elköteleződésük ellenére a Claude Code eddig szigorúan zárt forrású volt, ám egy mai frissítés során véletlenül elérhetővé vált a teljes belső programkód...

MA 09:43

Az új WhatsApp-trükk, amivel megszerzik az irányítást a géped fölött

A napokban egyre több olyan WhatsApp-üzenet terjed, amely mögött veszélyes támadássorozat áll...

MA 09:38

A 11 Apple-szlogen, amelyek fél évszázadra pecsétet ütöttek

🖊 Érdemes megvizsgálni, hogy egyetlen vállalat hogyan képes formálni a digitális korszakot – nemcsak eszközeivel, hanem a róluk szóló mondatokkal is...

MA 09:29

A régi Gmail-címedet végre lecserélheted

Első pillantásra úgy tűnt, hogy a Gmail-cím örökre kísér, de hosszú évek várakozása után most már lehetőség van a felhasználónév megváltoztatására...

MA 09:22

Az Aluminium OS kiszivárgott háttérképei: ragyogás, álmok és vagány laptopos újdonságok

Neonzöld, magenta, narancs, és olyan absztrakt cuccok, hogy attól is beindulsz, ha a géped csak az asztalon áll...

MA 09:16

Az amerikai hadsereg célkeresztjében a Hold

🌔 A NASA nagyszabású Hold-programja, az Artemis II új fejezetet nyit az űrutazás történetében...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 4/1

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 09:08

Itt a lehetőség: lecserélheted a ciki Gmail-címedet!

👤 Eljött az idő: 22 év várakozás után a Gmail végre lehetőséget ad arra, hogy megváltoztasd a régóta nyögvenyelős e-mail címedet anélkül, hogy emiatt elveszítenéd a leveleidet, vagy teljesen új fiókot kellene nyitnod...

MA 09:01

A Nagy-Sóstó mélyén rejtőzik az óriási édesvízkincs titka

🌊 Utah állam legendás Nagy-Sóstója csak sósvízi óriásként ismert, de most kiderült, hogy jóval többet rejt: mélyen a tó feneke alatt a friss kutatások szerint hatalmas édesvízkészlet húzódhat...

MA 08:57

Az új Proton Meet: videóhívás, ahol a titok titok marad

🔐 A Proton bemutatta legújabb videokonferencia-platformját, a Meetet, amelyet kifejezetten a magánszféra védelmére fejlesztett ki...

MA 08:50

Az MI célkeresztjében a Bitcoin – közeleg az új kriptóláz

A Google legfrissebb kutatása szerint már egy 500 000 kvantumbittel (qubittel) rendelkező kvantumszámítógép képes lehet feltörni a Bitcoin elliptikus görbékre épülő titkosítását – ehhez korábban jóval nagyobb értéket becsültek a szakértők...

MA 08:43

Az iráni kibertámadások új hulláma tarolja le a közel-keleti önkormányzatokat

💥 Feltételezhetően iráni hackercsoportok százával támadják a közel-keleti önkormányzatok Microsoft 365-fiókjait gyenge jelszavak tömeges próbálgatásával...

MA 08:36

A TikTok lemásolja a Cameót: jönnek a személyes videók

📹 Mostantól elég egyetlen mozdulat, és már kérhetsz is személyre szabott videót a kedvenc TikTok-készítődtől – nem kell többé külön alkalmazásokkal szenvedni...

MA 08:29

Az új Windows 11-frissítés végre leszámol a telepítési hibákkal

💻 Tipikus eset, amikor egy frissítés több gondot okoz, mint amennyit javítana: a Microsoft nemrég kénytelen volt sürgősségi, rendkívüli frissítést kiadni, miután a márciusi opcionális, nem biztonsági Windows 11 előzetes frissítés (KB5079391) telepítése számos felhasználónál kudarcba fulladt...

MA 08:24

Az emberiség visszatér a Holdra: jön az Artemis II.

Évtizedekkel az Apollo–17 után az Artemis II küldetés újra embert juttat a holdi környezetbe, közvetlenül a leendő holdbázis megvalósításának küszöbén...

MA 08:15

Az autóipar lemond róla, a Toyota mégis hisz a hidrogénben

🚗 A japán óriás újra beszáll a hidrogénes játszmába, méghozzá nem is akárkikkel: összeáll a Daimlerrel és a Volvóval, hogy közösen fejlesszék az üzemanyagcellás technológiát...

MA 08:01

A Gmail-címedet mostantól végre megváltoztathatod

A Gmail-felhasználók az Egyesült Államokban mostantól lehetőséget kapnak arra, hogy megváltoztassák az @gmail...

MA 07:57

Az újabb Starlink-fiaskó: szilánkokra tört az űrmadár

🛸 A SpaceX legutóbb egy váratlan Starlink-anomáliával szembesült: a cég elvesztette a kapcsolatot az egyik műholdjával, amelynek következtében a szatellit legalább tucatnyi darabra szakadt a Föld körüli pályán...

MA 07:50

Az új stabilcoin-forradalom: kétbillió dolláros piac 2028-ra?

A stabilcoinok forgalma az elmúlt két évben megduplázódott, ma már ezek az eszközök átlagosan havonta hatszor cserélnek gazdát...

MA 07:43

A Tesla robotaxik néha nem robotok: emberek irányítják távolról

🚗 Érdemes megvizsgálni, hogy a Tesla robotaxijai néha valóban nemcsak maguktól közlekednek: bizonyos esetekben emberi operátorok veszik át a távoli irányítást...

MA 07:36

Az űrviharok ellen így védi a NASA az Artemis II legénységét

🚀 A 2026 tavaszán startoló Artemis II küldetésben négy űrhajós – három amerikai és egy kanadai – tíz napon keresztül utazik majd a világ legerősebb rakétájával a Föld körüli pályán túlra, egészen a Hold közelébe...