2026. 01. 14., 10:52

A mesterséges intelligencia pontossága ugrásszerűen nő egy egyszerű trükkel

A mesterséges intelligencia pontossága ugrásszerűen nő egy egyszerű trükkel
Az MI-modellek világában az utóbbi évek az egyre bonyolultabb kérdésfeltevési módszerek fejlesztésével teltek, hogy minél pontosabb válaszokat kapjunk. A mérnökök kidolgozták már a „gondolkodj lépésről lépésre” jellegű technikákat, az emocionális motiválást, sőt bonyolult többlépéses promptolási keretrendszereket is. Most mégis úgy néz ki, túl lett gondolva a dolog. A Google Research kutatása szerint egy egészen egyszerű megoldással akár 76%-kal is növelhető az LLM-modellek pontossága olyan feladatoknál, amelyek nem igényelnek bonyolult érvelést: egyszerűen el kell ismételni a kérdést.

Miért működik a kérdésismétlés?

A Transformer architektúra, amely a legtöbb modern MI-alapú nyelvi modellt működteti, „kauzális” nyelvi modellezéssel dolgozik. Ez azt jelenti, hogy a modell a szöveget balról jobbra olvassa: amikor az ötödik szót dolgozza fel, csak az első négyet képes figyelembe venni, a hatodikat még „nem látta”. Emiatt az információ sorrendje és elrendezése kulcsfontosságú. Gyakran előfordul, hogy ha előbb van a kontextus, mint a kérdés, vagy fordítva, teljesen más választ ad a rendszer.
Nem hagyható figyelmen kívül, hogy a kérdés megismétlése megkerüli ezt a korlátozást: miközben a modell másodszor fut neki ugyanannak a kérdésnek, addigra már „emlékszik” a szöveg legelső változatára is, így egyszerre tud visszautalni a már feldolgozott részletekre – és ezáltal szignifikánsan jobb válaszokat ad.

Lenyűgöző eredmények: 47-ből 47 siker

A kutatásban hét különböző elismert MI-tesztkészlettel és hét különböző modellel (köztük Gemini, GPT-4o, Claude, DeepSeek V3) vizsgálták a technikát. Azokban a feladatokban, ahol a modellt csak rövid, egyértelmű válaszadásra kérték, az ismétléses prompt 70 összehasonlított esetből 47-szer hozott érdemi előrelépést, és egyetlen esetben sem rontott.

A leglátványosabb előrelépés a „NameIndex” teszten volt. Itt 50 névből kellett kiválasztani a 25.-et. A Gemini 2.0 Flash-Lite alapból csupán 21,33% pontossággal találta el a helyes nevet, ám ha a kérdést kétszer egymás után kapta meg, a pontosság döbbenetes 97,33%-ra ugrott.

Továbbá más modelleknél – például a Claude és a GPT-4o esetében – is mérhetően nőtt a pontosság. Bizonyos jelek arra utalnak, hogy a „kauzális vakság” miatt az első menetben elveszítheti a modell a fonalat, különösen hosszabb listák vagy részletes adatok esetén. Amikor azonban megismétlődik a kérdés, az MI jobban „fel tudja dolgozni” az egész szövegrészt.

Gyorsabb, de legalábbis nem lassabb

Az MI-modellek működése két fő szakaszból áll: előfeldolgozás (a bemenet feldolgozása), amit a GPU párhuzamosan tud végezni, és a válasz generálása, amely már tokenenként halad, lassabban. Sokan joggal gondolhatnák, hogy a kérdés megkettőzése lassabb válaszadáshoz vezet – de éppen ellenkezőleg! Az előfeldolgozás annyira hatékonyan párhuzamosítható, hogy a felhasználó szinte semmit sem érzékel a válaszidőből.
A kutatók azt találták, hogy a kérdésismétlés sem a válasz hosszát, sem a válasz első betűjéig eltelt időt nem növelte, kivéve néhány szélsőségesen nagy lekérdezés esetén az Anthropic-modelljeknél. Az esetek túlnyomó többségében viszont úgy érhető el nagyobb hatékonyság, hogy a felhasználó nem fizet érte kényelmi veszteséggel.


Mikor nem érdemes ismételni?

Fontos, hogy a módszer főként nem érvelő jellegű feladatokra alkalmas: tehát ahol ténylegesen csak egy tömör, informatív választ várunk. Amint bejön a képbe a „lépésről lépésre gondolkodás” (mint pl. egy számolási vagy problémamegoldó folyamat), az ismétlés pozitív hatása elenyésző vagy semleges lesz.

Úgy tűnik, az MI ilyenkor maga is megismétli magában a lényegi kérdést, mielőtt megoldja – így a prompt ismétlése felesleges. Azonban azokban az esetekben, ahol tömör, egyértelmű választ és gyorsaságot akarunk, az ismétlés kiugró előnyt jelenthet.

Mit jelent ez a cégek számára?

A vállalati MI-alkalmazások fejlesztőinek igazi „ingyenebédet” jelenthet az egyszerű, promptalapú optimalizáció, de érdemes okosan integrálni. Vagyis nem mindenhol érdemes automatikusan duplázni, hanem inkább a szimpla kinyerési, osztályozási vagy kérdés–válasz feladatoknál.
Mostantól, mielőtt egy nagyobb, drágább modellre váltanának csak azért, hogy javuljon a pontosság, érdemes inkább kipróbálni az egyszerű kérdésismétlést – akár 21,33%-ról 97,33%-ra ugorhat a találati arány, miközben a gyors, olcsó infrastruktúrát tudják tovább használni.

Az is logikus lépés, hogy ezt a prompt megkettőzését már az infrastruktúra szintjén, automatikusan, „láthatatlanul” oldják meg, így a végfelhasználónak és fejlesztőnek semmilyen plusz lépést sem kell tennie. Az alkalmazást menedzselő köztes réteg – API-átjáró, orchestráció – felelhet az automatizálásért. Ily módon optimalizálható a teljes rendszer, anélkül, hogy bármilyen plusz költséggel vagy lassulással kellene számolni.

Továbbá felmerül a biztonsági kérdés is: ha a kérdésismétlés tisztább üzenetet közvetít a modellnek, akkor a rosszindulatú promptok is „érthetőbbé” válhatnak. A biztonsági csapatoknak így a tesztelési protokollokat is frissíteni kell, például az ismétléses injekciós (repeat injection) támadásokkal. Ugyanakkor védelmi céllal is jó lehet ismételni – például a biztonsági előírásokat kétszer is ki lehet írni a rendszerprompt elejére.

Miért fontos mindez?

Nem hagyható figyelmen kívül, hogy a mostani MI-modellek még mindig szorosan a balról jobbra feldolgozás korlátozásai között mozognak. Amíg nem jönnek el a kauzális vakságot áthidaló új architektúrák, addig a kérdésismétlés egyszerű, de már most alkalmazható, és kiváló eredményt hozó trükk.
Lehet, hogy a jövő MI-motorjai maguktól is automatikusan megismétlik majd a kérdéseinket a háttérben – de amíg ez nem történik meg, előfordulhat, hogy a hosszú promptok finomhangolása helyett bőven elég, ha egyszerűen kétszer kérdezzük meg ugyanazt.

2025, adminboss, venturebeat.com alapján

  • Te szerinted etikus, ha egy cég automatikusan megduplázza a felhasználó kérdését anélkül, hogy azt előre jelezné?
  • Te hogyan védenéd a rendszert, ha a kérdésismétlés sérülékenységeket is okozhat?


Legfrissebb posztok

MA 09:36

Az orr titkos térképe: így fejti meg a világ szagait

Sokáig óriási rejtély volt, miként érzékeljük és dolgozzuk fel a szagokat...

MA 09:29

Az IBM Bob elhozza az MI-fejlesztés új korszakát

Az MI-alapú ügynökök megjelenése egyre inkább mindennapos a vállalati szoftverfejlesztésben. Amint a fejlesztők új platformokkal kísérleteznek, a szervezetek fokozottan ki vannak téve a biztonsági és szervezeti hibáknak...

MA 09:22

Az új fogyasztószer tényleg vakságot okoz? Itt tartunk most

👀 Az utóbbi évek nagy slágere lett a testsúlycsökkentő szerek között a Wegovy, de egy friss kutatás most aggodalmat keltett: kapcsolat lehet a gyógyszer használata és a ritka, úgynevezett „szemguta” (ischaemiás optikus neuropátia, röviden ION) között...

MA 09:15

A következő Tales of-remaster, amire senki sem számított!

A Bandai Namco továbbra sem hagyja unatkozni a Tales of-rajongókat; újabb klasszikusnak készül új életet adni...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/30

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Sight Words: Dolch Coach (iPhone/iPad)Ez a játék élményszerűen fejleszti az angol olvasási készséget, hiszen az összes Dolch Sight Words szintet lefedi...

MA 09:07

Az őskori spanyol bányákban rejtőzhet a skandináv rejtély kulcsa

Érdekes fejlemény, hogy hat eddig ismeretlen bronzkori bányát tártak fel Délnyugat-Spanyolországban, Extremadurában, amelyek új fényt vethetnek a skandináv bronzkori fémek eredetére...

MA 09:01

Az óriáscégek megállíthatatlanul lapátolják a milliárdokat a mesterséges intelligenciába

A világ legnagyobb technológiai vállalatai egészen elképesztő összegeket fektetnek az MI-infrastruktúra fejlesztésébe...

MA 08:57

Az első 3D-s felvétel, ahogy T-sejtek leszámolnak a rákkal

A citotoxikus T-limfociták az immunrendszer különleges „gyilkos” sejtjei, amelyek hihetetlen pontossággal képesek felismerni és elpusztítani a fertőzött vagy rákos sejteket...

MA 08:50

Jönnek a robotok: átveszik a csomagkezelést a reptereken

🤖 Fontos kérdés, hogy meddig kell még embereknek cipekedniük a reptereken, vagy hamarosan átvehetik a helyüket a gépek...

MA 08:28

Az AWS Quick forradalmasítja a munkahelyi automatizációt

Többek között az AWS Quick olyan teljesen új lehetőségeket hozott a vállalati MI-rendszerekbe, amelyek eddig a központi irányítópultok számára láthatatlanok voltak...

MA 08:22

Az olajár-sokk ismét földhöz vágta a Bitcoint és a kriptopiacot

Érdekes felvetés, hogy a geopolitikai feszültségek mennyire befolyásolják a kriptovaluták árfolyamát, különösen, amikor az olaj ára hirtelen szárnyal...

MA 08:08

A malária átírta történelmünket: nem véletlenek őseink útvonalai

🐟 Afrika őskori emberei nem pusztán az élelem vagy a klíma miatt választottak lakóhelyet: a malária is jelentős szerepet játszott abban, hogy merre vándoroltak és hol telepedtek le...

MA 08:01

A szívritmus lehet a kulcs a rák terjedésének megállításához

❤ Az emberi szív különleges ritmusának köszönhetően rendkívül ritka, hogy rák alakul ki közvetlenül a szívben...

MA 07:57

Az MI-láz ára: vállalatok vagyonokat égetnek kihasználatlan GPU-kra

💸 A vállalatoknak évek óta komoly gondot okoz a grafikus processzorok (GPU-k) kihasználatlansága: súlyos pénzeket fizetnek a drága MI-infrastruktúráért, miközben az erőforrások nagy részét valójában nem használják ki...

MA 07:50

Az űr megszállottjai: Kojima, Musk és Newell titkos levelei

🚀 A japán játékfejlesztő Hideo Kojima nem csupán a videojátékok iránt rajong, hanem egyenesen az űrbe vágyik...

MA 07:36

Az irányíthatatlan SpaceX rakétafokozat már idén nyáron a Holdba csapódhat

🚀 Érdekes felvetés, hogy az űrszemét problémája mára már a Holdat is elérte...

MA 07:29

Az Amazon felrúgja az MI-exkluzivitást: új fejezet a felhőháborúban

Az Amazon egyszerre több látványos MI-fejlesztést mutatott be San Franciscóban, amelyek alapjaiban forgathatják fel a vállalati MI-piacot...

MA 07:22

Az eső és pára napja a NYT Strandsben – itt a megoldások!

☁ A mai NYT Strands játék témája igazán hűvös és nedves hangulatot idéz, hiszen a „Nedves takarók” (wet blankets) köré összpontosul...

MA 07:15

A robot lekörözi az embert: új félmaratoni rekord

🤖 Egy szemet kápráztató, vibrálóan piros humanoid robot, az Honor Robotics D1, történelmet írt Pekingben: 21,1 kilométert (13,1 mérföldet) tett meg mindössze 50 perc 26 másodperc alatt, ezzel megdöntve az eddigi emberi félmaratoni rekordot, amely 57 perc 20 másodperc volt...

MA 07:08

Az olaszoknál kötött ki a kínai Wuchang – Lehullott tollak

A kínai fejlesztésű, történelmi Kínában játszódó Wuchang: Lehullott tollak (Wuchang: Fallen Feathers) meglepő fordulattal immár egy olasz vállalat tulajdonában van...

MA 07:01

Az MI-forradalom dübörög: megszületik a Bitcoin óriáscég?

Jack Mallers cége, a Twenty One Capital (XXI) részvényei több mint 8 százalékot ugrottak a tőzsdezárás után, miután kiderült, hogy a fő tulajdonos, a Tether összefogást kezdeményezett a Strike nevű Bitcoin-pénzügyi platformmal és az Elektron Energy bányavállalattal...

MA 06:50

A nagy Quordle-kihívás: szavak, fordulatok és meglepetések

A Quordle mai, 1557-es játékszáma igazán próbára teszi a fejtörők szerelmeseit...

MA 06:43

A NYT Connections mai megfejtései: Rájössz a trükkre?

Például egy egyszerűnek tűnő játék is alaposan próbára teheti a szókincsünket – az NYT Connections pont ilyen...

MA 06:35

A Meta stabilcoinban fizetne a tartalomgyártóknak – itt az új terv

Ebből következően érdemes megérteni, hogy a Meta úttörő lépésre szánta el magát: Kolumbiában és a Fülöp-szigeteken kiválasztott tartalomgyártók már stabilcoinban kapják meg bevételeiket...

MA 06:29

Az MI-ügynökök kora: már nem a pilóták a főszereplők

🤖 Lényeges szempont, hogy a vállalati adatvagyon kiaknázása soha nem volt ilyen időszerű, mint most...

MA 06:23

Az emberes holdbázis még ebben az évtizedben valóság lesz?

Elon Musk és a NASA nagy álmokat dédelgetnek: az elkövetkező tíz évben állandó holdbázis építését tervezik...

MA 06:05

Történelmi események a mai napon (Április 30.)

Rendhagyó nap a világtörténelemben: Saigon eleste véget vetett a vietnámi háborúnak, a CERN pedig ingyenessé tette a World Wide Web protokolljait, forradalmasítva az internetet 🌐...

szerda 21:45

Az Etna felfedi titkát: egyedülálló vulkántípus született

Érdemes megvizsgálni, mi teszi az Etnát a földkerekség egyik legkülönlegesebb vulkánjává – amit az is jelez, hogy a friss kutatások gyökeresen új magyarázattal szolgálnak a szicíliai tűzhányó szokatlan viselkedésére...

szerda 21:35

Az MI legújabb áttörése fenekestül felforgatja a kriptovilág biztonságát

🚀 Erre utal többek között az, hogy az Anthropic által bemutatott Mythos MI-modell fenekestül felforgatja a kriptoszektor eddigi biztonsági stratégiáit...