A mesterséges intelligencia pontossága ugrásszerűen nő egy egyszerű trükkel

A mesterséges intelligencia pontossága ugrásszerűen nő egy egyszerű trükkel
Az MI-modellek világában az utóbbi évek az egyre bonyolultabb kérdésfeltevési módszerek fejlesztésével teltek, hogy minél pontosabb válaszokat kapjunk. A mérnökök kidolgozták már a „gondolkodj lépésről lépésre” jellegű technikákat, az emocionális motiválást, sőt bonyolult többlépéses promptolási keretrendszereket is. Most mégis úgy néz ki, túl lett gondolva a dolog. A Google Research kutatása szerint egy egészen egyszerű megoldással akár 76%-kal is növelhető az LLM-modellek pontossága olyan feladatoknál, amelyek nem igényelnek bonyolult érvelést: egyszerűen el kell ismételni a kérdést.

Miért működik a kérdésismétlés?

A Transformer architektúra, amely a legtöbb modern MI-alapú nyelvi modellt működteti, „kauzális” nyelvi modellezéssel dolgozik. Ez azt jelenti, hogy a modell a szöveget balról jobbra olvassa: amikor az ötödik szót dolgozza fel, csak az első négyet képes figyelembe venni, a hatodikat még „nem látta”. Emiatt az információ sorrendje és elrendezése kulcsfontosságú. Gyakran előfordul, hogy ha előbb van a kontextus, mint a kérdés, vagy fordítva, teljesen más választ ad a rendszer.
Nem hagyható figyelmen kívül, hogy a kérdés megismétlése megkerüli ezt a korlátozást: miközben a modell másodszor fut neki ugyanannak a kérdésnek, addigra már „emlékszik” a szöveg legelső változatára is, így egyszerre tud visszautalni a már feldolgozott részletekre – és ezáltal szignifikánsan jobb válaszokat ad.

Lenyűgöző eredmények: 47-ből 47 siker

A kutatásban hét különböző elismert MI-tesztkészlettel és hét különböző modellel (köztük Gemini, GPT-4o, Claude, DeepSeek V3) vizsgálták a technikát. Azokban a feladatokban, ahol a modellt csak rövid, egyértelmű válaszadásra kérték, az ismétléses prompt 70 összehasonlított esetből 47-szer hozott érdemi előrelépést, és egyetlen esetben sem rontott.

A leglátványosabb előrelépés a „NameIndex” teszten volt. Itt 50 névből kellett kiválasztani a 25.-et. A Gemini 2.0 Flash-Lite alapból csupán 21,33% pontossággal találta el a helyes nevet, ám ha a kérdést kétszer egymás után kapta meg, a pontosság döbbenetes 97,33%-ra ugrott.

Továbbá más modelleknél – például a Claude és a GPT-4o esetében – is mérhetően nőtt a pontosság. Bizonyos jelek arra utalnak, hogy a „kauzális vakság” miatt az első menetben elveszítheti a modell a fonalat, különösen hosszabb listák vagy részletes adatok esetén. Amikor azonban megismétlődik a kérdés, az MI jobban „fel tudja dolgozni” az egész szövegrészt.

Gyorsabb, de legalábbis nem lassabb

Az MI-modellek működése két fő szakaszból áll: előfeldolgozás (a bemenet feldolgozása), amit a GPU párhuzamosan tud végezni, és a válasz generálása, amely már tokenenként halad, lassabban. Sokan joggal gondolhatnák, hogy a kérdés megkettőzése lassabb válaszadáshoz vezet – de éppen ellenkezőleg! Az előfeldolgozás annyira hatékonyan párhuzamosítható, hogy a felhasználó szinte semmit sem érzékel a válaszidőből.
A kutatók azt találták, hogy a kérdésismétlés sem a válasz hosszát, sem a válasz első betűjéig eltelt időt nem növelte, kivéve néhány szélsőségesen nagy lekérdezés esetén az Anthropic-modelljeknél. Az esetek túlnyomó többségében viszont úgy érhető el nagyobb hatékonyság, hogy a felhasználó nem fizet érte kényelmi veszteséggel.


Mikor nem érdemes ismételni?

Fontos, hogy a módszer főként nem érvelő jellegű feladatokra alkalmas: tehát ahol ténylegesen csak egy tömör, informatív választ várunk. Amint bejön a képbe a „lépésről lépésre gondolkodás” (mint pl. egy számolási vagy problémamegoldó folyamat), az ismétlés pozitív hatása elenyésző vagy semleges lesz.

Úgy tűnik, az MI ilyenkor maga is megismétli magában a lényegi kérdést, mielőtt megoldja – így a prompt ismétlése felesleges. Azonban azokban az esetekben, ahol tömör, egyértelmű választ és gyorsaságot akarunk, az ismétlés kiugró előnyt jelenthet.

Mit jelent ez a cégek számára?

A vállalati MI-alkalmazások fejlesztőinek igazi „ingyenebédet” jelenthet az egyszerű, promptalapú optimalizáció, de érdemes okosan integrálni. Vagyis nem mindenhol érdemes automatikusan duplázni, hanem inkább a szimpla kinyerési, osztályozási vagy kérdés–válasz feladatoknál.
Mostantól, mielőtt egy nagyobb, drágább modellre váltanának csak azért, hogy javuljon a pontosság, érdemes inkább kipróbálni az egyszerű kérdésismétlést – akár 21,33%-ról 97,33%-ra ugorhat a találati arány, miközben a gyors, olcsó infrastruktúrát tudják tovább használni.

Az is logikus lépés, hogy ezt a prompt megkettőzését már az infrastruktúra szintjén, automatikusan, „láthatatlanul” oldják meg, így a végfelhasználónak és fejlesztőnek semmilyen plusz lépést sem kell tennie. Az alkalmazást menedzselő köztes réteg – API-átjáró, orchestráció – felelhet az automatizálásért. Ily módon optimalizálható a teljes rendszer, anélkül, hogy bármilyen plusz költséggel vagy lassulással kellene számolni.

Továbbá felmerül a biztonsági kérdés is: ha a kérdésismétlés tisztább üzenetet közvetít a modellnek, akkor a rosszindulatú promptok is „érthetőbbé” válhatnak. A biztonsági csapatoknak így a tesztelési protokollokat is frissíteni kell, például az ismétléses injekciós (repeat injection) támadásokkal. Ugyanakkor védelmi céllal is jó lehet ismételni – például a biztonsági előírásokat kétszer is ki lehet írni a rendszerprompt elejére.

Miért fontos mindez?

Nem hagyható figyelmen kívül, hogy a mostani MI-modellek még mindig szorosan a balról jobbra feldolgozás korlátozásai között mozognak. Amíg nem jönnek el a kauzális vakságot áthidaló új architektúrák, addig a kérdésismétlés egyszerű, de már most alkalmazható, és kiváló eredményt hozó trükk.
Lehet, hogy a jövő MI-motorjai maguktól is automatikusan megismétlik majd a kérdéseinket a háttérben – de amíg ez nem történik meg, előfordulhat, hogy a hosszú promptok finomhangolása helyett bőven elég, ha egyszerűen kétszer kérdezzük meg ugyanazt.

2025, adminboss, venturebeat.com alapján

  • Te szerinted etikus, ha egy cég automatikusan megduplázza a felhasználó kérdését anélkül, hogy azt előre jelezné?
  • Te hogyan védenéd a rendszert, ha a kérdésismétlés sérülékenységeket is okozhat?


Legfrissebb posztok

MA 12:01

Az amerikai bitcoin ETF-ek ismét rekordközelben száguldanak

📈 Az amerikai spot bitcoin ETF-ek három hónap óta a legerősebb napjukat zárták, 276 milliárd forint (750 millió dollár) friss tőke áramlott hozzájuk kedden...

MA 11:50

Az offshore szél nagy dobása: olcsóbb áram, vagy újabb viták?

🌀 A brit kormány történelmi mennyiségű új offshore szélerőmű-projektre adott ki szerződéseket, ezzel meghatározó lépést téve a tiszta energia irányába...

MA 11:34

Az olcsó Ubiquiti átjáró nagyító alatt: UXG‑Lite teszt

Az Ubiquiti UXG-Lite egy meglepően kompakt és energiatakarékos hálózati eszköz, amely ideális belépő az Ubiquiti ökoszisztémájába...

MA 11:17

A mesterséges intelligencia sötét oldala a vásárlásban: nő a trükközés

💸 A Google bejelentette új Univerzális Kereskedelmi Protokollját, amely lehetővé teszi, hogy a Gemini és más MI-alapú asszisztensek egyszerűsítsék az online vásárlást...

MA 11:01

A Galaxy S26 végre valódi áttörést hozhat

🚀 Újabb pletyka kering a hamarosan érkező Samsung Galaxy S26-ról, amely szerint végre érdemes lehet készülni a váltásra...

MA 10:57

Az amerikai kibocsátások ismét emelkednek – az MI a fő felelős?

🌎 Az Egyesült Államok üvegházhatású gázkibocsátása két év stabil csökkenés után idén újra növekedésnek indult, és jövőre várhatóan még magasabb lesz...

MA 10:43

Az új memóriaválság alapjaiban rázza meg a PC-piacot

💡 Drágulás, szerényebb gépek: hosszú távú krízis a láthatáron Lényeges hangsúlyozni, hogy a memóriahiány, illetve az emiatt folyamatosan dráguló alkatrészek nyomán 2027 végéig tartó áremelkedésekre és visszafogottabb PC-felszereltségre számíthatunk...

MA 10:36

Az új Firefox 147: apró újítások, erősebb védelem

🚀 A Firefox 147-es verziója számos hasznos fejlesztéssel jelent meg. Az egyik legfontosabb újdonság, hogy mostantól támogatja a HTML dialogelemet, így a weboldalakon megjelenő felugró ablakok és párbeszédpanelek natívan jelenhetnek meg a böngészőben...

MA 10:29

Az ukrán hadseregre új, jótékonyságnak álcázott kibercsalás csap le

Október és december között az ukrán védelmi erők tagjait különleges, jótékonyságot színlelő kibertámadás érte, amelynek során a PluggyApe nevű, megtévesztő hátsóajtó-kártevőt próbálták telepíteni...

MA 10:24

Az MI-nek hála az energiaiparban is tarolnak az óriáscégek

A mesterséges intelligencia bevezetése óriási energiakeresletet indított el a tech világában, ezért a Big Tech-cégek most versenyt futnak az energiaszakemberekért...

MA 10:15

A rákbetegek 70 százaléka már öt évnél tovább él Amerikában

Az Egyesült Államokban drámai mértékben nőtt a daganatos betegek túlélési esélye: az American Cancer Society friss jelentése szerint a diagnózis után öt évvel még élők aránya elérte a 70 százalékot...

MA 10:08

Az XRP kilőtt – meddig tart a menetelés?

🚀 Az utóbbi napokban az XRP árfolyama 6%-os emelkedést mutatott, kiemelkedve az egyébként ingadozó kriptopiacon...

MA 10:01

Az új Windows-frissítések végleg lecserélik a lejáró Secure Boot-tanúsítványokat

🔒 A Microsoft automatikusan elkezdte lecserélni a hamarosan lejáró Secure Boot tanúsítványokat a jogosult Windows 11 24H2 és 25H2 rendszereken...

MA 09:58

Az áttörés: perelhetők a szexuális deepfake-ek készítői

👑 Az amerikai Szenátus elfogadta a DEFIANCE törvényjavaslatot, amely új eszközt adhat azok kezébe, akiket akaratuk ellenére kompromittáló, MI által generált képeken ábrázoltak...

MA 09:51

Az Arecibo után: száz gyanús jelet vizsgálnak a földönkívüliek nyomában

🔰 Egy lényeges szempont, hogy a földönkívüli intelligencia keresésének 21 éves, úttörő programja új szakaszba lépett: a tudósok 100 lehetséges idegen rádiójelet tanulmányoznak, amelyek a legendás, időközben összeomlott Arecibo Obszervatórium adataiból származnak...

MA 09:43

A klímakatasztrófa árnyékában: 2025 sem lett rekord meleg

🌡 2025 nem lett a valaha mért legmelegebb év, de ettől még nem lélegezhetünk fel...

MA 09:29

A legjobb ingyenes MI-kurzusok: most te is belevághatsz

📚 Az MI világa viharos tempóban fejlődik, és aki nem akar lemaradni, most elképesztő lehetőség előtt áll...

MA 09:23

A Ring és a mesterséges intelligencia szövetsége: az okosotthonok új korszaka

Nehéz elhinni, de néha egy egész vállalkozás sorsát egy váratlan tragédia vagy technológiai áttörés fordítja meg...

MA 09:09

Az űrben készül a holnap: jönnek a lebegő gyárak

Képzelj el egy automata 3D nyomtatót, amely a világűrben lebegve gyárt fontos alkatrészeket földi vagy űrbéli felhasználásra...