2026. 01. 14., 10:52

A mesterséges intelligencia pontossága ugrásszerűen nő egy egyszerű trükkel

A mesterséges intelligencia pontossága ugrásszerűen nő egy egyszerű trükkel
Az MI-modellek világában az utóbbi évek az egyre bonyolultabb kérdésfeltevési módszerek fejlesztésével teltek, hogy minél pontosabb válaszokat kapjunk. A mérnökök kidolgozták már a „gondolkodj lépésről lépésre” jellegű technikákat, az emocionális motiválást, sőt bonyolult többlépéses promptolási keretrendszereket is. Most mégis úgy néz ki, túl lett gondolva a dolog. A Google Research kutatása szerint egy egészen egyszerű megoldással akár 76%-kal is növelhető az LLM-modellek pontossága olyan feladatoknál, amelyek nem igényelnek bonyolult érvelést: egyszerűen el kell ismételni a kérdést.

Miért működik a kérdésismétlés?

A Transformer architektúra, amely a legtöbb modern MI-alapú nyelvi modellt működteti, „kauzális” nyelvi modellezéssel dolgozik. Ez azt jelenti, hogy a modell a szöveget balról jobbra olvassa: amikor az ötödik szót dolgozza fel, csak az első négyet képes figyelembe venni, a hatodikat még „nem látta”. Emiatt az információ sorrendje és elrendezése kulcsfontosságú. Gyakran előfordul, hogy ha előbb van a kontextus, mint a kérdés, vagy fordítva, teljesen más választ ad a rendszer.
Nem hagyható figyelmen kívül, hogy a kérdés megismétlése megkerüli ezt a korlátozást: miközben a modell másodszor fut neki ugyanannak a kérdésnek, addigra már „emlékszik” a szöveg legelső változatára is, így egyszerre tud visszautalni a már feldolgozott részletekre – és ezáltal szignifikánsan jobb válaszokat ad.

Lenyűgöző eredmények: 47-ből 47 siker

A kutatásban hét különböző elismert MI-tesztkészlettel és hét különböző modellel (köztük Gemini, GPT-4o, Claude, DeepSeek V3) vizsgálták a technikát. Azokban a feladatokban, ahol a modellt csak rövid, egyértelmű válaszadásra kérték, az ismétléses prompt 70 összehasonlított esetből 47-szer hozott érdemi előrelépést, és egyetlen esetben sem rontott.

A leglátványosabb előrelépés a „NameIndex” teszten volt. Itt 50 névből kellett kiválasztani a 25.-et. A Gemini 2.0 Flash-Lite alapból csupán 21,33% pontossággal találta el a helyes nevet, ám ha a kérdést kétszer egymás után kapta meg, a pontosság döbbenetes 97,33%-ra ugrott.

Továbbá más modelleknél – például a Claude és a GPT-4o esetében – is mérhetően nőtt a pontosság. Bizonyos jelek arra utalnak, hogy a „kauzális vakság” miatt az első menetben elveszítheti a modell a fonalat, különösen hosszabb listák vagy részletes adatok esetén. Amikor azonban megismétlődik a kérdés, az MI jobban „fel tudja dolgozni” az egész szövegrészt.

Gyorsabb, de legalábbis nem lassabb

Az MI-modellek működése két fő szakaszból áll: előfeldolgozás (a bemenet feldolgozása), amit a GPU párhuzamosan tud végezni, és a válasz generálása, amely már tokenenként halad, lassabban. Sokan joggal gondolhatnák, hogy a kérdés megkettőzése lassabb válaszadáshoz vezet – de éppen ellenkezőleg! Az előfeldolgozás annyira hatékonyan párhuzamosítható, hogy a felhasználó szinte semmit sem érzékel a válaszidőből.
A kutatók azt találták, hogy a kérdésismétlés sem a válasz hosszát, sem a válasz első betűjéig eltelt időt nem növelte, kivéve néhány szélsőségesen nagy lekérdezés esetén az Anthropic-modelljeknél. Az esetek túlnyomó többségében viszont úgy érhető el nagyobb hatékonyság, hogy a felhasználó nem fizet érte kényelmi veszteséggel.


Mikor nem érdemes ismételni?

Fontos, hogy a módszer főként nem érvelő jellegű feladatokra alkalmas: tehát ahol ténylegesen csak egy tömör, informatív választ várunk. Amint bejön a képbe a „lépésről lépésre gondolkodás” (mint pl. egy számolási vagy problémamegoldó folyamat), az ismétlés pozitív hatása elenyésző vagy semleges lesz.

Úgy tűnik, az MI ilyenkor maga is megismétli magában a lényegi kérdést, mielőtt megoldja – így a prompt ismétlése felesleges. Azonban azokban az esetekben, ahol tömör, egyértelmű választ és gyorsaságot akarunk, az ismétlés kiugró előnyt jelenthet.

Mit jelent ez a cégek számára?

A vállalati MI-alkalmazások fejlesztőinek igazi „ingyenebédet” jelenthet az egyszerű, promptalapú optimalizáció, de érdemes okosan integrálni. Vagyis nem mindenhol érdemes automatikusan duplázni, hanem inkább a szimpla kinyerési, osztályozási vagy kérdés–válasz feladatoknál.
Mostantól, mielőtt egy nagyobb, drágább modellre váltanának csak azért, hogy javuljon a pontosság, érdemes inkább kipróbálni az egyszerű kérdésismétlést – akár 21,33%-ról 97,33%-ra ugorhat a találati arány, miközben a gyors, olcsó infrastruktúrát tudják tovább használni.

Az is logikus lépés, hogy ezt a prompt megkettőzését már az infrastruktúra szintjén, automatikusan, „láthatatlanul” oldják meg, így a végfelhasználónak és fejlesztőnek semmilyen plusz lépést sem kell tennie. Az alkalmazást menedzselő köztes réteg – API-átjáró, orchestráció – felelhet az automatizálásért. Ily módon optimalizálható a teljes rendszer, anélkül, hogy bármilyen plusz költséggel vagy lassulással kellene számolni.

Továbbá felmerül a biztonsági kérdés is: ha a kérdésismétlés tisztább üzenetet közvetít a modellnek, akkor a rosszindulatú promptok is „érthetőbbé” válhatnak. A biztonsági csapatoknak így a tesztelési protokollokat is frissíteni kell, például az ismétléses injekciós (repeat injection) támadásokkal. Ugyanakkor védelmi céllal is jó lehet ismételni – például a biztonsági előírásokat kétszer is ki lehet írni a rendszerprompt elejére.

Miért fontos mindez?

Nem hagyható figyelmen kívül, hogy a mostani MI-modellek még mindig szorosan a balról jobbra feldolgozás korlátozásai között mozognak. Amíg nem jönnek el a kauzális vakságot áthidaló új architektúrák, addig a kérdésismétlés egyszerű, de már most alkalmazható, és kiváló eredményt hozó trükk.
Lehet, hogy a jövő MI-motorjai maguktól is automatikusan megismétlik majd a kérdéseinket a háttérben – de amíg ez nem történik meg, előfordulhat, hogy a hosszú promptok finomhangolása helyett bőven elég, ha egyszerűen kétszer kérdezzük meg ugyanazt.

2025, adminboss, venturebeat.com alapján

  • Te szerinted etikus, ha egy cég automatikusan megduplázza a felhasználó kérdését anélkül, hogy azt előre jelezné?
  • Te hogyan védenéd a rendszert, ha a kérdésismétlés sérülékenységeket is okozhat?


Legfrissebb posztok

APP
csütörtök 09:11

APPok, Amik Ingyenesek MA, 6/18

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) CrestWall – 4K Wallpapers (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp:...

APP
szerda 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...