MA 21:45

A PixelRAG pontosabb a szövegfeldolgozóknál, és tizedeli az MI-ügynökök tokenköltségét

A PixelRAG pontosabb a szövegfeldolgozóknál, és tizedeli az MI-ügynökök tokenköltségét
Továbbá megemlíthető, hogy a vállalati információ-visszakeresésben eddig megszokott módszerek – ahol egyszerű szövegfeldolgozóval alakítják át a weboldalakat vagy dokumentumokat szöveggé – komoly hátrányokkal járnak. Az átalakítás során elvesznek a fontos vizuális információk, a táblázatok szerkezete, a kiemelések és az oldalelrendezés, emiatt a válasz gyakran hibás vagy hiányos. A kutatók most egy újszerű rendszert mutattak be, amely ezt a lépést átugorja: az oldalakat képként kezeli, a tartalmat képernyőfotókon keresztül tárolja, és ezekkel az adatokkal dolgozik az MI-modell. Kiderült, hogy ez az eljárás minden eddiginél pontosabb eredményeket hozott.

Mi baj van a szövegfeldolgozókkal?

A hagyományos megoldásokban a weboldalakat először többszörösen megtisztítják, darabolják, majd feldolgozzák, miközben az eredeti oldal sok részlete elveszik. Az olyan elemek, mint a képek, szerkezet, tipográfia vagy kiemelések – például félkövér szöveg vagy táblázatok – vagy eltűnnek, vagy rosszul alakulnak szöveggé. Márpedig sosem lehet minden információt tökéletesen visszaadni pusztán szövegalapú feldolgozással.

A hibák háromnegyedét az adja, hogy az eredeti információ vagy átalakul, vagy elvész az átalakítás közben: a kulcsfontosságú adatok vagy nincsenek benne az adatbázisban, vagy úgy hátrébb sorolódnak a kereséskor, hogy a felhasználó nem találja meg őket, vagy a szöveg egysíkúvá válik, és az MI rossz helyre köti az információt. Ezért az új megközelítés nem foglalkozik többé a szövegkinyeréssel, hanem képként menti az oldalakat, és azokból húz információt.

Hogyan működik a PixelRAG?

A PixelRAG egy teljesen új elvet követ: az oldalak böngészőben renderelt változatát 875 pixel szélességű, 1024 pixel magas „csempékre” vágja, a tartalom minden vizuális elemével együtt. Az információkat képkockákba menti, például a Wikipédia 7 millió cikkéből 30 millió ilyen csempe képződik. Ezeket a csempéket 2048-dimenziós vektorrá alakítja, majd egy gyors keresőindexbe teszi. Az egész index körülbelül 120 GB helyet foglal, miközben részlegesen is frissíthető.

Ahhoz, hogy az MI-modell pontos legyen, szintetikus, kontrasztos tanítóadatokkal finomhangolják – 40 ezer adatpárral, mindössze három óra alatt elvégezhető egy H100-as GPU-n. Tároláskor nincs szükség a képek állandó mentésére: elég a vektorokat eltárolni, a tényleges képet el is lehet törölni, majd lekérdezésnél újra előállítani. A képi index így is csak 120 GB-ot foglal, szemben a teljes Wikipédia képernyőfotóinak 5,6 TB-jával.

Pontosabb, gyorsabb, olcsóbb

A PixelRAG hatékonyságát hat feladaton tesztelték: lexikális Wikipédia-kérdések, táblázatadat-lekérdezések, multimodális válaszadás és élő hírek keresése során rendre megelőzte a szövegalapú rendszereket. A pontosságot akár 18,1%-kal is növelte, például az egyszerű kérdés–válasz teszten 78,8%-ot ért el, szemben a legjobb szöveges rendszer 71,6%-ával. Ugyanez a különbség a strukturált táblázatok esetében még jobban érzékelhető. Nagyobb modelleknél nő az előny, kisebbeknél viszont még mindig a hagyományos keresés vezet.

Az üzemeltetési költségek is elképesztően alacsonyak lettek: az MI-alapú kereső egyetlen vizsgálatban 3,6 millió prompt tokent használt el, szemben a szöveges kereső 37,5 milliójával. Ez az aktuális árak mellett 2–4-szeres költségcsökkenést és gyorsabb válaszidőt jelent, a pontosság növekedése mellett. A képek tömörítésével tovább csökkenthető a tokenigény, és így a költség is.


A vizuális darabolás kihívásai és a jövő

Egyetlen jelentősebb problémát az jelent, hogy a képek darabolásánál a rendszer nem veszi figyelembe, hol kezdődik vagy végződik egy fejezet vagy táblázat, mivel fix pixelszélesség és -magasság szerint vág. Ezzel szemben a szöveges rendszerek már évek óta képesek automatikusan logikus egységekre osztani a dokumentumokat. Ez a vizuális módszer legnagyobb kihívása: a fejlesztők szerint ezen a területen lesz szükség a következő időszak kutatásaira.

Mit jelent ez a nagyvállalatoknak?

A keresési minőség ugrásszerű javulása a piacon is látszik: a hibrid keresési megoldások bevezetése háromszorosára ugrott két hónap alatt, és márciusban már a cégek harmada így tervez. Az átállás egyszerű, mert a PixelRAG a meglévő szövegalapú rendszerek mellé vagy fölé is beilleszthető – nem kell mindent elölről kezdeni, elég bővíteni, hibrid módon kombinálni a vizuális és szöveges keresést. Várhatóan így működik majd minden éles üzemi rendszer a közeljövőben.

2026, adminboss, venturebeat.com alapján

  • Te szerinted etikus, ha egy gép dönt az információk fontosságáról?
  • Mit csinálnál, ha a te cégednél kellene bevezetni egy ilyen új rendszert?


Legfrissebb posztok

MA 21:34

A Stanford-kutatók visszanövesztik a porcot, visszafordítják az ízületi kopást

Az ízületi porckopás világszerte emberek millióinak életét keseríti meg: a mozgás fájdalmassá válik, a hétköznapi tevékenységek is nehézzé, küzdelmessé lesznek...

MA 21:23

Az időszakos böjt meglepő fegyver lehet az ínybetegség ellen

💫 Továbbra is kevesen gondolnának arra, hogy egy rövid távú, alacsony kalóriatartalmú diéta nemcsak a testsúlycsökkentésben lehet hasznos, hanem az íny gyulladásának csökkentésében is komoly szerepet játszhat...

MA 21:11

A SpaceX 20%-ot szárnyalt Nasdaq-premierjén

Elon Musk legendás vállalata, a SpaceX lenyűgöző startot vett a Nasdaqon: a részvények már a nyitány után 20%-kal drágultak, 162 dollárig emelkedtek, miután az elsődleges részvénykibocsátási árat 135 dolláron állapították meg...

MA 21:01

Az Asus 12V-2×6 kábele is megolvad: lángol az Nvidia-botrány

🔥 Az elmúlt hetekben felröppent a hír, hogy az Asus legújabb, elvileg minden olvadási problémát megszüntető grafikuskártya-kábele – a ROG Equalizer – szintén megadta magát, méghozzá látványosan...

MA 20:55

Az amerikai BNB ETF kitűnhet a zsúfolt kriptópiacon

💸 A világhírű VanEck vagyonkezelő új, Nasdaqon jegyzett BNB ETF-jével mostantól bárki egyszerűen fektethet a Binance Coinba hagyományos brókerszámlán keresztül...

MA 20:44

A kutatók meglepő kapcsolatot találtak az Alzheimer-kór és a rák között

🤔 A tudomány régóta vizsgálja, hogyan befolyásolják az öregedéssel együtt járó genetikai változások a betegségek kialakulását...

MA 20:34

A Gothic Remake eladásai mutatják: még mindig imádjuk a eurojankot

🖤 Lényeges, hogy a 25 éves klasszikus szerepjáték újjáélesztett verziója, a Gothic Remake, elképesztő rajttal már egy hét alatt elérte az 500 000 eladott példányt...

MA 20:23

A Sonyt kár okolni: ex–Destiny 2 CM szerint a Bungie majdnem bezárt

A Destiny 2 rajongótábora most különösen nehéz időszakon megy keresztül: a játék az utóbbi időben gyakorlatilag parkolópályára került...

MA 20:12

Az amerikai kormány 2 milliárdot rátesz a kvantumszámításra, a védelem lemarad

💸 Az USA nem kevesebb mint 730 milliárd forintot fektet be a kvantumszámítógépek fejlesztésébe, miközben a másik oldalon, a védelem oldalán veszélyesen lelassult az innováció...

MA 19:56

A vb-házigazda Kanada Bosznia-Hercegovina ellen rajtol az első pontokért

Megemlíthető továbbá, hogy Toronto péntek este igazi futballünnepet ígér, hiszen a 2026-os labdarúgó-világbajnokság egyik házigazdája, Kanada Bosznia és Hercegovina ellen kezdi meg szereplését a B csoport nyitómeccsén...

MA 19:45

Az új SKYLRK Bluetooth-hangszórók, amiket a B&O is megirigyelne

🎧 Justin Bieber legújabb fejlesztéseivel rukkolt elő saját lifestyle márkája, a SKYLRK égisze alatt, ahol most két vadonatúj Bluetooth hangszóró és egy vezeték nélküli fejhallgató jelentek meg...

MA 19:34

A holland civil perelné a Valve-ot a magasan tartott árak miatt

💳 Évek óta a Steamre gondolva hatalmas leárazások, filléres játékhegyek és véget nem érő akciók jutnak eszünkbe, nem a magas árak...

MA 19:23

A Kalshi kriptós örökös határidős ügyletei újraélesztik a határidős–swap vitát

📈 Az amerikai pénzpiacokon újra fellángolt a vita: vajon hogyan is kellene szabályozni a kriptovaluta-befektetések egyik legnépszerűbb termékét, az örökös (perpetual) szerződést?..

MA 19:12

Az apró pórusok megváltoztathatják, hogyan tisztítja a világ a vizet

💧 Egészen új távlatok nyíltak meg az ipari víztisztítás és a vegyszerek leválasztásának jövőjében, miután kutatók egy hihetetlenül pontos, egy nanométeres pórusokkal rendelkező membránt fejlesztettek ki...

MA 19:01

A pénztárcabarát, pehelykönnyű pajzs: Norton Antivirus Plus teszt

Az online fenyegetések világában egyre fontosabb az okoseszközök gyors és zökkenőmentes védelme...

MA 18:57

A Tejútrendszer peremén a Kis Magellán-felhőt nagytestvére tépi szét

A Tejútrendszer peremén jelenleg is látványos dráma zajlik: a Kis Magellán-felhőt szó szerint szétszakítja nagyobb társa, a Nagy Magellán-felhő...

MA 18:47

A nép szava: a Resident Evil Veronica milliós kívánságlistát ér el

A Resident Evil Veronica bejelentése után szinte pillanatok alatt tarolt: kevesebb mint egy hét alatt egymillió kívánságlistára került PlayStation 5-ön és PC-n is...

MA 18:36

Az alaszkai gleccserek ijesztő válasza: három héttel hosszabb az olvadás

Felmerül a kérdés, hogy mennyire érzékenyek az alaszkai gleccserek a hőmérséklet-emelkedésre...

MA 18:26

A kivonások dacára a Bitcoin ETF-befektetők többsége kitart

Nehéz elhinni, de a Bitcoin ETF-ből már mintegy 3,27 billió forint értékű tőke távozott idén, mégsem omlott össze a piac...

MA 17:35

A Silent lapjai, amelyekkel Ascension 10-ig jutottam a Slay the Spire 2-ben

Az Ascension 10 teljesítése a Slay the Spire 2-ben nem tökéletes pakliépítésen múlik, hanem azon, hogy mennyire gyorsan és hatékonyan tudod megszüntetni a kezdőpaklid gyengeségeit...

MA 17:23

A legendás Rick James fia börtönben: Tazman Johnsont droggal vádolják

Rick James fia, Tazman Johnson jelenleg a Los Angeles megyei börtönben van, súlyos vádak miatt...

MA 16:45

A SpaceX tőzsdei rajtja: zuhanás vagy rakétázás a kriptónak?

🚀 Egy lényeges szempont, hogy hónapok várakozása után ma megkezdődik a SpaceX részvényének kereskedése a Nasdaqon, miután a befektetők 75 milliárd dollárt – azaz közel 27 000 milliárd forintot – öntöttek a valaha volt legnagyobb tőzsdei bevezetésbe...

MA 16:34

Az Arm AI-s sugárkövetéssel kihívja az AMD-t és az Intelt kézikonzolokban

Noha sokan csak a telefonjukról ismerik az Arm-chipeket, most kiderült, hogy ezek jóval többre is képesek...

MA 16:23

A Top Gun: Maverick színésze, James Handy halála: kés és fojtás

🔥 A 81 éves James Handy, akit a Top Gun: Maverick (Top Gun: Maverick) című filmben is láthattunk, brutális támadás áldozata lett Los Angeles-i otthonában...

MA 16:12

A Monero 33%-ot száguldott, 438 dollárig, 120 milliós blokkláncon zajló pénzmosás közepette

📈 A Monero árfolyama hirtelen 33%-ot ugrott, elérve a 438 dollár (kb...

MA 16:01

A Havn HS 360, a HS 420 kisebb, könnyebb és okosabb kistestvére

Az asztali számítógépházak világában sokan ismerhetik a masszív és látványos HS 420-at, amelynek most megérkezett a kisebb testvére...

MA 15:35

Az üvöltés lelassíthatja a szervereket: meghökkentő tény a HDD-kről

😱 Ez a jelenség jól illusztrálható azzal, hogy minden szerverteremben ott lapulnak a kis alumínium-, réz- és kerámiadobozkák, amelyek egészen emberi tulajdonságokat hordoznak – legalábbis amikor úgy viselkednek, mint egy sértődött munkatárs: ha rájuk ordítasz, lelassulnak...

MA 15:12

A Bitcoin 63 ezernél toporog: jön a bikák kálváriája?

📈 A hét elején látványos mélységbe, 59 000 dollárig zuhant le a bitcoin árfolyama, majd visszakapaszkodott 63 000 dollár környékére...

MA 15:01

Az új AirPods EQ már elérhető — még nem érdemes frissíteni

Az Apple végre elhozta az AirPods felhasználóinak az egyéni hangszínszabályzást (EQ-t), amire sokan régóta vártak...