2026. 06. 12., 21:45

A PixelRAG pontosabb a szövegfeldolgozóknál, és tizedeli az MI-ügynökök tokenköltségét

Továbbá megemlíthető, hogy a vállalati információ-visszakeresésben eddig megszokott módszerek – ahol egyszerű szövegfeldolgozóval alakítják át a weboldalakat vagy dokumentumokat szöveggé – komoly hátrányokkal járnak. Az átalakítás során elvesznek a fontos vizuális információk, a táblázatok szerkezete, a kiemelések és az oldalelrendezés, emiatt a válasz gyakran hibás vagy hiányos. A kutatók most egy újszerű rendszert mutattak be, amely ezt a lépést átugorja: az oldalakat képként kezeli, a tartalmat képernyőfotókon keresztül tárolja, és ezekkel az adatokkal dolgozik az MI-modell. Kiderült, hogy ez az eljárás minden eddiginél pontosabb eredményeket hozott.

Mi baj van a szövegfeldolgozókkal?

A hagyományos megoldásokban a weboldalakat először többszörösen megtisztítják, darabolják, majd feldolgozzák, miközben az eredeti oldal sok részlete elveszik. Az olyan elemek, mint a képek, szerkezet, tipográfia vagy kiemelések – például félkövér szöveg vagy táblázatok – vagy eltűnnek, vagy rosszul alakulnak szöveggé. Márpedig sosem lehet minden információt tökéletesen visszaadni pusztán szövegalapú feldolgozással.

A hibák háromnegyedét az adja, hogy az eredeti információ vagy átalakul, vagy elvész az átalakítás közben: a kulcsfontosságú adatok vagy nincsenek benne az adatbázisban, vagy úgy hátrébb sorolódnak a kereséskor, hogy a felhasználó nem találja meg őket, vagy a szöveg egysíkúvá válik, és az MI rossz helyre köti az információt. Ezért az új megközelítés nem foglalkozik többé a szövegkinyeréssel, hanem képként menti az oldalakat, és azokból húz információt.

Hogyan működik a PixelRAG?

A PixelRAG egy teljesen új elvet követ: az oldalak böngészőben renderelt változatát 875 pixel szélességű, 1024 pixel magas „csempékre” vágja, a tartalom minden vizuális elemével együtt. Az információkat képkockákba menti, például a Wikipédia 7 millió cikkéből 30 millió ilyen csempe képződik. Ezeket a csempéket 2048-dimenziós vektorrá alakítja, majd egy gyors keresőindexbe teszi. Az egész index körülbelül 120 GB helyet foglal, miközben részlegesen is frissíthető.

Ahhoz, hogy az MI-modell pontos legyen, szintetikus, kontrasztos tanítóadatokkal finomhangolják – 40 ezer adatpárral, mindössze három óra alatt elvégezhető egy H100-as GPU-n. Tároláskor nincs szükség a képek állandó mentésére: elég a vektorokat eltárolni, a tényleges képet el is lehet törölni, majd lekérdezésnél újra előállítani. A képi index így is csak 120 GB-ot foglal, szemben a teljes Wikipédia képernyőfotóinak 5,6 TB-jával.

Pontosabb, gyorsabb, olcsóbb

A PixelRAG hatékonyságát hat feladaton tesztelték: lexikális Wikipédia-kérdések, táblázatadat-lekérdezések, multimodális válaszadás és élő hírek keresése során rendre megelőzte a szövegalapú rendszereket. A pontosságot akár 18,1%-kal is növelte, például az egyszerű kérdés–válasz teszten 78,8%-ot ért el, szemben a legjobb szöveges rendszer 71,6%-ával. Ugyanez a különbség a strukturált táblázatok esetében még jobban érzékelhető. Nagyobb modelleknél nő az előny, kisebbeknél viszont még mindig a hagyományos keresés vezet.

Az üzemeltetési költségek is elképesztően alacsonyak lettek: az MI-alapú kereső egyetlen vizsgálatban 3,6 millió prompt tokent használt el, szemben a szöveges kereső 37,5 milliójával. Ez az aktuális árak mellett 2–4-szeres költségcsökkenést és gyorsabb válaszidőt jelent, a pontosság növekedése mellett. A képek tömörítésével tovább csökkenthető a tokenigény, és így a költség is.

A vizuális darabolás kihívásai és a jövő

Egyetlen jelentősebb problémát az jelent, hogy a képek darabolásánál a rendszer nem veszi figyelembe, hol kezdődik vagy végződik egy fejezet vagy táblázat, mivel fix pixelszélesség és -magasság szerint vág. Ezzel szemben a szöveges rendszerek már évek óta képesek automatikusan logikus egységekre osztani a dokumentumokat. Ez a vizuális módszer legnagyobb kihívása: a fejlesztők szerint ezen a területen lesz szükség a következő időszak kutatásaira.

Mit jelent ez a nagyvállalatoknak?

A keresési minőség ugrásszerű javulása a piacon is látszik: a hibrid keresési megoldások bevezetése háromszorosára ugrott két hónap alatt, és márciusban már a cégek harmada így tervez. Az átállás egyszerű, mert a PixelRAG a meglévő szövegalapú rendszerek mellé vagy fölé is beilleszthető – nem kell mindent elölről kezdeni, elég bővíteni, hibrid módon kombinálni a vizuális és szöveges keresést. Várhatóan így működik majd minden éles üzemi rendszer a közeljövőben.

2026, adminboss, venturebeat.com alapján

filózó

Te szerinted etikus, ha egy gép dönt az információk fontosságáról?
Mit csinálnál, ha a te cégednél kellene bevezetni egy ilyen új rendszert?

Legfrissebb posztok

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

Tudomány

MA 09:49

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

💨 A Microsoft károsanyag-kibocsátása tavaly 25%-kal nőtt, ami főleg az adatközpontok gyors terjeszkedésének köszönhető...

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

MI Hírek

MA 09:37

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

📱 A Google ismét újat mutat a Pixel okostelefonok világában – mostantól az eszközökön futó mesterséges intelligencia még erősebbé teszi a mobilokat, úgy, hogy közben védi a felhasználók adatait...

APP

MA 09:11

APPok, Amik Ingyenesek MA, 7/15

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Between Dates Calendar Math (iPhone/iPad)A Between Days alkalmazás egyszerű és gyors megoldást kínál két dátum közötti napok kiszámítására...

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Színes

MA 09:01

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Az Észak-Minnesotában pusztító erdőtüzek füstje hamarosan elérheti az Egyesült Államok északkeleti nagyvárosait, többek között Detroitot, Milwaukee-t, Clevelandet, Philadelphiát és New Yorkot...

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

Tudomány

MA 08:49

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

A Minnesotai Egyetem laboratóriumában újszerű biológiai eredmény született: egy aprócska SpudCell nevű képződmény képes táplálkozni, növekedni, versengeni, osztódni és lemásolni önmagát – vagyis szinte mindent tud, amit egy élő sejt is...

MI Hírek

MA 08:36

Az új Google Képek Pinterest-szerű, felfedezésre kihegyezett átalakítást kapott

A Google Képek (Google Images) megújult külsőt kapott: mostantól személyre szabott galériákat kínál a felhasználóknak, így még könnyebben fedezhetik fel az őket érdeklő képeket...

MI Hírek

MA 08:12

A Google DeepMind az USA-t tenné az MI-szabványok élére

A Google DeepMind vezére, Demis Hassabis szerint az új generációs mesterséges intelligencia egyre komolyabb veszélyeket rejt magában, például a kiberbiztonság és a biológiai fenyegetések terén...

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

Tudomány

MA 08:01

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

💊 Fontos kérdés, hogy meg lehet-e állítani vagy lassítani az Alzheimer-kór lefolyását, hiszen a demencia legfőbb oka, az Alzheimer-kór, világszerte rengeteg embert érint...

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

Tudomány

MA 07:49

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

🚀 Sikeresen megérkezett kedden a Nemzetközi Űrállomásra egy amerikai–orosz személyzet, miután a kazahsztáni Bajkonurból indultak a Roszkoszmosz által üzemeltetett Szojuz MS-29 fedélzetén...

Tudomány

MA 07:37

A Microsoft Secure Bootja tíz éve lyukas, észre sem vették

🔒 Az informatika egyik legfontosabb biztonsági eleme, a Secure Boot, már csaknem tíz éve lényegében védtelenné vált – és ezt eddig senki sem vette észre...

A csípős paprika növelheti egy halálos rák kockázatát?

Tudomány

MA 07:24

A csípős paprika növelheti egy halálos rák kockázatát?

Bár a csípős paprika számos kultúra elválaszthatatlan része, és egyes laboratóriumi kísérletek a bennük található vegyületeket, például a kapszaicint gyulladáscsökkentőnek vagy akár daganatellenesnek mutatják, az utóbbi évek humán kutatásai nem ennyire egyértelműek...

Tudomány

MA 07:02

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Április 6-án négy űrhajós indult el az Artemis II misszió keretében az Orion űrhajóval, és körülbelül 40 percig teljesen eltűntek a Föld látóteréből...

A Microsoft rekordméretű javításözöne: 570 hiba és 3 zero-day

Színes

MA 06:38

A Microsoft rekordméretű javításözöne: 570 hiba és 3 zero-day

🔧 Szinte példátlanul nagy frissítési csomagot adott ki a Microsoft a 2026...

A volt dolgozók részrehajló MI-t sejtenek a leépítések mögött – perelik a Metát

MI Hírek

MA 06:25

A volt dolgozók részrehajló MI-t sejtenek a leépítések mögött – perelik a Metát

💼 Májusban a Meta megvált dolgozóinak 10 százalékától, közel 8 000 alkalmazottat küldött el, ami jelentős átszervezéssel járt a vállalat MI-re és adatközpontokra irányuló fejlesztései miatt...

HistoryToday

MA 06:05

Történelmi események a mai napon (Július 15.)

Időutazás egyetlen napon: Jeruzsálem falainak áttörésétől 🏰 a Rosetta-kő 🗿 megtalálásán és Napoleon 🚢 megadásán át a Grunwaldnál vívott döntő ütközetig ⚔️, sőt a modern korszakban a törökországi puccskísérletig 🇹🇷 és a Mozilla alapításáig 🦊...

Tudomány

kedd 18:31

Az Ozempic és a Wegovy tényleg lassíthatják a biológiai öregedést?

Tipikus eset, amikor egy ismert gyógyszer egészen váratlan előnyöket kínál. A GLP-1 típusú szerek, mint az Ozempic, a Wegovy vagy a Rybelsus, eredetileg a fogyás, a jobb vércukorszint-szabályozás és a szívbetegségek kockázatának csökkentése miatt váltak népszerűvé...

Tudomány

kedd 17:30

Az indiai tudósok megalkották az emberi agytörzs eddigi legrészletesebb 3D-atlaszát

Indiai kutatók a világ eddigi legrészletesebb, háromdimenziós agytörzs-atlaszát hozták létre, amelyben MRI-felvételeket több mint 500 mikroszkópos szövetrészlettel kapcsoltak össze...

Tudomány

kedd 17:01

A Tejútrendszer mélyén cukrot találtak a kutatók

Többek között különleges eredményre jutottak a kutatók: a Tejútrendszer középpontjához közel egy óriási gázfelhőben felfedeztek egy ritka cukorfélét, az eritrózt, amely nemcsak málnában, hanem barnító krémekben is megtalálható...

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Kriptó

kedd 16:01

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Ami kezdetben ártalmatlannak tűnt, végül az IBM történetének egyik legsötétebb napjához vezetett a tőzsdén...

Tudomány

kedd 15:01

A NASA Perseverance-je célba ért: megvan a marsi maraton

🚀 Történelmi teljesítmény született a Marson: a Perseverance marsjáró öt év és négy hónap után elérte a 42,195 kilométeres maratoni távot...

Színes

kedd 12:01

A régi T‑Mobile-csomagoknak vége: kényszerváltás már ezen a héten

Ami kezdetben ártalmatlannak tűnt, most minden régi T-Mobile-előfizető számára valódi változás: a társaság e héttől kezdve automatikusan átsorolja a 10–15 éves tarifákat – például a Simple Choice, T-Mobile One, One Plus, a Magenta családhoz tartozó, valamint a Sprintből áthozott régi csomagokat – modernebb tarifákra...

Kriptó

kedd 11:31

Az inflációs adat előtt megroggyan a Bitcoin

A legnagyobb kriptovaluták teljesítménye az elmúlt 24 órában jelentősen visszaesett, miután egyre többen valószínűsítik, hogy az amerikai jegybank akár már júliusban kamatemelés mellett dönt...

Az analóg fotózás visszatér: a fiatalok újra tekercsre lőnek

Színes

kedd 11:02

Az analóg fotózás visszatér: a fiatalok újra tekercsre lőnek

Az elmúlt pár évben váratlan fordulat történt a fotózás világában: a fiatal generáció újra felfedezte a filmes fényképezőgépeket...

MI Hírek

kedd 10:49

A Turing-mítosz vége: lehet, hogy tévedett a mesterséges intelligenciáról?

🤔 A mesterséges intelligencia kutatása 75 éve követi Alan Turing útmutatását, aki két alapvető feltételezést tett: az intelligencia létrehozható szoftverből, függetlenül a testtől, és hogy egy gép intelligensnek számít, ha sikerrel utánozni tudja az embert, például egy beszélgetés során...

Az MI átírja a marketinget: a régi szabályoknak befellegzett

MI Hírek

kedd 10:37

Az MI átírja a marketinget: a régi szabályoknak befellegzett

💡 A Fortune 500 cégek vezető marketingesei kénytelenek szembenézni azzal a ténnyel, hogy a korábbi, jól bevált módszerek egyszerűen elavultak...

A júliusi Google-frissítés felturbózza a Play Áruházat, Wear OS-t és a Térképet

Színes

kedd 10:25

A júliusi Google-frissítés felturbózza a Play Áruházat, Wear OS-t és a Térképet

🚀 A legújabb Google System-frissítés idén nyáron ismét ráncfelvarrást hoz az Android-felhasználóknak...

Színes

kedd 10:01

Végre itt a hideg vízzel elkészíthető Cup Noodles!

🍹 Lényeges szempont, hogy az instant tészták villámgyors megoldást kínálnak, legyen szó egyetemista vacsoráról vagy gyors munkahelyi ebédről...

Színes

kedd 09:48

A Pixel frissítése végre kézre álló csengőhang-, ébresztő- és értesítéskezelést ad

A Google a Pixel telefonokon jelentősen megkönnyíti a csengőhangok, az ébresztők és az értesítések hangerejének szabályozását...

Színes

kedd 09:37

A legnagyobb japán taxitársaság leállította rendszereit kibertámadás után

Felmerül a kérdés, hogy mi történik egy nagyvállalattal, ha leáll a teljes informatikai rendszere?..