
A hibrid visszakeresés előretörése
A legtöbb vállalat már nem egyetlen visszakeresési módszerre (például csak vektoralapú keresésre) támaszkodik. A hibrid visszakeresés ötvözi a sűrű, vektoralapú keresést a ritka kulcsszavas kereséssel és újrarangsoroló rétegekkel. Ez a megközelítés összetettebbé teszi a rendszert, viszont nagyobb pontosságot, rugalmasságot és jobb hozzáférés-ellenőrzést biztosít – ezek elengedhetetlenek az ügynökalapú MI-nél.
A tisztán vektoralapú adatbázisok (mint a Weaviate, Milvus, Pinecone vagy Qdrant) népszerűsége csökken. A piac egyre inkább a saját fejlesztésű megoldások, illetve a szolgáltatók natív visszakeresési megoldásai felé fordul. Egyre több vállalat ismerte fel, hogy a régi, csak dokumentum-visszakeresésre alkalmas architektúra nem képes kiszolgálni az egyre összetettebb és nagyobb volumenű MI-munkákat.
A gyors növekedés ára: mindent újjá kell építeni
A legnagyobb elmozdulás a vállalatok stratégiájában, hogy a fókusz áthelyeződött az értékelésről és relevanciavizsgálatról a visszakeresési rendszerek optimalizálására. Az év elején a költségvetési prioritás még az értékelés és tesztelés volt (32,8 százalék), márciusra viszont az optimalizálás lépett az első helyre (28,9 százalék).
A HyperFRAME Research szakértője, Steven Dickens szerint a folyamatos komponenshalmozás és széttagoltság eljutott a DevOps-terhelhetőség határára. A vállalatok egy része integrált, testreszabott rendszert épít, hogy csökkentsék a komplexitást – 35,6 százalékuk már így tesz. Ugyanakkor sok, főleg egészségügyi, oktatási és állami szervezet még nem is rendelkezik élesben futó RAG-megoldással. Míg januárban csak 8,6 százalékuk, márciusra már 22,2 százalékuk jelezte, hogy még nincs bevezetve ilyen rendszerük.
Tovább élnek a dedikált vektoralapú megoldások
Bár a tisztán vektoralapú adatbázisok visszaszorulnak, bizonyos speciális alkalmazásokban továbbra is nélkülözhetetlenek. Például az &AI több százmillió dokumentumon, valós forrásokra támaszkodva futtat szabadalmi kereséseket; náluk az ügynök csak a felület, a vektoradatbázis jelenti az egyedüli hiteles forrást. A GlassDollar, amely startupokat értékel a Siemens és a Mahle számára, közel 10 millió dokumentumon keresztül futtat párhuzamos kereséseket: náluk is csak a külön erre a célra készült vektoralapú infrastruktúra tudja a szükséges mennyiségű és pontosságú keresést biztosítani.
Ebben a szegmensben már nem a visszakeresési pontosság, hanem a megbízhatóság vált lényegessé. Az év elején a fő érvek a hozzáférés-ellenőrzés és a pontosság voltak, márciusra skálázás esetén a megbízhatóság fontossága több mint kétszeresére ugrott, elérve a 31,1 százalékot. Vagyis az üzemeltetők a vektorréteget már nem elsősorban a pontosság miatt tartják fent, hanem mert magas lekérdezésszám esetén ez az egyetlen stabil eleme a rendszerüknek.
Újraértelmezett elvárások a visszakeresésnél
A vállalatok a korábbitól eltérően már nem csak a válaszok helyességét nézik, hanem a visszakeresési pontosságot és a relevanciát is. Míg januárban a válasz helyességét 67,2 százalék jelölte meg legfontosabb kritériumnak, márciusban a helyesség, a visszakeresés minősége és a relevancia is épp ugyanannyira (53,3 százalék) vált lényegessé. A relevancia – vagyis hogy tényleg a kérdéshez kapcsolódó, legmegfelelőbb dokumentum kerüljön elő – az egyetlen kritérium, amely a negyedév során nőtt, jelezve, hogy egyre kifinomultabb a piac.
Ez a fejlettség már a célzott mérésen is látszik: a puszta igaz–hamis eredmények helyett dedikált, folyamatosan fejlesztett értékelő eszközökre van igény.
Nem a visszakeresés, hanem az eredeti RAG-architektúra bukott el
Feltételezhető, hogy sokan úgy vélték: a RAG-szemlélet ideje lejárt. A hosszú kontextusablakos MI-modellek, amelyek akár több százezer tokennyi tartalommal is elboldogulnak, vagy az ügynöki memóriarendszerek (amelyek a tudást nem mindig hívják be újra), kiválthatják a visszakeresési rendszereket.
Az adatok viszont mást mutatnak: a hosszú kontextusablakos architektúrák piaci súlya januárban még 15,5 százalék volt, februárra 3,5 százalékra zuhant, márciusban pedig csak 6,7 százalékot ért el. Ezek a megoldások nem tudják kiváltani az alapvető keresési funkciókat, főleg nagy volumenű adattárak esetén.
Az ügynöki memóriarendszerek sem jelentik a végső választ. A nagy visszakeresési adatbázis ugyanis még mindig a rendszer alapja marad, amelyet sem a memóriaréteg, sem a kontextusablak nem tud teljesen kiváltani.
A legfontosabb kérdés azonban még mindig megválaszolatlan: a válaszadók között meredeken nőtt azok aránya, akik nem várnak nagyszabású RAG-bevezetésekre még év végéig sem – 3,4 százalékról 15,6 százalékra ugrott ez az arány. Vagyis nem a visszakeresési megközelítéssel, hanem a korábban kialakított rendszerek architektúrájával van baj.
RAG-újraindítás: kötelező újragondolni az alapokat
A vállalatok nagy része érzi: pusztán a régi, dokumentumalapú rendszerek toldozása nem vezet eredményre. A piaci adatok szerint új korszak kezdődik – 33 százalékuk számára az újraépítés már most alapvető prioritás. A hibrid visszakeresés felé vezető út közös nevezőnek tűnik. Aki még most bővítene RAG-alapú munkafolyamatokat, annak már ezeket a tapasztalatokat is figyelembe kell vennie. Az MI visszakeresése nem halt meg – csak a régi architektúra ideje járt le. Az újjáépítés pedig már el is indult.
