MA 08:57

Az MI-keresők rejtett hibái: veszélyben a vállalati rendszerek

Az MI-keresők rejtett hibái: veszélyben a vállalati rendszerek
Úgy tűnik, hogy azok a vállalati fejlesztőcsapatok, amelyek gondosan finomhangolják a RAG (Retrieval-Augmented Generation) beágyazó modelljeiket, ezzel jelentősen, akár 40%-kal is ronthatják a visszakeresés pontosságát. Ez a hiba különösen komoly gondot jelenthet az úgynevezett agentikus MI-folyamatokban, ahol a visszahozott eredmények minősége közvetlenül befolyásolja az ügynökök (MI-agentek) döntéseit és válaszait. Egyetlen hibás visszahozás klasszikus kereső esetében csak téves választ jelent, de egy összetett, többlépcsős folyamatban akár egész cselekvési láncot is rossz irányba terelhet.

Miért okoz gondot a finomhangolás?

Nem kizárt, hogy a fejlesztők körében elterjedt félreértés él arról, hogyan működik valójában a szemantikai alapú információvisszakeresés. A Redis kutatásai kimutatták, hogy ha egy beágyazó modellt úgy tréningeznek, hogy az jól felismerje a mondatok szerkezeti különbségeit – például azt, hogy a “A kutya megharapta az embert” és “Az ember megharapta a kutyát” egészen mást jelent –, akkor ezzel együtt jelentősen csökken a modell általánosítási képessége. Azaz a modell kevésbé lesz képes helyesen visszahozni információt olyan témákból, amelyekre eredetileg nem tanították be. Míg kisebb modelleknél a csökkenés csak 8-9%, egy közepes, jelenleg is élesben használt modell esetében elérte a 40%-ot. Ez azért veszélyes, mert a vállalati MI-folyamatok egész lánca épül a visszakeresés megbízhatóságára.

A beágyazó modellek korlátai

Ezek a modellek egy teljes mondatot egyetlen pontra redukálnak egy sokdimenziós térben, majd egy lekérdezésnél ehhez keresik a legközelebbi pontokat. Ez kiválóan működik, ha hasonló témákat és dokumentumokat kell összepárosítani, de csődöt mond, ha két, majdnem azonos szóhasználatú, ám ellentétes értelmű mondat között kell különbséget tenni. A szerkezeti különbségek ugyanis – például tagadás, szórend – gyakran elvesznek, mert a modellek inkább a szóhasználatra, mint a mondat szerkezetére fókuszálnak. Ha viszont a modellt arra képezzük ki, hogy ezeket a szerkezeti különbségeket meglássa, akkor éppen az általános visszakeresési képességek rovására történik az előrelépés. Ráadásul a pontatlanságok éppen azoknál a mondatszerkezeti hibáknál maradnak fenn, amelyek a legnagyobb gondot okozhatják, például szerződéses jogviszonyok esetében.

A megszokott megoldások kudarcai

Sokan próbálkoznak kulcsszavas kereséssel kombinált rendszert fejleszteni, de ezek az eljárások nem tudnak különbséget tenni hasonló szavakból álló, de eltérő jelentésű mondatok között – így például a “Róma közelebb van, mint Párizs” és “Párizs közelebb van, mint Róma” ugyanúgy esik áldozatul.

Az ún. MaxSim újrarangsorolás, ahol szavanként pontozzák a lekérdezést és a dokumentumokat, ugyan javítja az általános relevanciaértékeket, de továbbra is pontatlan marad, ha szerkezeti különbséget kell felismerni. A MaxSim ugyanis a hasonlóságot keresi, de teljesen vak a jelentésbeli különbségekre és viszonyokra.

A keresésbe bevont Cross-encoder megoldások, amikor az MI minden szót mindennel összehasonlít, kiválóan működnek laboratóriumi körülmények között, de valós, nagy lekérdezésszám mellett túl lassúak és drágák.

Az újabbnak számító agentikus, kontextuális memóriát alkalmazó rendszerek sem oldják meg a problémát, hiszen ők is alapvetően a visszakeresés során hibázhatnak.


Kétlépcsős megoldás: előszűrés és megerősítés

Az egyetlen hatékony módszer a két szakaszból álló rendszer: az első szakaszban egy gyors, hagyományos beágyazó modell széles spektrumból visszahozza a legvalószínűbb találatokat. A második szakaszban egy kisméretű, tanított Transformer-modell minden egyes potenciális találatot token szinten, szóról szóra összevet a lekérdezéssel, hogy felfedje a szerkezeti eltéréseket. Ez az ellenőrző lépés az, amire a szimpla vektorkeresés nem képes.

A vizsgálatok szerint ez az új, kétlépéses architektúra megbízhatóbban szűrte ki a szerkezeti hibákat, mint bármelyik másik módszer. Igaz ugyan, hogy ezzel a módszerrel mindig kompromisszumot kell kötni: a második, ellenőrző szakasz extra késleltetést jelent. A késleltetés attól függ, mennyi találatot vizsgálunk így át: jogi vagy pénzügyi alkalmazásoknál minden lekérdezésnél szükséges lehet, általános keresésnél elég lehet a szűrt halmaz egy részét vizsgálni.

Tanulságok vállalatok számára

A jó hír, hogy a vállalatoknak nem kell teljesen újraépíteniük meglévő rendszerüket. Lényeges azonban, hogy a fejlesztők tisztában legyenek az MI-alapú visszakereső rendszerek valós viselkedésével, és ne dőljenek be a teszteredményeknek vagy általános benchmark-pontszámoknak. Rajamohan, a kutatás vezetője, három szempontot tart szem előtt: helyes válasz, teljesség és hasznosság. Ha valamelyikben hiba csúszik, az végiggyűrűzik a teljes rendszerben.

Szintén fontos megjegyezni, hogy maga a RAG-architektúra nem elavult, viszont a túlfinomhangolt, egyfázisú rendszerek önmagukban nem alkalmasak komolyabb, precíziós igényű vállalati munkára. A kétlépcsős modell valós megoldás, de mindenki számára egyértelmű kompromisszummal jár: a nagyobb pontosság extra időráfordítást jelent.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 12:24

Az MI-láz berobban: a Netcompany új korszakot nyit az INEOS Cyclingnél

Az INEOS Cycling öt évre szóló együttműködést kötött a dán Netcompanyval, hogy forradalmasítsák a profi országúti kerékpározást MI-alapú technológiával...

MA 10:37

Az új Logitech G512 X: a gamer billentyűzet, amire vártunk?

A Logitech G512 X bizonyítja, milyen sokat számítanak az okos tervezési megoldások és az innováció a gamer billentyűzetek piacán...

MA 10:29

A mesterséges intelligencia feltámasztja a halott projekteket

Érdekes felvetés, hogy a hosszú hétvégék után az e-mail-fiókunkba belépve rendre találkozunk olyan projektekkel, amelyek sem előre nem haladtak, sem nem törölték őket...

MA 10:22

Jön az újabb japán kamatemelés? Szárnyal a jen, esik a bitcoin

💰 A japán jegybank keddi döntése nyomán egyre erősebbek a várakozások, hogy már júniusban nőhetnek a hitelfelvételi költségek...

MA 10:14

Az Ondo Finance új dimenzióba repíti a tokenizált részvényeket

Az Ondo Finance forradalmasítja a tokenizált részvényeket és ETF-eket azzal, hogy bevezeti a meghatalmazotti szavazás lehetőségét...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/28

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad)A Between Days alkalmazás lehetővé teszi, hogy könnyedén megtudd, hány nap választ el két dátumot egymástól...

MA 08:50

Az áttörés: Végre repedés nélkül fagyaszthatók a beültethető szervek

A szervátültetés sokáig versenyt futott az idővel: a donorszervek eltarthatósága szűk keresztmetszetet jelent, gyakran csak órákban mérhető...

MA 08:43

Az XRP mélyrepül: az eladók veszik át az irányítást

📉 Tipikus eset, amikor egy régóta várt támaszpont hirtelen enged el: az XRP éppen most esett 3%-ot, erős forgalom mellett 420 forint (1,40 USD) alá szakadt, és ezzel utat nyitott a további lejtmenetnek...

MA 08:36

A drága olaj és az MI fékezi a bitcoint, a Fed tétlen

📈 Kissé leült a bitcoin: 3 százalékos mínuszban, 28,6 millió forint környékén ingadozik, miközben a befektetők kivárnak a sűrű amerikai makrogazdasági hét előtt...

MA 08:29

Az olajár száguld, a kriptók mélyrepülésben

Kedd reggelre jelentős esést produkált a kriptopiac: a Bitcoin értéke 76 923 dollárra (kb...

MA 08:22

Az amerikai Bitcoin-őrület véget ér?

💸 A Bitcoin gyors és látványos emelkedése után megállt a lendület, a kriptovaluta árfolyama pedig egyre több gyengeségre utaló jelet mutat...

MA 08:15

A két kilométer mélyen rejtőző aranygömb meglepő titka

🪙 Több mint két kilométer mélységben találtak rá a titokzatos arany gömbre az Alaszkai-öbölben, ami éveken át lázban tartotta a tudósokat és a laikusokat egyaránt...

MA 08:01

Az automatizált iPaaS forradalmasítja az ellátási láncokat

⚡ Az ellátási láncokban a hagyományos integrációs modellek már nem bírják a terhelést...

MA 07:56

A MARA Alapítvány harcba száll a Bitcoin jövőjéért

💸 Megemlíthető, hogy Las Vegasban, a Bitcoin Conference rendezvényén Fred Thiel, a MARA Holdings vezérigazgatója bejelentette a MARA Foundation megalapítását, amelynek célja a Bitcoin-hálózat hosszú távú biztonságának és alkalmazkodóképességének garantálása...

MA 07:49

Az elfojtott stressz alattomosan kikezdi az emlékezetet

🤯 Az idősebb kínai amerikaiak körében végzett kutatás szerint azok a stresszfajták, amelyeket az emberek magukba fojtanak, jelentősen növelhetik a memóriazavar kialakulásának esélyét...

MA 07:43

Az egyetemisták kozmikus rádióval űzik a sötét anyagot

📺 Érdemes megérteni, hogy egyetemi hallgatók is képesek lehetnek valódi áttöréseket elérni a modern fizika legnagyobb rejtélyei között számon tartott sötét anyag keresésében – méghozzá óriási nemzetközi projektek, hatalmas pénzekkel támogatott laboratóriumai nélkül is...

MA 07:37

A megfizethető MI forradalma: a Xiaomi MiMo V2.5 tarol

🚀 A Xiaomi neve eddig leginkább okostelefonjaival és elektromos autóival fonódott össze, de most a kínai vállalat olyan nyílt forráskódú, nagy teljesítményű nyelvi MI-modellekkel rukkolt elő, amelyek hatékonyságukkal és árukkal is felforgatják a piacot...

MA 07:29

Az apró emlős, amely túlélte a dínóvészt – ma ő az úr

🐮 Mintegy 66 millió évvel ezelőtt egy katasztrofális esemény eltörölte a Föld élővilágának háromnegyedét, köztük a dinoszauruszokat is...

MA 07:22

Az MI áttörése: Jön az olcsóbb otthoni fűtés?

Érdekes felvetés, hogy a japán kutatók újfajta MI-eszköze néhány másodperc alatt képes ultrahatékony hőelektromos generátorokat tervezni...

MA 07:15

Az olajárugrás és a geopolitikai feszültség megtépázta a Bitcoint

💰 Érdemes megvizsgálni, hogy a Bitcoin ára hétfőn 76 600 dollárig esett vissza, miután az éjjeli, közel 80 000 dolláros magasságát nem tudta tartani...

MA 07:08

Az új Moomin-játék: A tél, amely átölel

❄ Történetünk a kedves, ismerős havas tájakkal kezdődik, ahol Moomintroll véletlenül felébred téli álmából – jóval korábban, mint a többiek...

MA 07:01

Az OpenAI nagy dobása: együtt a szuperintelligens MI-vel?

🚀 Különösen igaz ez akkor, ha szinte naponta jelenik meg újabb mérföldkő a mesterséges intelligencia (MI) fejlődésében...

MA 06:56

Az Aave mentőakciója: százmilliók a DeFi megmentésére kriptolopás után

🛡 Az elmúlt héten a decentralizált pénzügyi világban példátlan összefogás indult, miután egy hatalmas hackelés súlyos károkat okozott az Aave felhasználóinak...

MA 06:50

Musk kontra Altman: az MI-gigászok csatája a bíróságon

Elon Musk és Sam Altman, a MI világának két meghatározó alakja, hamarosan szemtől szemben állnak egymással egy rendkívül nagy tétre menő perben az oaklandi szövetségi bíróságon...

MA 06:43

Az élet jelei? Szenzációs szerves molekulákat talált a NASA Mars-járója

A Mars felszínén kutató Curiosity marsjáró olyan kőzetmintát talált, amelyben minden eddiginél több, az élet építőkövei közé sorolható szerves molekula rejtőzött...

MA 06:36

Az új Steam Controller végre itt: tényleg forradalmat hoz?

Május 5-én debütál Ausztráliában az új Steam Controller, 149 ausztrál dolláros (kb...

MA 06:29

Az MI-nagyok engednek: az OpenAI kilép a Microsoft árnyékából

Jellemző példa erre, hogy a Microsoft és az OpenAI hétfőn teljesen új alapokra helyezték korábbi kizárólagos együttműködésüket...

MA 06:23

Az Amazfit Active 3 Premium: minden, amire egy kezdő futó vágyik

🏃 Az Amazfit Active 3 Premium néhány dologban kiemelkedő: kellően tartós, elegáns, és számos, kezdő futók számára hasznos edzéstámogató funkcióval rendelkezik...

MA 06:16

Az MI vezérelte megfigyelési kapitalizmus fogságából senki sem menekülhet

Egy szokványos hétvégi reggelen úgy tűnik, semmi különös nem történik: elindulsz a barkácsboltba, autóba ülsz, vásárolsz valamit, majd hazatérsz...