2026. 02. 01., 13:04

Az MI-keresők csődöt mondanak: csak feldarabolják a technikai dokumentumokat

Az MI-keresők csődöt mondanak: csak feldarabolják a technikai dokumentumokat
Fontos kérdés, hogy miért működnek annyira rosszul a vállalati MI-alapú keresők a bonyolult technikai dokumentumokkal, miközben elsőre azt ígérik, hogy bármilyen PDF vagy kézikönyv tartalmát percek alatt feldolgozzák. A mérnöki területeken dolgozók gyakran tapasztalják, hogy az MI-alapú chatbot nem pontos válaszokat ad, inkább csak találgat, amikor összetett infrastruktúrakérdéseket tesznek fel neki.

Felületes feldolgozás: a „lapos szöveg” csapdája

A legtöbb MI-alapú kereső és RAG (retrieval-augmented generation) rendszer jelenleg úgy dolgozza fel a dokumentumokat, hogy egyszerűen szövegként kezeli őket, és 500 karakterenként szétvágja a tartalmat. Ez a módszer viszonylag jól működik regények vagy egyszerű szövegek esetén, de tönkreteszi a műszaki kézikönyvek logikai szerkezetét: félbevágja a táblázatokat, elszakítja a képek aláírását az illusztrációtól, és teljesen figyelmen kívül hagyja az oldal vizuális hierarchiáját. A hozzáférhető tudás így széttöredezik, és a keresőmotorok képtelenek összerakni a fontos összefüggéseket.

A „szeletelés” helyett szemantikus feldarabolás

Továbbra is a legnagyobb kihívás, hogy a feldolgozott dokumentum szerkezetét is értse az MI – ebben segít az úgynevezett szemantikus feldarabolás. Ilyenkor a rendszer már nem pusztán tokenek vagy karakterek alapján darabol, hanem a tényleges tartalmi egységeket – fejezeteket, szakaszokat, bekezdéseket – azonosítja, például az Azure Document Intelligence segítségével. Így például egy táblázat vagy egy egész alkatrészt bemutató blokk egy egységként kerül be az MI memóriájába, így nem vész el a jelentéstartalom. Belső tesztekben a szemantikus módszer jelentősen javította az adatok visszakeresésének pontosságát.

Az elveszett vizuális tudás: sémák, ábrák, diagramok

Idővel kiderült, hogy a vállalatokon belüli tudás jelentős része nem a szövegben, hanem diagramokban és ábrákban rejlik. A legtöbb hagyományos beágyazómodell képtelen értelmezni ezeket az információkat, így azok egyszerűen kimaradnak az indexelésből. Ezért gyakran fordul elő, hogy ha a válasz egy folyamatábrában lenne megtalálható, az MI csak annyit mond, hogy nem tudja a választ.


Multimodális szövegesítés: ábrák kereshetővé tétele

A megoldást a multimodális szövegesítés hozza: még a képek – például PNG-fájlok – adatbázisba kerülése előtt a rendszer látásalapú modelleket (például GPT-4o) vet be, hogy a képeken lévő szövegeket optikai karakterfelismeréssel (OCR) azonosítsa, a diagramok tartalmát pedig részletes, természetes nyelvű leírással egészítse ki. Ezeket az újonnan generált leírásokat metaadatként kapcsolja az eredeti kép mellé, így kereshetővé válik minden folyamatábra, még ha azt eredetileg csak képként tárolták is.

Bizalomépítés: Ellenőrizhető válaszok

A vállalati környezetben azonban önmagában a válaszadás nem elegendő: fontos a hitelesség és az átláthatóság. Míg korábban a rendszer csak szöveges választ és egy fájlnevet adott, mostantól a rendszer a feldolgozás során megőrzi a kapcsolatot a szöveges egység és az azt tartalmazó kép vagy táblázat között, amit így a válasz mellett a felhasználó is azonnal láthatja. Ez a „mutasd a bizonyítékot” funkció nagyban növeli az MI-be vetett bizalmat.

A jövő: natív multimodális keresés és hosszabb kontextusablak

Továbbra is gyorsan fejlődik a technológia: hamarosan a natív multimodális beágyazás (pl. Cohere Embed 4) lehetővé teszi, hogy a szöveg és kép közötti határ teljesen elmosódjon, és a rendszer automatikusan, metaadatok nélkül értse a dokumentum szerkezetét. Amint az ilyen LLM-ek már olcsón képesek akár teljes kézikönyveket is értelmezni, a szemantikus feldarabolás szerepe csökkenhet. Mindez azonban jelenleg még költséges, így egyelőre a hatékony, strukturált feldolgozás marad az időben és pénzben leginkább megtérülő megközelítés.

Összegzés

Az MI-alapú keresés csak akkor válik valódi tudásasszisztenssé a vállalati világban, ha végre nem darabolja szét a dokumentumokat önkényesen, hanem tiszteletben tartja azok logikáját, szerkezetét, és a vizuális információkat is feldolgozza.

2025, adminboss, venturebeat.com alapján

  • Te mennyire bíznál egy ilyen MI-alapú keresőben a munkahelyeden?
  • Mit tettél volna másképp ezekben a fejlesztésekben?


Legfrissebb posztok

szerda 12:01

Az IKEA okosotthona: menő és olcsó, mégsem működik

📦 Az IKEA új, mindenki számára elérhető okos kütyüi végre megérkeztek! A gondolat izgalmas: menő, okos izzók, kapcsolók, dugaljak, mind kezdőáron, már 2400 forinttól...

szerda 11:34

Az MI-asszisztensek kijátszása: veszélyes parancsok az orrod előtt

🛡 Egy új, böngészőkben alkalmazható trükk lehetővé teszi, hogy rosszindulatú parancsokat rejtsenek el közvetlenül a weboldalakon anélkül, hogy azt az MI‑asszisztensek észrevennék...

szerda 11:23

Az iPhone 16e megkapja az álomfrissítést, amiről az Android csak álmodik

😍 Fontos kérdés, hogy mennyire lehet egy okostelefont olcsón, akár otthon is fejleszteni, főleg, ha új funkciók utólag is elérhetők lesznek...

szerda 11:13

Az USA-ban berobban a vastagbélrák az 50 év alattiaknál

💉 Az Egyesült Államokban egyre fiatalabbakat érint a vastagbélrák, amely immár a leggyakoribb daganatos halálok az 50 év alattiak körében...

szerda 11:01

Az új Google Gemini már mindent tud rólad – ráadásul ingyen

A Google újraírta a szabályokat: mostantól a Geminiben mindenki számára ingyenesen elérhető az a funkció, amellyel valóban személyre szabott válaszokat adhat...

szerda 10:50

Az orosz hackerek új kártevőhulláma elözönli a GitHubot

Jellemző példa erre, hogy napjaink egyik legagresszívebb ellátásilánc-támadása, a GlassWorm ismét lecsapott: több mint 400 fejlesztői csomag, forráskódtár és bővítmény vált fertőzötté olyan platformokon, mint a GitHub, az npm, a Visual Studio Code és az OpenVSX...

szerda 10:43

Most te vagy a hangmérnök: itt az új Spotify-mód

🎧 A Spotify most végre bevezette az Exkluzív módot (Exclusive Mode) Windowsra – innentől a szoftver ráteszi a kezét a hangkártyádra, és kiküszöböli, hogy a géped belemotyogjon a zenédbe...

szerda 10:36

Az Apple új titkos fegyvere: láthatatlanul javították a sebezhetőséget

🔒 Az Apple először élesítette a Háttérbiztonsági fejlesztések nevű rendszerét, amellyel anélkül javíthattak egy kritikus WebKit-sebezhetőséget, hogy a teljes operációs rendszert frissíteni kellett volna...

szerda 10:30

Az akcentus rejtett ára: kinek a hangja számít igazán?

Modern munkahelyeken sokan hiszik, hogy a legjobb ötletek maguktól érvényesülnek: az győz, aki meggyőzően érvel, vagy eredeti meglátással áll elő...

szerda 10:23

Az észak-koreai hekkerek kifosztották a Bitrefillt: 19 ezren pórul jártak

💰 Március 1-jén nagyszabású kibertámadás érte a nagy nemzetközi kriptopénzes fizetési és ajándékkártya-platformot, a Bitrefillt...

szerda 10:16

A gyerekkori stressz egész életre beleég a bélrendszerbe

😱 A korai gyermekkori stressz nem csupán mentális sebeket hagyhat maga után, hanem a bélrendszer működését is átrendezheti...

szerda 10:10

Az iráni háború miatt rekordon a benzinárak Amerikában

Miközben az iráni háború felbolygatta a globális olajpiacot, az üzemanyagárak soha nem látott magasságokba emelkedtek Amerikában...

szerda 09:57

Az Apple lopakodva telepíti a biztonsági frissítéseket a készülékeidre

🔒 Az Apple beindította a háttérben letöltődő biztonsági javításokat, amelyek olyan észrevétlenül érkeznek, hogy talán észre sem veszed őket – de a telefonod vagy a géped nagyon hálás lesz érte...

szerda 09:51

Az iráni blokád a Hormuzi-szoros lezárásával fenyeget

Az elmúlt hetek eseményei szinte megbénították a Hormuzi-szoros forgalmát: ahol korábban naponta több mint 100 tanker haladt át, most viszont február vége óta alig 21 tette meg az utat...

szerda 09:44

Az amerikai tőzsde igazi mélypontja még odébb van?

📈 A látszólagos tőzsdei robbanás ellenére a befektetők már hónapok óta gyakorlatilag medvepiacban mozognak...

szerda 09:29

Az albérletpiac most neked dolgozik – érkeznek a durva kedvezmények

Szóval végre valami, aminek most tényleg lehet örülni bérlőként: az albérletpiacon közel 12 éve nem látott szintre emelkedtek az extra kedvezmények...

szerda 09:23

A Meta leteszi az asztalodra a Manus MI-ügynököt

A Meta frissen felvásárolt MI-startupja, a Manus most egy asztali alkalmazással hozza el saját mesterségesintelligencia-ügynökét közvetlenül a felhasználók számítógépeire...

szerda 09:16

Az utolsó tánc: újabb frissítés az FBC: Firebreakhez – de minek?

🔥 Mielőtt bárki eltemetné az FBC: Firebreak-et, fontos tudni, hogy a Remedy kiadta hozzá az utolsó tartalmi frissítést—de cseppet se aggódj, a szerverek még évekig bírni fogják a strapát...

szerda 09:11

A Mistral Forge letaszítja trónjukról az MI-szuperszámítógépeket

👑 A francia Mistral AI bemutatta a Forge nevű platformját, amellyel cégek és állami intézmények saját MI-modelleket építhetnek, továbbfejleszthetnek és folyamatosan igazíthatnak a saját adataikhoz szabva – mindezt teljes körű adatvédelem mellett...

szerda 09:01

Az XRP-n 5,5 milliárd forint a tét: háború a tőzsdén

💸 Fontos kérdés, hogy mi történik az XRP árfolyamával a következő napokban...

szerda 08:57

A nagy Pikachu-leleplezés: Pizzafutár lett a Pokémon GO-ból?

👑 A Pokémon GO valaha csak játék volt, ma már viszont sokkal több: szinte észrevétlenül a városi robotok navigációs segédeszközévé vált...

szerda 08:38

Az Nvidia MI-ügynökplatformja tényleg biztonságos?

🔒 Kezdetben az MI-fejlesztések fő fókuszában a képességek és a funkcionalitás állt, de most először jelent meg egy átfogó biztonsági rendszer már a kiadás pillanatában...

szerda 08:30

Az MI-engedélyezés könnyen vállalati káoszhoz vezethet

Az MI-alapú ügynökök egyre több vállalatnál végzik el helyettünk az érzékeny feladatokat: CRM-rendszerekbe lépnek be, adatbázisokat olvasnak, e-maileket küldenek...

szerda 08:23

A pofonegyszerű trükk, amivel túljárhatsz a ChatGPT eszén

A ChatGPT szinte mindig magabiztos válaszokat ad, bármiről kérdezed is. Olyan határozottsággal érvel, hogy első ránézésre meggyőző lehet – ugyanakkor könnyen elfeledteti, hogy az általa közvetített válasz csupán egy nézőpont, nem pedig az egyetlen érvényes megoldás...

szerda 08:08

Az MI rengeteg tudományos bakit ejt – több mint hinnéd

🤔 Érdemes megvizsgálni, mennyire megbízható valójában egy olyan népszerű MI, mint a ChatGPT, ha tudományos állításokról van szó...

szerda 07:57

Az MI szerinte csak nevetséges fenyegetés a Grand Theft Auto VI-ra

A videojáték-ipar épp az MI robbanását éli, sokan attól tartanak, hogy a generatív modellek elveszik majd az emberek munkáját a legnagyobb franchise-okban is...

szerda 07:50

Az MI-ügynököknek végre van bizonyítható személyiségük?

Érdemes megvizsgálni, miként lehet az online térben biztosan megkülönböztetni az MI-ügynököket működtető embereket a tömeges, névtelen botoktól...

szerda 07:43

Az online csalók rémálma: összefog a Google, a Meta és az Amazon

A netes csalók manapság vérprofi szélhámosokká váltak: ügyesen ugrálnak a közösségi oldalak, üzenetküldő appok, e-mailek és piacterek között, hogy lecsapjanak a legóvatosabb áldozatokra is...

szerda 07:36

A Samsung Galaxy Z TriFold pályafutása villámgyorsan véget ért

⚠ Három hónap után eltűnik a boltokból a Samsung úttörő, hárompaneles, hajlítható mobilja, a Galaxy Z TriFold...