2026. 01. 21., 08:26

Az MIT új MI-keretrendszere átírja a játékszabályokat a szövegértésben

Az MIT új MI-keretrendszere átírja a játékszabályokat a szövegértésben
A Massachusetts Institute of Technology kutatói vadonatúj megközelítést dolgoztak ki, amellyel a mesterségesintelligencia-alapú nyelvi modellek akár tízmillió szavas szövegeken is képesek hatékonyan dolgozni. A Recursive Language Models (RLM) névre keresztelt eljárás nem a megszokott módon kezeli a hosszú beviteli szövegeket: nem próbálja a teljes szöveget egyben áttolni az MI kontextusablakán, hanem programozói logika mentén képes darabokra szedni, vizsgálni és önmagát többször is újrahívni a részletek feldolgozásáért.

A kontextuskorlát és a „kontextusromlás” problémája

A jelenlegi fejlesztések ellenére a legfejlettebb MI-modellek következtetési kapacitása nem nő olyan gyors ütemben, mint az általuk feldolgozható információmennyiség. Két fő akadályba ütköznek: egyrészt kemény fizikai határa van annak, hogy mennyi szöveget képesek egyszerre „látni” (ez a kontextushossz), másrészt a „kontextusromlás” miatt a régi információ elhalványul, kevésbé lesz lényeges vagy pontatlanul kerül visszahívásra. Míg a kontextusablakokat lehet bővíteni, ez önmagában hamar zsákutcába vezet, mivel exponenciálisan több minta kellene a modellek újratanításához.

Tipikus próbálkozás a feladat nagyságához mérten túl rövid kontextushossz kezelésére, hogy a régebbi beszélgetésrészeket a modellek rövidítik, összegzik. Viszont ha a részfeladatok között akár véletlenszerűen kell visszanyúlni régebbi, specifikus adatokhoz, ez a stratégia hamar elbukik.

Hogyan működnek az RLM-ek?

Az MIT kutatói a klasszikus informatikából ismert „out-of-core” algoritmusokból merítettek ihletet, melyek akkor is képesek működni, ha a feldolgozandó adathalmaz nagyobb, mint a gép memóriája. Ebben az új MI-megközelítésben a hatalmas szöveget nem egy az egyben töltik be a hálózatba, hanem egy programozói környezetben változóként tárolják (például Python-karakterlánc). Az MI először csak néhány metaadatot kap a szövegről (például karakterszám), de a konkrét tartalomhoz csak szükség esetén fér hozzá.

Ilyen módon az MI „programozói üzemmódba” vált: saját maga ír kódrészleteket, hogy elérje és feldolgozza az épp szükséges részeket. Például kereshet címkéket, mint „Első fejezet” vagy „pénzügyi eredmények”, majd ezek alapján behívja az adott szakaszokat részletes elemzésre.

Az architektúra általában két külön MI-modellt kombinál: egy fő, nagy tudású „root” modellt (például GPT-5), ami vezényel, tervezi a stratégiát és kódot ír; illetve egy gyorsabb, olcsóbb modellt, amely a konkrét részletek feldolgozását végzi. Így bármilyen hosszú próbát is gond nélkül kezelhetnek, mindezt anélkül, hogy a modelleket újra kellene tanítani.

Felhasználási területek és teljesítmény

Ami ezután történt, az mindenkit meglepett: az új rendszerrel végzett tesztek azt mutatták, hogy az RLM-ek elképesztő hatékonysággal birkóznak meg a 10 millió tokenes (vagyis extrém hosszú) szövegekkel, miközben a normál modellek ilyen méretben szinte használhatatlanok. Például egy 6–11 millió tokenes tesztben (Financial Reports benchmark) a hagyományos modellek rendre 0%-os pontosságot értek el, míg az RLM-ek akár 91,33%-ot is; még az eddig legjobbnak számító összegző ügynök (Summary Agent) is csak 70,47%-ig jutott el.

Különösen nagy előny mutatkozott a bonyolult, egymásba ágyazott logikai feladatoknál (OOLONG-Pairs), ahol a bemenő adatok hosszával arányosan nő a nehézség – a GPT-5 itt szinte teljesen leblokkolt (0,04%), míg az RLM-ek 58%-os F1-mutatóval dolgoztak. Kódértésben (CodeQA) is több mint kétszeres javulást hozott az új keretrendszer a klasszikus modellekhez képest.

Ennek ellenére a működés időnként költségesebb lehet, ha a modell túl sok felesleges alhívással próbálkozik, vagy végtelen ciklusba fut. Ilyenkor a fejlesztőknek saját „védőkorlátokat” és önellenőrző logikát kell beépíteniük, hogy a költségek ne szálljanak el – ám átlagosan az RLM ma már olcsóbb lehet egyes meglévő alapmodelleknél.


Jövőkép és konklúzió

A fentiek tükrében az MIT fejlesztése új fejezetet nyithat a hosszú, összetett szövegeket igénylő MI-alkalmazásokban: legyen szó akár forráskód-elemzésről, jogi szakvélemények feldolgozásáról vagy végeláthatatlan chatelésekről. Az RLM-modell nem váltja le a már elterjedt visszakereső eljárásokat (például Retrieval-Augmented Generation – RAG), azonban remekül kiegészítheti őket. A jövő MI-fejlesztéseiben valószínűleg az önálló költséggazdálkodás és a hatékonyabb részfeladat-lebontás is be fognak épülni a modellek „mindennapi” működésébe. Az RLM tehát nemcsak programozói, hanem vállalati, jogi vagy akár mindennapi felhasználásban is áttörő lehetőségeket kínál.

2025, adminboss, venturebeat.com alapján

  • Te szerinted jó ötlet-e, ha a gépekre bízzuk a döntéseket, ha ilyen bonyolult logikai feladatokról van szó?
  • Te mit tennél, ha olyan MI-modell fejlesztésén dolgoznál, amely képes lenne hibázni vagy többletköltséget okozni?


Legfrissebb posztok

MA 20:23

Az ötmillió elveszett bitcoin zárolása megrázhatja a piacot

💸 A kriptopiac egyik legforróbb dilemmája azzal a javaslattal váltott ki vitát, hogy több mint ötmillió, évek óta mozdulatlan bitcoin sorsát átírják: egyesek szerint csak így védhetők meg a jövőbeli kvantumszámítógépes támadásokkal szemben, mások viszont áthághatatlan elvi tilalomnak tartják minden ilyen beavatkozást...

MA 20:12

A predikciós piacok valódi ereje: nem a tömeg számít

📊 Egészen máshogy működnek a predikciós piacok, mint azt a legtöbben gondolnák...

MA 20:01

Az őrült középkor: scriptorium, ahol a majomfarokból művészet lesz

Érdemes megvizsgálni, milyen őrült világot kínál a Scriptorium: itt mindenből bármi lehet, és a középkori illusztrációk határát csak a képzelet szabja...

MA 19:56

A kriptomilliárdos álom Európában: keményen figyelmeztet a Bybit-vezér

💸 Érdemes megvizsgálni, hogy az európai kriptovaluta-piac szabályozása mennyire elégséges a nyereségességhez...

MA 19:45

Az Imagine Dragons énekesének lövöldéje hétvégenként ingyenes

A Last Flag című új, többjátékos lövöldözős játék, amelyet az Imagine Dragons énekese, Dan Reynolds stúdiója, a Night Street fejlesztett, júniusban debütált a Steamen...

MA 19:34

A mezcalos üveg alján lapuló „féreg” valódi titka

🧙 Évtizedek óta uralkodik a rejtély az alkoholos italok egyik kultikus különlegessége körül: a mezcalüvegek alján heverő, halvány és összegömbölyödött „féreg” mára szinte összenőtt a mexikói ital misztikumával...

MA 19:23

Az igazi fenevad visszatér: Riddick visszavág

Érdemes megvizsgálni, hogy egy játék, amely a 2000-es évek közepén alaposan átírta a konzolos FPS-ek szabálykönyvét, több mint egy évtizeddel később is képes-e ugyanazt a sötét, vad mámort előidézni...

MA 19:12

Az újabb DeFi-botrány után vége a decentralizált pénzforradalomnak?

Minden korábbinál nagyobb támadás érte a decentralizált pénzügyi rendszereket, amikor a KelpDAO-t hatalmas, 105 milliárd forintos (292 millió dolláros) kihasználás rázta meg, és emiatt a befektetők hirtelen 4600 milliárd forintot (13 milliárd dollárt) vontak ki a teljes ágazatból...

MA 19:02

A palackpostára rábukkanni: van rá esélyed?

🚤 Egy ausztrál tengerparton nemrég előkerült egy százéves palack, benne egy első világháborús katona üzenetével, aki saját állítása szerint boldogabb volt, mint valaha...

MA 18:56

A néma MI-hibák: minden zöld, mégis minden rossz

A vállalati MI-rendszerek legdrágább hibái gyakran nem járnak látványos leállásokkal. Nincs pirosba forduló műszerfal, sem riasztás: a rendszer látszólag hibátlanul működik, de következetesen és magabiztosan rossz eredményeket ad...

MA 18:45

A bitcoinbálnák bevásárolnak, a shortosok pedig megfizetik az árát

Február óta egyre több, több mint 3,5 milliárd forintos pozíciókkal rendelkező nagy szereplő nyit agresszívan vételi (long) pozíciókat a Hyperliquid tőzsdén, ahogy a bitcoin árfolyama 21–22 millió forintról közel 28 millió forintra ugrott...

MA 18:34

Az automatizálás Mekkája: végre elkészült a Shapez 2

Fontos kérdés, hogy hogyan lehet egy gyárépítős játékot mindig izgalmassá és frissé tenni...

MA 18:22

A panamai óceáni mentőöv eltűnt – negyven év óta először

A Panamai-öbölben évtizedeken át minden száraz évszakban (december és április között) erős északi passzátszelek indították be a feláramlást, amely hideg, tápanyagokban gazdag vizet hozott fel a mélyből...

MA 16:56

A saját Wikipédiád: építsd meg MediaWikivel már ma

A tudás megosztása sosem volt ilyen egyszerű: a wiki-rendszerek segítenek szervezeteknek, közösségeknek és egyéni kutatóknak létrehozni könnyen, közösen szerkeszthető tudástárakat...

MA 16:45

A nagy DJI drónpárbaj: melyik most a legjobb vétel?

A DJI friss, 249 gramm alatti újdonsággal rukkolt elő a Lito 1 személyében, amely nagyobb szenzort, hosszabb repülési időt és fejlettebb akadályérzékelést kínál...

MA 16:34

A világegyetem egyik legnagyobb rejtett óriása leleplezve

Szinte teljesen láthatatlan volt a Földről eddig az a gigantikus galaxishalmaz, amelyet végre részletesen sikerült feltérképezniük a csillagászoknak...

MA 16:23

Az emberiség afrikai eredete: több ős, nem egyetlen

🚩 Érdekes felvetés, hogy az emberi faj eredetére vonatkozó, eddig széles körben elfogadott elképzelések valószínűleg túl egyszerűek voltak...

MA 16:12

Az első Bloodlines 2 DLC végre helyreteszi a harcrendszert

🔴 A várva várt Vampire: The Masquerade – Bloodlines 2 tavalyi megjelenése után sokan érezhették úgy, hogy valami hiányzik a játékból...

MA 16:01

Az Oppo Find X9 Ultra tarol: 2000 fotón át bizonyított

Az okostelefonos fotózás új szintre lépett az Oppo Find X9 Ultrával...

MA 15:56

Az MI forradalmasítja az állami megfigyelést – riadót fújnak a képviselők

A technológia fejlődése alapjaiban változtatja meg, hogyan figyeli meg az állam polgárait...

MA 15:34

A Hubble 30 év után újra célba veszi a Trifid-ködöt

🛰 Ötvenezer fényévnyi távolságból ismét elképesztő fotót készített a Hubble űrtávcső a Trifid-ködről, amely a Nyilas csillagképben található, és a csillagkeletkezés egyik ikonikus helyszíne az univerzumban...

MA 15:23

A mindent tudó kriptobróker: a Coinbase újraosztja a lapokat

A Coinbase egy olyan mérföldkőhöz érkezett, amelyet a Wall Street is azonnal felismer: mostantól teljes körű prime brókerként működik a kriptopiacon...

MA 15:12

Az LG C6 OLED: Lélegzetelállító fényerő, de akadnak árnyoldalak

Az LG C-sorozatos OLED tévéi évről évre a kategória legnépszerűbbjei közé tartoznak...

MA 15:01

A nagy rejtély: miért rázza a fejét a macska és a kutya?

A macskáknál gyakran előfordul, hogy evés, ivás vagy alapos simogatás után villámgyorsan megrázzák a fejüket...

MA 14:57

A gigászi adatközpont rekordszintű áraméhséggel fenyeget Utahban

Különleges beruházás készül Box Elder megyében, ahol Kevin O’Leary, a híres „Mr...

MA 14:45

Az Enter the Gungeon tízéves: Tényleg véget ér a roguelike aranykora?

Tíz év telt el azóta, hogy megjelent az Enter the Gungeon, amely több mint 14 millió példányban kelt el, és jelentős hatást gyakorolt a modern akció-roguelike műfajra...

MA 14:34

Az FA-kupa elődöntő: megingott a Chelsea, éhes a Leeds

⚽ Nem a bajnoki tabella alapján ítélhető meg, melyik csapat az esélyesebb a Chelsea–Leeds FA-kupa-elődöntőben...

MA 14:23

A T. rex megőrződött vérerei átírják a dinoszaurusz-kutatást

A tudósok hosszú évtizedeken át próbáltak dinoszaurusz-DNS-t találni, eredménytelenül. Ma már a paleontológia főleg a fosszíliákban maradt eredeti szerves anyagok nyomait kutatja, de a több mint 66 millió év során a DNS teljesen elpusztult...

MA 13:56

Tűz az amerikai bombázók brit bázisán – csak egy üres épület égett

Hajnalban hatalmas tűz ütött ki a Gloucestershire melletti RAF Fairford katonai repülőtéren, ahol jelenleg is amerikai egységek állomásoznak...