2026. 01. 21., 08:26

Az MIT új MI-keretrendszere átírja a játékszabályokat a szövegértésben

Az MIT új MI-keretrendszere átírja a játékszabályokat a szövegértésben
A Massachusetts Institute of Technology kutatói vadonatúj megközelítést dolgoztak ki, amellyel a mesterségesintelligencia-alapú nyelvi modellek akár tízmillió szavas szövegeken is képesek hatékonyan dolgozni. A Recursive Language Models (RLM) névre keresztelt eljárás nem a megszokott módon kezeli a hosszú beviteli szövegeket: nem próbálja a teljes szöveget egyben áttolni az MI kontextusablakán, hanem programozói logika mentén képes darabokra szedni, vizsgálni és önmagát többször is újrahívni a részletek feldolgozásáért.

A kontextuskorlát és a „kontextusromlás” problémája

A jelenlegi fejlesztések ellenére a legfejlettebb MI-modellek következtetési kapacitása nem nő olyan gyors ütemben, mint az általuk feldolgozható információmennyiség. Két fő akadályba ütköznek: egyrészt kemény fizikai határa van annak, hogy mennyi szöveget képesek egyszerre „látni” (ez a kontextushossz), másrészt a „kontextusromlás” miatt a régi információ elhalványul, kevésbé lesz lényeges vagy pontatlanul kerül visszahívásra. Míg a kontextusablakokat lehet bővíteni, ez önmagában hamar zsákutcába vezet, mivel exponenciálisan több minta kellene a modellek újratanításához.

Tipikus próbálkozás a feladat nagyságához mérten túl rövid kontextushossz kezelésére, hogy a régebbi beszélgetésrészeket a modellek rövidítik, összegzik. Viszont ha a részfeladatok között akár véletlenszerűen kell visszanyúlni régebbi, specifikus adatokhoz, ez a stratégia hamar elbukik.

Hogyan működnek az RLM-ek?

Az MIT kutatói a klasszikus informatikából ismert „out-of-core” algoritmusokból merítettek ihletet, melyek akkor is képesek működni, ha a feldolgozandó adathalmaz nagyobb, mint a gép memóriája. Ebben az új MI-megközelítésben a hatalmas szöveget nem egy az egyben töltik be a hálózatba, hanem egy programozói környezetben változóként tárolják (például Python-karakterlánc). Az MI először csak néhány metaadatot kap a szövegről (például karakterszám), de a konkrét tartalomhoz csak szükség esetén fér hozzá.

Ilyen módon az MI „programozói üzemmódba” vált: saját maga ír kódrészleteket, hogy elérje és feldolgozza az épp szükséges részeket. Például kereshet címkéket, mint „Első fejezet” vagy „pénzügyi eredmények”, majd ezek alapján behívja az adott szakaszokat részletes elemzésre.

Az architektúra általában két külön MI-modellt kombinál: egy fő, nagy tudású „root” modellt (például GPT-5), ami vezényel, tervezi a stratégiát és kódot ír; illetve egy gyorsabb, olcsóbb modellt, amely a konkrét részletek feldolgozását végzi. Így bármilyen hosszú próbát is gond nélkül kezelhetnek, mindezt anélkül, hogy a modelleket újra kellene tanítani.

Felhasználási területek és teljesítmény

Ami ezután történt, az mindenkit meglepett: az új rendszerrel végzett tesztek azt mutatták, hogy az RLM-ek elképesztő hatékonysággal birkóznak meg a 10 millió tokenes (vagyis extrém hosszú) szövegekkel, miközben a normál modellek ilyen méretben szinte használhatatlanok. Például egy 6–11 millió tokenes tesztben (Financial Reports benchmark) a hagyományos modellek rendre 0%-os pontosságot értek el, míg az RLM-ek akár 91,33%-ot is; még az eddig legjobbnak számító összegző ügynök (Summary Agent) is csak 70,47%-ig jutott el.

Különösen nagy előny mutatkozott a bonyolult, egymásba ágyazott logikai feladatoknál (OOLONG-Pairs), ahol a bemenő adatok hosszával arányosan nő a nehézség – a GPT-5 itt szinte teljesen leblokkolt (0,04%), míg az RLM-ek 58%-os F1-mutatóval dolgoztak. Kódértésben (CodeQA) is több mint kétszeres javulást hozott az új keretrendszer a klasszikus modellekhez képest.

Ennek ellenére a működés időnként költségesebb lehet, ha a modell túl sok felesleges alhívással próbálkozik, vagy végtelen ciklusba fut. Ilyenkor a fejlesztőknek saját „védőkorlátokat” és önellenőrző logikát kell beépíteniük, hogy a költségek ne szálljanak el – ám átlagosan az RLM ma már olcsóbb lehet egyes meglévő alapmodelleknél.


Jövőkép és konklúzió

A fentiek tükrében az MIT fejlesztése új fejezetet nyithat a hosszú, összetett szövegeket igénylő MI-alkalmazásokban: legyen szó akár forráskód-elemzésről, jogi szakvélemények feldolgozásáról vagy végeláthatatlan chatelésekről. Az RLM-modell nem váltja le a már elterjedt visszakereső eljárásokat (például Retrieval-Augmented Generation – RAG), azonban remekül kiegészítheti őket. A jövő MI-fejlesztéseiben valószínűleg az önálló költséggazdálkodás és a hatékonyabb részfeladat-lebontás is be fognak épülni a modellek „mindennapi” működésébe. Az RLM tehát nemcsak programozói, hanem vállalati, jogi vagy akár mindennapi felhasználásban is áttörő lehetőségeket kínál.

2025, adminboss, venturebeat.com alapján

  • Te szerinted jó ötlet-e, ha a gépekre bízzuk a döntéseket, ha ilyen bonyolult logikai feladatokról van szó?
  • Te mit tennél, ha olyan MI-modell fejlesztésén dolgoznál, amely képes lenne hibázni vagy többletköltséget okozni?


Legfrissebb posztok

MA 18:01

Az X 800 millió fiókot törölt, mégis tombolnak a kamu-fiókok

Brutális mennyiségű, összesen 800 millió felhasználói fiókot törölt az X 2024-ben – és most kapaszkodj meg, mindezt mindössze egy év alatt!..

MA 17:58

Az űr mégsem üres: a sötét energia széttépi a világegyetemet

Fontos kérdés, hogy mi maradna, ha eltávolítanánk az univerzum legüresebb régióiból minden anyagot: a hagyományos atomokat, a neutrínókat, a sötét anyagot, a kozmikus sugárzást és minden más sugárzási formát...

MA 17:39

Az Adobe MI‑asszisztense átírja a Photoshop szabályait

Az Adobe új MI‑asszisztenst jelentett be, amelynek béta verziója mostantól elérhető a Photoshopban, és weben, valamint mobilalkalmazásokban is használható...

MA 17:20

Egy ősi marsi ásvány új korszakot nyithat a Vörös Bolygón

A kutatók egy eddig ismeretlen ásványra bukkantak a Mars felszínén, amely alapjaiban írhatja át a bolygó geológiai történetét...

MA 17:02

Az FDA új engedélye után is késik az áttörés autizmusban

👀 Egy lényeges szempont, hogy az amerikai Élelmiszer- és Gyógyszerügyi Hatóság (FDA) most először hagyta jóvá a szintetikus B9-vitamin, a leucovorin egy új alkalmazását...

MA 14:01

Lehullt a lepel az élesztő miniatűr centroméráinak titkáról

🔬 A centroméra a kromoszómák központi régiója, amely minden élőlényben kulcsszerepet tölt be a sejtosztódás során: biztosítja, hogy a kromoszómák pontosan szétváljanak az utódsejtek között...

MA 13:58

A TikTok marad Kanadában – de csak kemény feltételekkel

😉 Most őszintén, észrevetted már, mennyire imádják a döntéshozók ide-oda ráncigálni a techóriásokat?..

MA 13:39

Az Xbox marad – Nadella megnyugtatja a játékosokat

Az Xbox az elmúlt évtizedekben a videojáték-ipar egyik meghatározó konzolja volt a Nintendo és a PlayStation mellett...

MA 13:20

A Leedsben előkerült föníciai érme titka

🔮 Egy egészen különleges pénzérme bukkant fel Angliában a múlt században: az 1950-es években egy buszsofőr pénztárgépe fogadott be egy bronz érmét, amelyről hamarosan kiderült, hogy több mint 2000 évvel ezelőtt, a mai Spanyolország déli részén verték...

MA 12:01

Az Apple otthoni kijelzője tovább csúszik, Siri még várat magára

Az Apple okosotthon-rajongói régóta várják a Google Nest Hub és az Amazon Echo Show ellenfelét, de ismét csalódniuk kell...

MA 11:58

Már a munkahelyeket is támadja egy veszélyes Teams-csalás

💯 Pénzügyi és egészségügyi szervezetek dolgozóit próbálták átverni kiberbűnözők, akik a Microsoft Teamsen keresztül, magukat IT-munkatársaknak kiadva vették fel velük a kapcsolatot...

MA 11:39

Az új uniós terv megmentheti az egyedi rendszereken futó banki alkalmazásokat

Külön említést érdemel, hogy sokan, akik egyedi ROM-ot vagy Google-mentes Androidot használnak a telefonjukon, szembesülnek azzal, hogy számos banki és pénzügyi alkalmazás egyszerűen nem működik...

MA 11:02

A fiatal vállalkozó, aki forradalmasítja az egészségügyi adminisztrációt

🚀 A Harvardot otthagyó Tim Hwang élete során folyamatosan lavírozott a politika, a közpolitika és a startupok világa között...

MA 10:55

Az X végre lépett: Grok többé nem szerkeszthet bárki fotóit

Az utóbbi napokban feltűnt egy új lehetőség az X közösségi oldalon: immár egyetlen kapcsolóval meg lehet akadályozni, hogy a feltöltött fotókat a Grok chatbot módosítsa...

MA 10:46

Az űrtükrök nappali fényt hozhatnak éjjelre – de milyen áron?

Egy kaliforniai startup, a Reflect Orbital, űrtükrökkel világítaná meg az éjszakai Földet...

MA 10:19

Véget ér a botáradat a Teamsben? Itt a címkézés!

Nincs annál furcsább, mint amikor a megbeszélés várójában hirtelen egy vadidegen, furán elnevezett „résztvevő” tűnik fel – sokszor csak egy bot bújik meg a sorban...

MA 09:55

Az ősszel robbanhat a Siri: jön az Apple okoskijelzője?

Kiszivárgott pletykák szerint az Apple régóta várt okosotthoni kijelzője – a legendás HomePod – végre tényleg közelít a megjelenéshez...

MA 09:47

Az amerikai kormány elárulta az államokat a Ticketmaster-perben

🖤 Jellemző példa erre, hogy amikor a 2026-ban kezdődött per közepén váratlanul megállapodást kötött az amerikai igazságügyi minisztérium (DOJ) a Live Nation/Ticketmaster cégekkel, a 27 amerikai tagállamot és a washingtoni kerületet teljesen meglepte a fordulat...

MA 09:37

Az aszteroida-eltérítés működik: a NASA történelmi áttörést ért el

2022 szeptemberében a NASA DART (Double Asteroid Redirection Test) űrszondája szándékos ütközéssel eltalálta a Dimorphos nevű kisbolygót, amely a Didymos nevű nagyobb aszteroida körül kering...

MA 09:28

A villámgyors evolúció: érző, gondolkodó fehérjék születése

⚡ Az élővilágban az evolúció alakítja a biológiai rendszereket: a változékonyságot mutató DNS, RNS és fehérjék közül azok a sejtek maradnak fenn, amelyek a leghatékonyabban működnek...

MA 09:10

A NASA-val végre élőben nézheted az Artemis II-t

Több mint ötven év után ismét ember léphet a Holdra: hamarosan indul az Artemis II, amely a NASA első emberes holdmissziója lesz 1972 óta...

MA 09:01

Az Nvidia bejelentése feltüzeli a kriptópiacot, kilőnek az AI-tokenek

Az AI-hoz kapcsolódó kriptók szinte felrobbantak, miután a Wired kiszivárogtatta: az Nvidia saját, nyílt forráskódú platformot dob piacra önálló mesterségesintelligencia-ügynökök számára...

MA 08:55

Az MI valósága: brutális tőkeinjekció LeCun új laborjába

Yann LeCun új MI-laborja, az AMI Labs elképesztő, több mint 376 milliárd forintnyi befektetést szerzett 2026 elején, és ezzel 1 260 milliárd forintos értékelést ért el...

MA 08:46

Az Apple nagy dobása: már minden negyedik iPhone Indiában készül

Nem semmi: az Apple mostanra elérte, hogy minden negyedik iPhone Indiában készüljön...

MA 08:37

Az új MacBook Neo-háttérképek már minden Macen: menők vagy cikik?

🖥 Szóval, készülj fel, mert a legújabb, vibráló MacBook Neo-háttérképek mostantól minden Macen elérhetők a macOS Tahoe 26...

MA 08:30

Az iPhone 17E megérkezett: tényleg erre vártunk?

Az Apple újabb iPhone-nal bővítette kínálatát: a 17E az olcsóbb, belépőszintű modell szerepét vállalja 256 GB tárhellyel és MagSafe-támogatással...

MA 08:19

Az éghajlatválság rákapcsolt: itt a következő fokozat

A Föld hőmérséklete az elmúlt évtizedben drámaian gyorsuló ütemben emelkedett, amit a Potsdam Institute for Climate Impact Research (PIK) legfrissebb adatai mutatnak...

MA 08:01

Az Amazon keresztülhúzza a SpaceX egymillió műholdas álmait

🚀 Az Amazon felszólította az amerikai hírközlési hatóságot, az FCC-t, hogy utasítsa el a SpaceX ambiciózus kérelmét: Elon Musk cége egymillió műholdból álló űrbéli adatközpont-hálózatot akar pályára állítani...

MA 07:56

A gyógyszeróriások ostroma: Amerika a világ új gyára?

💉 Felmerül a kérdés, hogy mit lépnek a nagy gyógyszercégek, amikor a vámfenyegetettség árnya lebeg az Egyesült Államok felett...