MA 08:26

Az MIT új MI-keretrendszere átírja a játékszabályokat a szövegértésben

Az MIT új MI-keretrendszere átírja a játékszabályokat a szövegértésben
A Massachusetts Institute of Technology kutatói vadonatúj megközelítést dolgoztak ki, amellyel a mesterségesintelligencia-alapú nyelvi modellek akár tízmillió szavas szövegeken is képesek hatékonyan dolgozni. A Recursive Language Models (RLM) névre keresztelt eljárás nem a megszokott módon kezeli a hosszú beviteli szövegeket: nem próbálja a teljes szöveget egyben áttolni az MI kontextusablakán, hanem programozói logika mentén képes darabokra szedni, vizsgálni és önmagát többször is újrahívni a részletek feldolgozásáért.

A kontextuskorlát és a „kontextusromlás” problémája

A jelenlegi fejlesztések ellenére a legfejlettebb MI-modellek következtetési kapacitása nem nő olyan gyors ütemben, mint az általuk feldolgozható információmennyiség. Két fő akadályba ütköznek: egyrészt kemény fizikai határa van annak, hogy mennyi szöveget képesek egyszerre „látni” (ez a kontextushossz), másrészt a „kontextusromlás” miatt a régi információ elhalványul, kevésbé lesz lényeges vagy pontatlanul kerül visszahívásra. Míg a kontextusablakokat lehet bővíteni, ez önmagában hamar zsákutcába vezet, mivel exponenciálisan több minta kellene a modellek újratanításához.

Tipikus próbálkozás a feladat nagyságához mérten túl rövid kontextushossz kezelésére, hogy a régebbi beszélgetésrészeket a modellek rövidítik, összegzik. Viszont ha a részfeladatok között akár véletlenszerűen kell visszanyúlni régebbi, specifikus adatokhoz, ez a stratégia hamar elbukik.

Hogyan működnek az RLM-ek?

Az MIT kutatói a klasszikus informatikából ismert „out-of-core” algoritmusokból merítettek ihletet, melyek akkor is képesek működni, ha a feldolgozandó adathalmaz nagyobb, mint a gép memóriája. Ebben az új MI-megközelítésben a hatalmas szöveget nem egy az egyben töltik be a hálózatba, hanem egy programozói környezetben változóként tárolják (például Python-karakterlánc). Az MI először csak néhány metaadatot kap a szövegről (például karakterszám), de a konkrét tartalomhoz csak szükség esetén fér hozzá.

Ilyen módon az MI „programozói üzemmódba” vált: saját maga ír kódrészleteket, hogy elérje és feldolgozza az épp szükséges részeket. Például kereshet címkéket, mint „Első fejezet” vagy „pénzügyi eredmények”, majd ezek alapján behívja az adott szakaszokat részletes elemzésre.

Az architektúra általában két külön MI-modellt kombinál: egy fő, nagy tudású „root” modellt (például GPT-5), ami vezényel, tervezi a stratégiát és kódot ír; illetve egy gyorsabb, olcsóbb modellt, amely a konkrét részletek feldolgozását végzi. Így bármilyen hosszú próbát is gond nélkül kezelhetnek, mindezt anélkül, hogy a modelleket újra kellene tanítani.

Felhasználási területek és teljesítmény

Ami ezután történt, az mindenkit meglepett: az új rendszerrel végzett tesztek azt mutatták, hogy az RLM-ek elképesztő hatékonysággal birkóznak meg a 10 millió tokenes (vagyis extrém hosszú) szövegekkel, miközben a normál modellek ilyen méretben szinte használhatatlanok. Például egy 6–11 millió tokenes tesztben (Financial Reports benchmark) a hagyományos modellek rendre 0%-os pontosságot értek el, míg az RLM-ek akár 91,33%-ot is; még az eddig legjobbnak számító összegző ügynök (Summary Agent) is csak 70,47%-ig jutott el.

Különösen nagy előny mutatkozott a bonyolult, egymásba ágyazott logikai feladatoknál (OOLONG-Pairs), ahol a bemenő adatok hosszával arányosan nő a nehézség – a GPT-5 itt szinte teljesen leblokkolt (0,04%), míg az RLM-ek 58%-os F1-mutatóval dolgoztak. Kódértésben (CodeQA) is több mint kétszeres javulást hozott az új keretrendszer a klasszikus modellekhez képest.

Ennek ellenére a működés időnként költségesebb lehet, ha a modell túl sok felesleges alhívással próbálkozik, vagy végtelen ciklusba fut. Ilyenkor a fejlesztőknek saját „védőkorlátokat” és önellenőrző logikát kell beépíteniük, hogy a költségek ne szálljanak el – ám átlagosan az RLM ma már olcsóbb lehet egyes meglévő alapmodelleknél.


Jövőkép és konklúzió

A fentiek tükrében az MIT fejlesztése új fejezetet nyithat a hosszú, összetett szövegeket igénylő MI-alkalmazásokban: legyen szó akár forráskód-elemzésről, jogi szakvélemények feldolgozásáról vagy végeláthatatlan chatelésekről. Az RLM-modell nem váltja le a már elterjedt visszakereső eljárásokat (például Retrieval-Augmented Generation – RAG), azonban remekül kiegészítheti őket. A jövő MI-fejlesztéseiben valószínűleg az önálló költséggazdálkodás és a hatékonyabb részfeladat-lebontás is be fognak épülni a modellek „mindennapi” működésébe. Az RLM tehát nemcsak programozói, hanem vállalati, jogi vagy akár mindennapi felhasználásban is áttörő lehetőségeket kínál.

2025, adminboss, venturebeat.com alapján

  • Te szerinted jó ötlet-e, ha a gépekre bízzuk a döntéseket, ha ilyen bonyolult logikai feladatokról van szó?
  • Te mit tennél, ha olyan MI-modell fejlesztésén dolgoznál, amely képes lenne hibázni vagy többletköltséget okozni?


Legfrissebb posztok

MA 11:36

A Föld vízválságban: idáig juttatta az emberiség

Az ENSZ jelentése szerint az emberiség olyan mértékben használja a vízkészleteket, hogy a Föld már nem képes lépést tartani az igényekkel...

MA 11:20

Az új napkitörések titka: elszabadult mágneses lavina

Érdemes megvizsgálni, hogyan zajlik le egy napkitörés, mert ezek az események nemcsak látványosak, hanem a Földön is súlyos következményekkel járhatnak...

MA 11:01

Az utolsó pillanatban mentették meg a Stadia Bluetooth-kontrollert

A héten a Google végleg leállította a Stadia hivatalos Bluetooth-átalakító eszközét, amellyel a korábbi Stadia kontrollereket lehetett kompatibilissé tenni más platformokkal, például a Steammel...

MA 10:57

Az FTC nem enged: folytatja a harcot a Meta ellen

Az Amerikai Szövetségi Kereskedelmi Bizottság (FTC) hiába vesztette el korábban a Meta elleni versenyjogi pert, újabb fellebbezéssel próbálja meg felborítani Mark Zuckerberg birodalmát...

MA 10:50

A húsevő parazita legyek lerohanják Mexikót

🐞 A rettegett húsevő légy, az úgynevezett újvilági csavarlegy újra felbukkant Mexikóban, és egyre több állat esik áldozatául, ráadásul már az USA határához közelít...

MA 10:42

Az árnyalat ára: késhet a hólyagrák felismerése

🧪 A színtévesztés észrevétlenül befolyásolhatja a hólyagrák túlélési esélyeit – erre a következtetésre jutott egy friss, még előzetes vizsgálat...

MA 10:34

Az apró implantátum, amely véget vet a legsúlyosabb depressziónak

💡 Manapság rengetegen küzdenek depresszióval, de a legsúlyosabb esetekben a hagyományos kezelések gyakran csődöt mondanak...

MA 10:25

Az ultramobil szenzáció: 300 mm-es teleobjektívet kap az Oppo

Az Oppo várhatóan márciusban mutatja be legújabb csúcsmobilját, a Find X9 Ultra-t, amelyet, a kiszivárgott prototípus alapján, egészen elképesztő kameratechnológia jellemez...

MA 10:17

Az új Google Gemini-trükk miatt borulhat a naptárad, szivároghatnak az adataid

A Gemini MI legutóbbi frissítésével a Google Naptár (Google Calendar) okosabb lett: már nemcsak az elsődlegest, hanem az összes naptárat is képes kezelni, sőt, természetes nyelven lehet tőle eseményekről kérdezni vagy azokat létrehozni...

MA 10:03

Az artritisz végóráit jelentheti az új porcregeneráló eljárás

💉 Az időskori porckopás és ízületi gyulladás sokak életét keseríti meg, a térd- és csípőprotézisek pedig millióknak jelentenek végső megoldást...

MA 09:58

Az Egyesült Államokban ismét kitörhet a kanyarójárvány

😷 Egy éve tart az Egyesült Államok történetének egyik legsúlyosabb kanyarójárványa, amely elsősorban Nyugat-Texasban kezdődött, de mára az egész országot, valamint Mexikót és Kanadát is érinti...

MA 09:50

A század leglátványosabb sarki fénye: napvihar rázta meg a Földet

🌈 Az elmúlt éjszaka a Föld mágneses mezejét az elmúlt 23 év egyik legerősebb napvihara érte el, amely élénk sarki fényeket váltott ki az Egyesült Államokban, sőt egészen Dél-Kaliforniáig is eljutott az égi látványosság...

MA 09:41

Megérkezett a VoidLink: a mesterséges intelligencia már kártevőt is ír

A VoidLink nevű, frissen felfedezett felhőalapú kártevő-keretrendszer fejlesztése mögött egyetlen embert sejtenek, aki MI-modellel gyorsította fel a munkát...

MA 09:33

A védvonalon rés tátong: kritikus hiba a Cloudflare WAF-ban

⚠ A Cloudflare szakemberei egy komoly biztonsági hibát javítottak ki a cég webalkalmazás-tűzfalában (WAF), amely lehetőséget adott támadóknak arra, hogy megkerüljék a tűzfalat, és közvetlenül elérjék az eredeti szervereket...

MA 09:26

Az RSV tombol: áttörések a csecsemők védelmében

😷 Az RSV, vagyis a légúti óriássejtes vírus újra felfutóban van, és különösen a kisgyerekek körében terjed gyorsan...

MA 09:18

Az áttörhetetlen kvantumszámítógép leleplezve: súlyos biztonsági rések

A kvantumszámítógépek forradalmasíthatják a gyógyszerkutatást, az üzleti elemzéseket, sőt, teljes iparágakat is átalakíthatnak...

MA 09:09

A Netflix mobilalkalmazás vadonatúj külsőt kap

📱 A Netflix idén teljesen megújítja mobilos felületét, hogy az a következő években is korszerű maradjon, és igazodjon a cég egyre bővülő tartalmi kínálatához...

MA 09:01

Az új Netflix-app olyan, mint a TikTok, csak vörösben?

A Netflix új, teljesen átdolgozott mobilalkalmazást tervez, hogy lépést tartson a YouTube, a TikTok és az Instagram által uralt mobilos videónézéssel...

MA 08:58

A kontinensek vándorlása több klímakatasztrófát okoz, mint gondoltuk

Bolygónk történelme során hatalmas klímaváltozásokon ment keresztül. A Föld hol fagyos, hol szinte trópusi állapotok között ingadozott, az úgynevezett „jégkorszaki” és „üvegházi” időszakok során...