MA 08:26

Az MIT új MI-keretrendszere átírja a játékszabályokat a szövegértésben

Az MIT új MI-keretrendszere átírja a játékszabályokat a szövegértésben
A Massachusetts Institute of Technology kutatói vadonatúj megközelítést dolgoztak ki, amellyel a mesterségesintelligencia-alapú nyelvi modellek akár tízmillió szavas szövegeken is képesek hatékonyan dolgozni. A Recursive Language Models (RLM) névre keresztelt eljárás nem a megszokott módon kezeli a hosszú beviteli szövegeket: nem próbálja a teljes szöveget egyben áttolni az MI kontextusablakán, hanem programozói logika mentén képes darabokra szedni, vizsgálni és önmagát többször is újrahívni a részletek feldolgozásáért.

A kontextuskorlát és a „kontextusromlás” problémája

A jelenlegi fejlesztések ellenére a legfejlettebb MI-modellek következtetési kapacitása nem nő olyan gyors ütemben, mint az általuk feldolgozható információmennyiség. Két fő akadályba ütköznek: egyrészt kemény fizikai határa van annak, hogy mennyi szöveget képesek egyszerre „látni” (ez a kontextushossz), másrészt a „kontextusromlás” miatt a régi információ elhalványul, kevésbé lesz lényeges vagy pontatlanul kerül visszahívásra. Míg a kontextusablakokat lehet bővíteni, ez önmagában hamar zsákutcába vezet, mivel exponenciálisan több minta kellene a modellek újratanításához.

Tipikus próbálkozás a feladat nagyságához mérten túl rövid kontextushossz kezelésére, hogy a régebbi beszélgetésrészeket a modellek rövidítik, összegzik. Viszont ha a részfeladatok között akár véletlenszerűen kell visszanyúlni régebbi, specifikus adatokhoz, ez a stratégia hamar elbukik.

Hogyan működnek az RLM-ek?

Az MIT kutatói a klasszikus informatikából ismert „out-of-core” algoritmusokból merítettek ihletet, melyek akkor is képesek működni, ha a feldolgozandó adathalmaz nagyobb, mint a gép memóriája. Ebben az új MI-megközelítésben a hatalmas szöveget nem egy az egyben töltik be a hálózatba, hanem egy programozói környezetben változóként tárolják (például Python-karakterlánc). Az MI először csak néhány metaadatot kap a szövegről (például karakterszám), de a konkrét tartalomhoz csak szükség esetén fér hozzá.

Ilyen módon az MI „programozói üzemmódba” vált: saját maga ír kódrészleteket, hogy elérje és feldolgozza az épp szükséges részeket. Például kereshet címkéket, mint „Első fejezet” vagy „pénzügyi eredmények”, majd ezek alapján behívja az adott szakaszokat részletes elemzésre.

Az architektúra általában két külön MI-modellt kombinál: egy fő, nagy tudású „root” modellt (például GPT-5), ami vezényel, tervezi a stratégiát és kódot ír; illetve egy gyorsabb, olcsóbb modellt, amely a konkrét részletek feldolgozását végzi. Így bármilyen hosszú próbát is gond nélkül kezelhetnek, mindezt anélkül, hogy a modelleket újra kellene tanítani.

Felhasználási területek és teljesítmény

Ami ezután történt, az mindenkit meglepett: az új rendszerrel végzett tesztek azt mutatták, hogy az RLM-ek elképesztő hatékonysággal birkóznak meg a 10 millió tokenes (vagyis extrém hosszú) szövegekkel, miközben a normál modellek ilyen méretben szinte használhatatlanok. Például egy 6–11 millió tokenes tesztben (Financial Reports benchmark) a hagyományos modellek rendre 0%-os pontosságot értek el, míg az RLM-ek akár 91,33%-ot is; még az eddig legjobbnak számító összegző ügynök (Summary Agent) is csak 70,47%-ig jutott el.

Különösen nagy előny mutatkozott a bonyolult, egymásba ágyazott logikai feladatoknál (OOLONG-Pairs), ahol a bemenő adatok hosszával arányosan nő a nehézség – a GPT-5 itt szinte teljesen leblokkolt (0,04%), míg az RLM-ek 58%-os F1-mutatóval dolgoztak. Kódértésben (CodeQA) is több mint kétszeres javulást hozott az új keretrendszer a klasszikus modellekhez képest.

Ennek ellenére a működés időnként költségesebb lehet, ha a modell túl sok felesleges alhívással próbálkozik, vagy végtelen ciklusba fut. Ilyenkor a fejlesztőknek saját „védőkorlátokat” és önellenőrző logikát kell beépíteniük, hogy a költségek ne szálljanak el – ám átlagosan az RLM ma már olcsóbb lehet egyes meglévő alapmodelleknél.


Jövőkép és konklúzió

A fentiek tükrében az MIT fejlesztése új fejezetet nyithat a hosszú, összetett szövegeket igénylő MI-alkalmazásokban: legyen szó akár forráskód-elemzésről, jogi szakvélemények feldolgozásáról vagy végeláthatatlan chatelésekről. Az RLM-modell nem váltja le a már elterjedt visszakereső eljárásokat (például Retrieval-Augmented Generation – RAG), azonban remekül kiegészítheti őket. A jövő MI-fejlesztéseiben valószínűleg az önálló költséggazdálkodás és a hatékonyabb részfeladat-lebontás is be fognak épülni a modellek „mindennapi” működésébe. Az RLM tehát nemcsak programozói, hanem vállalati, jogi vagy akár mindennapi felhasználásban is áttörő lehetőségeket kínál.

2025, adminboss, venturebeat.com alapján

  • Te szerinted jó ötlet-e, ha a gépekre bízzuk a döntéseket, ha ilyen bonyolult logikai feladatokról van szó?
  • Te mit tennél, ha olyan MI-modell fejlesztésén dolgoznál, amely képes lenne hibázni vagy többletköltséget okozni?


Legfrissebb posztok

MA 10:03

Az artritisz végóráit jelentheti az új porcregeneráló eljárás

💉 Az időskori porckopás és ízületi gyulladás sokak életét keseríti meg, a térd- és csípőprotézisek pedig millióknak jelentenek végső megoldást...

MA 09:58

Az Egyesült Államokban ismét kitörhet a kanyarójárvány

😷 Egy éve tart az Egyesült Államok történetének egyik legsúlyosabb kanyarójárványa, amely elsősorban Nyugat-Texasban kezdődött, de mára az egész országot, valamint Mexikót és Kanadát is érinti...

MA 09:50

A század leglátványosabb sarki fénye: napvihar rázta meg a Földet

🌈 Az elmúlt éjszaka a Föld mágneses mezejét az elmúlt 23 év egyik legerősebb napvihara érte el, amely élénk sarki fényeket váltott ki az Egyesült Államokban, sőt egészen Dél-Kaliforniáig is eljutott az égi látványosság...

MA 09:41

Megérkezett a VoidLink: a mesterséges intelligencia már kártevőt is ír

A VoidLink nevű, frissen felfedezett felhőalapú kártevő-keretrendszer fejlesztése mögött egyetlen embert sejtenek, aki MI-modellel gyorsította fel a munkát...

MA 09:33

A védvonalon rés tátong: kritikus hiba a Cloudflare WAF-ban

⚠ A Cloudflare szakemberei egy komoly biztonsági hibát javítottak ki a cég webalkalmazás-tűzfalában (WAF), amely lehetőséget adott támadóknak arra, hogy megkerüljék a tűzfalat, és közvetlenül elérjék az eredeti szervereket...

MA 09:26

Az RSV tombol: áttörések a csecsemők védelmében

😷 Az RSV, vagyis a légúti óriássejtes vírus újra felfutóban van, és különösen a kisgyerekek körében terjed gyorsan...

MA 09:18

Az áttörhetetlen kvantumszámítógép leleplezve: súlyos biztonsági rések

A kvantumszámítógépek forradalmasíthatják a gyógyszerkutatást, az üzleti elemzéseket, sőt, teljes iparágakat is átalakíthatnak...

MA 09:09

A Netflix mobilalkalmazás vadonatúj külsőt kap

📱 A Netflix idén teljesen megújítja mobilos felületét, hogy az a következő években is korszerű maradjon, és igazodjon a cég egyre bővülő tartalmi kínálatához...

MA 09:01

Az új Netflix-app olyan, mint a TikTok, csak vörösben?

A Netflix új, teljesen átdolgozott mobilalkalmazást tervez, hogy lépést tartson a YouTube, a TikTok és az Instagram által uralt mobilos videónézéssel...

MA 08:58

A kontinensek vándorlása több klímakatasztrófát okoz, mint gondoltuk

Bolygónk történelme során hatalmas klímaváltozásokon ment keresztül. A Föld hol fagyos, hol szinte trópusi állapotok között ingadozott, az úgynevezett „jégkorszaki” és „üvegházi” időszakok során...

MA 08:41

Az MI áttörést hozhat Afrikában: a Gates–OpenAI új programja

Megemlíthető továbbá, hogy a Gates Alapítvány és az OpenAI közös erővel, 18 milliárd forintnyi (50 millió dollár) támogatással elindították a Horizon1000 nevű kezdeményezést, melynek célja, hogy 2028-ig ezer afrikai alapellátó egészségügyi rendelőt szereljenek fel MI-eszközökkel...

MA 08:33

A fiatalok legnagyobb félelme az MI – mások vállat vonnak

Az új kutatások szerint a Z generáció tagjai félnek leginkább attól, hogy az MI elveszi a munkájukat, annak ellenére, hogy a technológiát a legügyesebben használják...

MA 08:19

Az évszázados rejtély: két titokzatos forma átírja a geometria törvényeit

Képzeld el, hogy a Földet soha nem láttuk volna felülről, és az égben vastag, áthatolhatatlan felhőréteg borult volna fölénk...

MA 08:03

Az egészségesebb szívért: 9 egyszerű mindennapi szokás

Érdemes megérteni, hogy a szív- és érrendszeri betegségek továbbra is a vezető haláloknak számítanak Magyarországon, ahogy világszerte is, hiszen csak az Egyesült Államokban minden 34...

MA 07:49

A Parkinson-kór új gyenge pontja: lelepleztek egy rejtett fehérjét

Tudósok feltárták, hogyan gyorsít fel egy alattomos fehérjekapcsolat az agysejtek pusztulását a Parkinson-kórban, és már most olyan célzott terápián dolgoznak, amely képes lehet visszafordítani ezt a folyamatot...

MA 07:41

Az ACF súlyos hibája veszélybe sodorja a WordPress-oldalakat

Egy kritikus sérülékenység miatt hackertámadások érték több mint 50 000 WordPress-oldalt, amelyek az Advanced Custom Fields: Extended (ACF Extended) bővítményt futtatják...

MA 07:33

A Helix-köd sosem látott pompában: tarol a Webb-felvétel

A Helix-köd az egyik legismertebb és legtöbbet fotózott planetáris köd, főként jellegzetes gyűrűs formája miatt...

MA 07:25

Az új Trump-tarifák földindulást okoztak a kriptópiacon

💰 Jó példa erre, amikor egyetlen politikai bejelentés hullámokat vet a pénzügyi piacokon — most éppen a kriptovilág volt a legnagyobb vesztese...

MA 07:17

Az univerzum szeme: lélegzetelállító új Webb-kép a Helix-ködről

👀 Néha nem árt kikapcsolni, és a világegyetem vizsgálata épp ideális menedék lehet...