Az MI, amely agyunkhoz hasonlóan gondolkodik – és lepipálja a ChatGPT-t
A szingapúri Sapient kutatói egy teljesen új mesterséges intelligencia modellt dolgoztak ki, amely nemcsak felülmúlja a legismertebb nagy nyelvi modelleket (LLM), például a ChatGPT-t (ChatGPT), hanem lényegesen kevesebb erőforrást is igényel. Ez a hierarchikus következtetési modell (HRM) a humán agy információfeldolgozási folyamataiból merít ihletet: különböző „agyterületek” időben eltérő, akár milliszekundumtól percekig terjedő tempóban integrálják az információt.
Kevesebb paraméter, nagyobb hatékonyság
Az új modell mindössze 27 millió paraméterrel és 1000 tanulómintával dolgozik, miközben a legnépszerűbb MI-modellek – például a frissen megjelent GPT-5 (GPT-5) – 3000 milliárd–5000 milliárd paraméterrel számolnak. Mindez radikálisan kevesebb adatot és számítási kapacitást igényel, mégis hihetetlenül magas teljesítményt nyújt.
Mindenkit meglepett a teszteredmény
Az ARC-AGI (ARC-AGI) nevű szigorú próbatételen – amely az általános mesterséges intelligencia (AGI, Artificial General Intelligence) elérésének közelségét méri – az új HRM 40,3%-ot ért el, az OpenAI o3-mini-high modellje 34,5%-ot, az Anthropic Claude 3.7 modellje 21,2%-ot, a Deepseek R1 csupán 15,8%-ot. A még nehezebb ARC-AGI-2 (ARC-AGI-2) teszten a HRM 5%-ot ért el, az o3-mini-high 3%-ot, a Deepseek R1 1,3%-ot, a Claude 3.7 pedig mindössze 0,9%-kal kullogott mögötte.
A hagyományos CoT (láncolt gondolatmenet, Chain of Thought) helyett a HRM egyszerre, egy menetben oldja meg a feladatokat. Egy magasabb szintű modul felel a lassú, absztrakt tervezésért, egy alacsonyabb pedig a gyors, részletes számításokért – akárcsak az emberi agy különböző részei.
A HRM képes iteratív finomításra: lépésről lépésre pontosítja a megoldását, és minden „gondolkodási robbanásnál” eldönti, hogy megálljon-e vagy továbblépjen. Még bonyolult Sudoku-feladványokat vagy optimális útvonaltervezést is tökéletesen megoldott, amire a hagyományos LLM-ek nem voltak képesek.
Bár a cikk szerzői eredményei izgalmasak, a független kipróbálás során kiderült: a lenyűgöző teljesítmény mögött inkább a speciális, kevéssé dokumentált finomhangolási folyamat áll, nem csupán a hierarchikus felépítés.
2025, adrienne, www.livescience.com alapján
filózó
Te szerinted jó, ha egy új megoldás titkos részeket is tartalmaz?
Szerinted mennyire etikus, ha egy kutató nem teszi teljesen átláthatóvá a módszerét?
Te szívesen kipróbálnád ezt az új modellt, vagy inkább várnál a független visszaigazolásra?
Felmerül a kérdés, hogy mivel lehet kitűnni a Minecrafthoz hasonló, tömbös látványvilágú játékok világából, ha mindenki szinte ugyanazzal próbálkozik...
Egy ír egyetemen dolgozó kutatócsoport véletlenül bukkant rá a legrégebbi fennmaradt angol versre, miközben egy középkori könyvet lapozgatott egy római könyvtár digitalizált gyűjteményében...
💰 Ilyen eset például, amikor a Bitcoin körül egyre többen keresik, hogyan lehetne a világ legrégebbi blokkláncát végre nemcsak értéktárolásra használni, hanem valódi DeFi (decentralizált pénzügyi) alkalmazásokat futtatni rajta...
A Civilizáció 7 (Civilization 7) legújabb frissítése hétfőn fut be, és meglepetésként minden játékos számára elérhetővé teszi a történelem egyik leghíresebb hadvezérét, Nagy Sándort...
A Kelet-Szudánban, a hatalmas Atbai-sivatagban többéves kutatómunka alatt 260 hatalmas, kör alakú temetőt sikerült azonosítani, amelyek jóval az ókori Egyiptom létrejötte előtt épültek...
Erre jellemző példa, hogy a csillagászok egy lenyűgöző, új felvételt készítettek az Örvény-galaxisról (Whirlpool Galaxy, Messier 51), amely közelebb visz bennünket a csillagok születésének rejtélyeinek megértéséhez...
💸 A digitális világban minden eddiginél könnyebb pénztárca nélkül áldozattá válni. Egy friss kutatás szerint a sötét weben mindössze 4500 forintért hozzá lehet jutni egy brit bankkártya teljes adataihoz, míg egy teljes digitális azonosítócsomag 15 ezer forintba kerül...
Jellemző példa erre, hogy Arizonában több mint 150 levágott fejet tárolnak kriogén kamrákban abban a reményben, hogy a jövő orvostudománya egyszer újra életre keltheti őket egy másik testben...
Egy tizenkilencedik századi kézirat került elő Rómában, amely igazi szenzációnak számít a nyelvészek és irodalomtudósok körében: a Trinity College Dublin kutatóinak sikerült azonosítani az egyik legkorábbi, ma ismert angol vers egyik legrégebbi változatát...
A Riválisok (Rivals) második évadának első három epizódja már elérhető a Hulu-n és a Disney+-on, viszont a rajongók csalódottan tapasztalhatják, hogy a szezon második felére idén még várni kell...
Érdemes megvizsgálni, hogy tényleg mindenáron kerülni kell-e a jojódiétát. Az évek óta tartó rettegés, miszerint az ismétlődő fogyás és visszahízás árthat az egészségnek, úgy tűnik, nem támasztható alá meggyőző tudományos bizonyítékokkal...
Egy Spanyolországban talált, 150 millió éves, elképesztően jól megmaradt sztégoszaurusz-koponya alapjaiban változtatja meg mindazt, amit eddig a dinoszauruszok fejlődéséről tudtunk...
A Kongói Demokratikus Köztársaság és Uganda területén kitört ebola-járványt vasárnap nemzetközi jelentőségű egészségügyi vészhelyzetnek minősítette az Egészségügyi Világszervezet...
A Survivor – Görögország (Survivor Greece) forgatását azonnali hatállyal leállították, miután egy fiatal versenyző, Stavros Floros életveszélyes balesetet szenvedett...
A technológiai átalakulás új korszakát éljük, ahol a fejlett algoritmusok már nemcsak támogatják, hanem egyre inkább kiváltják azokat a szakértői feladatokat, amelyekben az embereknek fejlődniük kellene...
A GameSir G8+ MFi jelentős előrelépés a mobil játékvezérlők világában, amely a G8 Galileo bevált tulajdonságait vette alapul, majd szinte minden kritikus ponton továbbfejlesztette azt...
Kételyek merültek fel, hogy a nemrég megjelent, Mixtape című történetközpontú játék hamarosan eltűnhet a digitális boltokból a zeneszámok licencproblémái miatt...
Hihetetlen, de mégis igaz, hogy az Egyesült Államokban működő adatközpontok évente annyi áramot fogyasztanak, amellyel több mint 16 millió otthon energiaigényét lehetne fedezni...
Kenya elképesztő technológiai ugrásra készült, amikor májusban bejelentették a G42 és a Microsoft közös, 1 milliárd dolláros adatközpont-beruházását...