2026. 06. 11., 09:10

A kutatók mindössze 1500 dollárból tanítottak be egy alapmodellt a semmiből

A nagy nyelvi modellek (LLM-ek) fejlesztése eddig csak a leggazdagabb technológiai óriások privilégiuma volt, hiszen ezek betanítása brutális számítási kapacitást és világszintű adathalmazokat igényel. Egy új megközelítés azonban most mindent felforgathat, hiszen a Sapient kutatói 1 milliárd paraméteres LLM-et tanítottak be mindössze 540 000 forintért és 1,9 nap alatt, töredéknyi adattal.

Az LLM-ek fájdalmas drágasága

A vállalatok többsége hiába vágyik saját mesterséges intelligenciára, a jelenlegi LLM-ek betanítása elérhetetlenül drága és bonyolult. A klasszikus recept: végigpörgetni a teljes internetet, minden szövegre ránézni és rengeteg grafikus processzort zsongatni napokon át. Minden egyes újabb iteráció – legyen szó kísérletről vagy finomhangolásról – milliókba kerülhet, és elképesztő infrastruktúrát követel.

Ez nem csupán technikai, hanem üzleti korlát is egyben. A legtöbb próbálkozó hamar rájön: ha a modell hibázik, még nagyobbra kell nőnie, még több adatra és számításra van szükség, de a javulás már egyre kevésbé jelentős. Ráadásul a legtöbb, vállalati adattal dolgozó szervezet nem szeretné érzékeny vagy saját fejlesztésű információit az egész interneten tanított MI-re bízni. Nekik egy kisebb, személyre szabható, okos modell kell, amely képes a szabályok, számok és struktúrák között összefüggéseket keresni.

Egy újfajta mesterséges intelligencia-architektúra

A Sapient által bemutatott HRM (Hierarchical Recurrent Model) teljesen szakít a Transformer-architektúrák mindenhatóságával. Az új modellben a számítás két részre oszlik: egy lassabb, stratégiai (H-modulra) és egy gyors, végrehajtó komponensre (L-modulra). Ez megfelel annak, ahogy az emberek gondolkodnak: nagyobb lépésekben tervezzük, mit akarunk elérni, miközben a részletekben gyors, folyamatos kiigazítások történnek.

A HRM-Text nevű változatnál a fejlesztők kizárólag utasítás–válasz párokon tanították be az MI-t, elhagyva a nyers szöveges előrejelzést, tehát a brutális szövegmásolás helyett olyan tanulás zajlott, amely közel áll a tipikus vállalati környezethez: a felhasználó feladatot ad, az MI válaszol.

Trükkök és újdonságok, hogy tényleg működjön

A klasszikus visszacsatolt (recurrent) neurális hálók nagy léptékben könnyen instabillá válnak, különösen, ha a nyelv modellezése a cél. A Sapient két kulcsfontosságú újítást vezetett be: a MagicNorm nevű normalizációs eljárás megoldja az információs jelek elszállását vagy eltűnését, míg egy különleges „bemelegítő” tanítási technika kezdetben rövidebb gondolkodási hurkokat enged, majd fokozatosan növeli ezek mélységét és hosszát.

A HRM-Textnél a feladatvégzés vált a tanulási célkitűzéssé: az MI csak akkor „kapott jutalmat”, ha a teljes válasz helyes volt, nem pedig apró lépésekért. Az utasítás–válasz párokat eredeti szövegek, matematikai és logikai feladatok, tankönyvi példák, átírt tudáselemek képezték. Gondosan ügyeltek arra is, hogy kivegyék a „gondolkodásom” típusú lépéseket, ezzel is biztosítva a hierarchikus gondolkodás kialakulását.

Számok és eredmények: a kis modell nagyot szól

A Sapient által betanított HRM-Text mindössze 1 milliárd paraméterből áll, mégis meggyőzően szerepelt kulcsfontosságú ipari teszteken. A modellt 40 milliárd tokenen (szóelem) tanították, miközben versenytársai ennek a százszorosánál is többet dolgoznak fel. A teljes tanítás költsége 540 000 forint volt, 16 GPU-n futott 1,9 napig.

Az eredmény? A HRM-Text 60,7%-ot ért el az MMLU, 84,5%-ot a GSM8K és 56,2%-ot a MATH benchmarkokon – összemérhetően (sőt helyenként jobban is) teljesített a 2–7 milliárd paraméteres, széles körben használt nagy alapmodellekkel. Emellett az előzetes tudás memorizálása helyett a valódi érvelést, szabálykövetést, összefüggés-alkotást helyezi előtérbe, ami a vállalati igényekhez jobban igazodik.

Jellemző példa erre, hogy olyan teszteken, ahol kizárólag makulátlan, „szennyezésmentes” adatokat használtak, a modell továbbra is kiemelkedő pontszámokat szerzett.

Mit jelent ez a vállalatok számára?

A belső MI-re vágyó szervezetek most először reálisan vállalkozhatnak saját, titkosított, cégspecifikus modellre. A HRM-Text csak egy kiindulási alap: a gyakorlati implementáció során a cégek maguk választhatják meg, hogy pontosan mit akarjon tárolni az MI, milyen irányban fejlesszék tovább, illetve hogy a „modellezett és gondolkodó mag” döntési motorként szolgáljon, miközben a tényeket, tudásbázisokat, adatbázisokat külön, külső forrásból hívja elő.

Emellett a kritikus hangok szerint az utasítás–válasz tréning eltér az eddigi módszerektől, nem lehet összevetni a hagyományos, nyers szöveggel tanított MI-kkel. Azonban a gyakorlat gyakran ezt kívánja: a felhasználók utasításokat adnak, amelyekre az MI-nek pontos, tartalmas választ kell adnia.

Ha a tanítás ára 540 000 forintra zuhan, a vállalati MI már nemcsak infrastruktúra-kérdés, hanem stratégiai lehetőség lesz: a cégek végre saját, célzott MI-t építhetnek anélkül, hogy függnének a külső gigászoktól, és anélkül, hogy minden adatukat kiadnák másnak.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

Tudomány

MA 09:49

A Microsoft kibocsátása 25%-kal nőtt – a neheze még hátravan

💨 A Microsoft károsanyag-kibocsátása tavaly 25%-kal nőtt, ami főleg az adatközpontok gyors terjeszkedésének köszönhető...

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

MI Hírek

MA 09:37

Az adataid a telefonodon maradnak: a Google új AI-dobása a Pixelen

📱 A Google ismét újat mutat a Pixel okostelefonok világában – mostantól az eszközökön futó mesterséges intelligencia még erősebbé teszi a mobilokat, úgy, hogy közben védi a felhasználók adatait...

APP

MA 09:11

APPok, Amik Ingyenesek MA, 7/15

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Between Dates Calendar Math (iPhone/iPad)A Between Days alkalmazás egyszerű és gyors megoldást kínál két dátum közötti napok kiszámítására...

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Színes

MA 09:01

Az északkeleti levegő veszélyes: minnesotai erdőtüzek szennyezik

Az Észak-Minnesotában pusztító erdőtüzek füstje hamarosan elérheti az Egyesült Államok északkeleti nagyvárosait, többek között Detroitot, Milwaukee-t, Clevelandet, Philadelphiát és New Yorkot...

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

Tudomány

MA 08:49

Az első szintetikus sejt: tényleg megszületett a mesterséges élet?

A Minnesotai Egyetem laboratóriumában újszerű biológiai eredmény született: egy aprócska SpudCell nevű képződmény képes táplálkozni, növekedni, versengeni, osztódni és lemásolni önmagát – vagyis szinte mindent tud, amit egy élő sejt is...

MI Hírek

MA 08:36

Az új Google Képek Pinterest-szerű, felfedezésre kihegyezett átalakítást kapott

A Google Képek (Google Images) megújult külsőt kapott: mostantól személyre szabott galériákat kínál a felhasználóknak, így még könnyebben fedezhetik fel az őket érdeklő képeket...

MI Hírek

MA 08:12

A Google DeepMind az USA-t tenné az MI-szabványok élére

A Google DeepMind vezére, Demis Hassabis szerint az új generációs mesterséges intelligencia egyre komolyabb veszélyeket rejt magában, például a kiberbiztonság és a biológiai fenyegetések terén...

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

Tudomány

MA 08:01

Az új Alzheimer-gyógyszer felforgatja a megszokott kezeléseket

💊 Fontos kérdés, hogy meg lehet-e állítani vagy lassítani az Alzheimer-kór lefolyását, hiszen a demencia legfőbb oka, az Alzheimer-kór, világszerte rengeteg embert érint...

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

Tudomány

MA 07:49

Az űrben tovább tart az amerikai–orosz űrhajósok összefogása

🚀 Sikeresen megérkezett kedden a Nemzetközi Űrállomásra egy amerikai–orosz személyzet, miután a kazahsztáni Bajkonurból indultak a Roszkoszmosz által üzemeltetett Szojuz MS-29 fedélzetén...

A Microsoft Secure Bootja tíz éve lyukas, észre sem vették

Tudomány

MA 07:37

A Microsoft Secure Bootja tíz éve lyukas, észre sem vették

🔒 Az informatika egyik legfontosabb biztonsági eleme, a Secure Boot, már csaknem tíz éve lényegében védtelenné vált – és ezt eddig senki sem vette észre...

Tudomány

MA 07:24

A csípős paprika növelheti egy halálos rák kockázatát?

Bár a csípős paprika számos kultúra elválaszthatatlan része, és egyes laboratóriumi kísérletek a bennük található vegyületeket, például a kapszaicint gyulladáscsökkentőnek vagy akár daganatellenesnek mutatják, az utóbbi évek humán kutatásai nem ennyire egyértelműek...

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Tudomány

MA 07:02

Az Artemis II: „Furcsán nézett ki a Hold” 250 ezer mérföldről

Április 6-án négy űrhajós indult el az Artemis II misszió keretében az Orion űrhajóval, és körülbelül 40 percig teljesen eltűntek a Föld látóteréből...

Színes

MA 06:38

A Microsoft rekordméretű javításözöne: 570 hiba és 3 zero-day

🔧 Szinte példátlanul nagy frissítési csomagot adott ki a Microsoft a 2026...

MI Hírek

MA 06:25

A volt dolgozók részrehajló MI-t sejtenek a leépítések mögött – perelik a Metát

💼 Májusban a Meta megvált dolgozóinak 10 százalékától, közel 8 000 alkalmazottat küldött el, ami jelentős átszervezéssel járt a vállalat MI-re és adatközpontokra irányuló fejlesztései miatt...

HistoryToday

MA 06:05

Történelmi események a mai napon (Július 15.)

Időutazás egyetlen napon: Jeruzsálem falainak áttörésétől 🏰 a Rosetta-kő 🗿 megtalálásán és Napoleon 🚢 megadásán át a Grunwaldnál vívott döntő ütközetig ⚔️, sőt a modern korszakban a törökországi puccskísérletig 🇹🇷 és a Mozilla alapításáig 🦊...

Az Ozempic és a Wegovy tényleg lassíthatják a biológiai öregedést?

Tudomány

kedd 18:31

Az Ozempic és a Wegovy tényleg lassíthatják a biológiai öregedést?

Tipikus eset, amikor egy ismert gyógyszer egészen váratlan előnyöket kínál. A GLP-1 típusú szerek, mint az Ozempic, a Wegovy vagy a Rybelsus, eredetileg a fogyás, a jobb vércukorszint-szabályozás és a szívbetegségek kockázatának csökkentése miatt váltak népszerűvé...

Tudomány

kedd 17:30

Az indiai tudósok megalkották az emberi agytörzs eddigi legrészletesebb 3D-atlaszát

Indiai kutatók a világ eddigi legrészletesebb, háromdimenziós agytörzs-atlaszát hozták létre, amelyben MRI-felvételeket több mint 500 mikroszkópos szövetrészlettel kapcsoltak össze...

Tudomány

kedd 17:01

A Tejútrendszer mélyén cukrot találtak a kutatók

Többek között különleges eredményre jutottak a kutatók: a Tejútrendszer középpontjához közel egy óriási gázfelhőben felfedeztek egy ritka cukorfélét, az eritrózt, amely nemcsak málnában, hanem barnító krémekben is megtalálható...

Kriptó

kedd 16:01

Az IBM 23%-ot zuhant a második negyedéves profitfigyelmeztetés után

Ami kezdetben ártalmatlannak tűnt, végül az IBM történetének egyik legsötétebb napjához vezetett a tőzsdén...

A NASA Perseverance-je célba ért: megvan a marsi maraton

Tudomány

kedd 15:01

A NASA Perseverance-je célba ért: megvan a marsi maraton

🚀 Történelmi teljesítmény született a Marson: a Perseverance marsjáró öt év és négy hónap után elérte a 42,195 kilométeres maratoni távot...

Színes

kedd 12:01

A régi T‑Mobile-csomagoknak vége: kényszerváltás már ezen a héten

Ami kezdetben ártalmatlannak tűnt, most minden régi T-Mobile-előfizető számára valódi változás: a társaság e héttől kezdve automatikusan átsorolja a 10–15 éves tarifákat – például a Simple Choice, T-Mobile One, One Plus, a Magenta családhoz tartozó, valamint a Sprintből áthozott régi csomagokat – modernebb tarifákra...

Az inflációs adat előtt megroggyan a Bitcoin

Kriptó

kedd 11:31

Az inflációs adat előtt megroggyan a Bitcoin

A legnagyobb kriptovaluták teljesítménye az elmúlt 24 órában jelentősen visszaesett, miután egyre többen valószínűsítik, hogy az amerikai jegybank akár már júliusban kamatemelés mellett dönt...

Az analóg fotózás visszatér: a fiatalok újra tekercsre lőnek

Színes

kedd 11:02

Az analóg fotózás visszatér: a fiatalok újra tekercsre lőnek

Az elmúlt pár évben váratlan fordulat történt a fotózás világában: a fiatal generáció újra felfedezte a filmes fényképezőgépeket...

MI Hírek

kedd 10:49

A Turing-mítosz vége: lehet, hogy tévedett a mesterséges intelligenciáról?

🤔 A mesterséges intelligencia kutatása 75 éve követi Alan Turing útmutatását, aki két alapvető feltételezést tett: az intelligencia létrehozható szoftverből, függetlenül a testtől, és hogy egy gép intelligensnek számít, ha sikerrel utánozni tudja az embert, például egy beszélgetés során...

Az MI átírja a marketinget: a régi szabályoknak befellegzett

MI Hírek

kedd 10:37

Az MI átírja a marketinget: a régi szabályoknak befellegzett

💡 A Fortune 500 cégek vezető marketingesei kénytelenek szembenézni azzal a ténnyel, hogy a korábbi, jól bevált módszerek egyszerűen elavultak...

Színes

kedd 10:25

A júliusi Google-frissítés felturbózza a Play Áruházat, Wear OS-t és a Térképet

🚀 A legújabb Google System-frissítés idén nyáron ismét ráncfelvarrást hoz az Android-felhasználóknak...

Színes

kedd 10:01

Végre itt a hideg vízzel elkészíthető Cup Noodles!

🍹 Lényeges szempont, hogy az instant tészták villámgyors megoldást kínálnak, legyen szó egyetemista vacsoráról vagy gyors munkahelyi ebédről...

A Pixel frissítése végre kézre álló csengőhang-, ébresztő- és értesítéskezelést ad

Színes

kedd 09:48

A Pixel frissítése végre kézre álló csengőhang-, ébresztő- és értesítéskezelést ad

A Google a Pixel telefonokon jelentősen megkönnyíti a csengőhangok, az ébresztők és az értesítések hangerejének szabályozását...

A legnagyobb japán taxitársaság leállította rendszereit kibertámadás után

Színes

kedd 09:37

A legnagyobb japán taxitársaság leállította rendszereit kibertámadás után

Felmerül a kérdés, hogy mi történik egy nagyvállalattal, ha leáll a teljes informatikai rendszere?..