2025. 08. 07., 11:51

68-as agyú MI-k, filléres géphadsereg: Megdöbbentő LLM-rangsor – Ezek most a legjobbak!

68-as agyú MI-k, filléres géphadsereg: Megdöbbentő LLM-rangsor – Ezek most a legjobbak!
Az elmúlt időszakban robbanásszerű fejlődés indult meg a nagy nyelvi modellek (LLM-ek) terén, amelyeket olyan óriások fejlesztenek, mint a Google, az OpenAI, a DeepSeek vagy az Anthropic. Több mint 100 ilyen modell teljesítményét hasonlították össze: intelligencia, ár, sebesség, válaszadási késleltetés és memóriakapacitás (kontextusablak) alapján. Érdemes egy pillantást vetni arra, mely modellek teljesítenek a legjobban – és hol találhatók az igazi ár-érték bajnokok.

Intelligencia: Kik az MI-zsenik?

Az MI intelligencia-mutatója szerint jelenleg a Grok 4 és az o3-pro modellek uralják a mezőnyt, 68-as értékkel. Közvetlenül mögöttük a Grok o3 és az o4-mini (mindkettő szintén magas pontszámmal), valamint a Google Gemini 2.5 Pro következik. Érdemes megjegyezni, hogy a piac legdrágább modelljei között nem feltétlenül a legokosabbakat találjuk – a Grok 4 például 68-as intelligenciaszámmal 2,7 millió Ft/1M token áron kapható.

Ezzel szemben akadnak olyan modellek is, amelyek alacsonyabb áron kínálnak figyelemre méltó teljesítményt: a DeepSeek R1, a GLM-4.5 vagy éppen a Qwen3 sorozat bizonyos verziói már 420–450 Ft/1M token áron elérhetők, mégis hasonló (55–60 körüli) intelligencia-mutatót produkálnak.

Kiváló ár-érték arányt kínál a gpt-oss-20B (high) is, amely alig több mint 40 Ft/1M token áron 51 pontot ér el, bőven a középmezőny fölött.

Sebesség és válaszidő: Villámgyors MI-k

Az output sebességét tekintve toronymagasan vezet a Gemini 2.5 Flash-Lite (Érvelés / Reasoning), amely közel 500 token/másodperc tempót hoz – ez kétszerese a gpt-oss-20B (high) sebességének (386 token/másodperc), ami szintén kiemelkedő. Ezt a tempót csak néhány modell, például a Nova Micro, a GLM-4.5-Air vagy a Gemini 2.5 Flash-Lite közelíti meg.

A válaszadási késleltetés (tehát milyen gyorsan kapod az első választ) bajnokai is lenyűgöző eredményt mutatnak: az Aya Expanse 8B (0,14 mp!) és a Command-R (0,15 mp) szinte azonnal reagálnak, míg a LFM 40B és az Aya Expanse 32B is 0,16 mp körül indít. Ez alapján arra lehet következtetni, hogy a sebesség és késleltetés terén főleg a kisebb modellek, illetve a kifejezetten gyorsaságra optimalizált verziók a nyerők.

Árak: Hol a legolcsóbb a token?

Az áraknál jelentős eltérések láthatók. A legalacsonyabb ár, mindössze kb. 13 Ft/1M token, a Gemma 3 4B és a Gemma 3n E4B esetében érhető el – ráadásul egészen jó (14–18-as) intelligenciaérték mellett. Ez váratlanul jó ajánlat azoknak, akiknél a mennyiség fontosabb, mint a minőség.

Szintén meglepően olcsók a Llama 3.2 3B vagy a Mistral 3B, amelyek 15–16 Ft/1M token áron futnak, miközben egyes verzióik egész jó sebességet is hoznak. Ezzel szemben néhány, magas intelligenciájú modell, például az o3-pro vagy a Claude 4 Opus Thinking extrém drágák (akár 16 millió Ft/1M token), cserébe viszont kiemelkedő pontszámmal rendelkeznek.


Kontextusablak: Mekkora szövegre emlékszik?

A kontextusablak (memóriakapacitás) terén is vannak óriások: a Llama 4 Scout egészen elképesztő, 10 millió tokenes ablakot kezel, míg a MiniMax-Text-01 is eléri a 4 milliós határt. Az összes jelentős fejlesztő (Google Gemini, OpenAI, Mistral, Anthropic stb.) kínál már legalább 128 ezer tokenes vagy annál nagyobb memóriájú MI-t. Ez főleg azoknak kedvez, akik nagyon hosszú dokumentumokat vagy összetett feladatokat szeretnének egyben feldolgoztatni.

Kínálat: Óriási a választék – mindenki versenyben

Manapság már nemcsak az OpenAI, a Google vagy a Meta szerepel a mezőnyben: ott van a DeepSeek, Anthropic, Mistral, NVIDIA, IBM, Amazon, Apple, ByteDance vagy éppen a Xiaomi is. Közülük sokan saját, nyílt forráskódú vagy vállalati megoldásokat kínálnak, és külön modelleket fejlesztenek általános, kódolási, képfeldolgozó vagy multimodális felhasználásra.

A jelenlegi LLM-mezőny tehát elképesztően széles: a szuperszonikus sebességre vagy válaszidőre optimalizált modellektől a hatalmas memóriakapacitású vagy filléres megoldásokig rengeteg lehetőség közül lehet választani. Jelentős, hogy egyre több kisebb cég, sőt, teljesen nyílt forráskódú projekt is be tud kerülni a top modellek közé, meglepően jó eredményekkel.

Összegzés: Melyik MI-t válaszd?

Ha az abszolút intelligencia számít, leginkább a Grok 4, az o3-pro vagy a Gemini 2.5 Pro lehet a befutó, de érdemes figyelni az árakat is, hiszen néhány gyorsabb, olcsóbb modell akár sokkal jobb ár-érték aránnyal működik, például a Gemma 3 4B vagy a GLM-4.5. Sebesség és késleltetés terén inkább a könnyített, optimalizált modellekre érdemes fókuszálni; nagyobb dokumentumokhoz pedig az extrém kontextusablakkal rendelkezők ajánlottak. Mindezek alapján az MI-használat jövője jóval differenciáltabb lesz: a különböző igényekre – gyorsaság, ár vagy intelligencia – mindig más modellek kínálhatják a legjobb választ.

2025, adminboss, artificialanalysis.ai alapján

  • Te milyen szempontot tartanál a legfontosabbnak, ha választanod kellene egy ilyen modell közül?
  • Mit gondolsz, jó dolog-e, hogy ilyen sokféle MI-modell létezik?
  • Te mit tennél, ha döntened kellene, hogy minőséget vagy olcsóságot választasz?


Legfrissebb posztok

APP
hétfő 09:11

APPok, Amik Ingyenesek MA, 5/25

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ContactVault Pro (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) Monthly Dystopia (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ImgRef (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) War Mongrels (iPhone/iPad) FormatX – All Media...

APP
vasárnap 09:11

APPok, Amik Ingyenesek MA, 5/24

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Inkflow Plus Visual Notebook (iPhone/iPad) FormatX – All Media Converter (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) ImgRef (iPhone/iPad) ContactVault Pro (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) Between Dates Calendar...

APP
szombat 09:11

APPok, Amik Ingyenesek MA, 5/23

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     War Mongrels (iPhone/iPad) Monthly Dystopia (iPhone/iPad) FormatX – All Media Converter (iPhone/iPad) ImgRef (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Planetary Hours + Widget (iPhone/iPad) Lively Letters – Phonics (iPhone/iPad) ContactVault...

péntek 21:55

A szendvicsmolekulák titokzatos, rejtett állapota

Az 1950-es évek óta fontos szerepet töltenek be a metallocének a fémorganikus kémia világában...

péntek 21:45

A Subnautica 2 hátborzongató lenne, ha végre csendben maradna

🦈 A Subnautica 2 bemutatja, milyen is az, amikor valaki igazán egyedül marad egy idegen világban...

péntek 21:34

A világ legősibb sziklarajza 67 800 éves? Inog a bizonyíték?

Fontos kérdés, hogy mennyire megbízhatóak azok az eredmények, amelyek szerint a világ legősibb barlangrajzainak kora akár 67 800 év...

péntek 21:22

Péntek estére gyengül a bitcoin, Warsh átveszi a Fed irányítását

📈 Ez a jelenség jól illusztrálható azzal, hogy péntek délután a kriptodevizák árfolyama csendben csúszik lefelé, miközben a tőzsdék egyelőre kitartanak...

péntek 21:12

Az Einstein–Rosen-híd felfedheti az idő rejtett tükrét

Felmerül a kérdés, hogy valóban kaput nyit-e Einstein féreglyuka az univerzum különböző pontjai között, vagy inkább egy sokkal izgalmasabb és kevésbé megfogható jelentést hordoz...

péntek 20:56

A Riot új rendszere 2 milliós papírnehezékké teszi a csaló hardvereket

A videojátékosok és a csalók közötti küzdelem új fordulatot vett. A fejlesztők eszköztára egyre bővül, de a csalók is évről évre új módszerekkel próbálkoznak...

péntek 20:23

Az elavult B12-ajánlások az agyadra is veszélyt jelenthetnek

💡 Az időskorúak egészségesnek tűnő B12-vitaminszintje mögött lappanghatnak agyi károsodások és romló gondolkodási képességek...

péntek 20:12

A fókakölykök rejtélyes halála mögött: kannibál fókák a Sable-szigeten

Évtizedeken át rejtély övezte a Sable-sziget fókakölykeit sújtó különös haláleseteket. Az Atlanti-óceán északkeleti részén, Új-Skócia partjaitól nem messze fekvő szigetről folyamatosan jelentettek elpusztult fókakölyköket, testükön hátborzongató, spirális sebekkel...

péntek 19:55

A milliárdosklubban már Messi is Beckham oldalán, Inter Miamival

Érdemes megvizsgálni, hogyan vált Lionel Messi a világ egyik legsikeresebb futballista-befektetőjévé alig három év alatt az Egyesült Államokban...

péntek 19:45

A D&B 642 milliós cégadatbázisát újraépítette az MI-ügynököknek

💻 Közel két évszázados munka eredményeként a Dun & Bradstreet (D&B) kialakított egy hatalmas, világszerte 642 millió céget lefedő üzleti adattárházat...

péntek 19:34

A foci-vb-re készülve ez az 5 tévéfunkció számít

A foci-világbajnokság közeledtével sokan döntenek úgy, hogy érdemes új, nagyobb vagy jobb minőségű tévét beszerezni...

péntek 19:23

Az IREN társalapítója: Az MI-t az infrastruktúra fogja vissza, nem a chipek

A világ MI-fejlesztési láza töretlen, ám a növekedés igazi akadálya már nem a chipek elérhetősége, hanem a fizikai infrastruktúra...

péntek 19:12

Az új Modern Warfare mindent visz: soha nem látott élmény jön

Hivatalosan is visszatér a Modern Warfare-sorozat – az Activision bejelentette, hogy a következő Call of Duty-játék egy meghatározó, új epizód lesz, amelyet az Infinity Ward fejleszt...

péntek 19:01

A nagy fordulat: a marhahús nem növeli a cukorbetegség kockázatát

Az Egyesült Államokban több mint 135 millió felnőtt szenved 2-es típusú cukorbetegségben vagy tartozik a veszélyeztetettek közé...

péntek 18:56

A Spotify új AI-ja engedélyezett, fizetett remixeket és feldolgozásokat generál

Érdemes megvizsgálni, hogy a Spotify egy olyan új eszközt fejleszt, amellyel a felhasználók mesterséges remixeket és feldolgozásokat készíthetnek kedvenc dalaikból...

péntek 18:34

A hétköznapi ételek rejtett rákkeltő vegyszerei leleplezve

Első pillantásra talán egészségesnek tűnik minden, ami a tányérodon van, hiszen figyelsz a napi mozgásra, a kalóriákra, és szívesen válogatsz zöldségekből, gyümölcsökből...

péntek 18:23

A fogyasztói bizalom rekordmélyen májusban, az iráni háború szítja az inflációs félelmeket

Májusban többéves mélypontra zuhant a fogyasztói bizalom, miközben az amerikai–iráni háború és a magas olajárak miatt egyre többen tartanak az árak újabb emelkedésétől...

péntek 16:22

Az Ark Invest négy nap alatt 12,5 millió dollárért Bullish-részvényt vett

Miközben a digitális eszközök árfolyama hetek óta hullámzik, az Ark Invest ismét kihasználta az alkalmat, hogy megerősítse pozícióját a kriptoszektorban...

péntek 16:12

A Microsoft orvosolta az eltűnő Windows 11-asztal gondját: jön a javítás

Az utóbbi hetekben sok Windows 11-felhasználó találkozott különös hibákkal: az asztal teljesen eltűnt, a tálca megfagyott, a Fájlkezelő (File Explorer) vagy a Feladatnézet (Task View) akadozott, vagy éppen egyáltalán nem válaszolt...

péntek 16:01

Az ősi kémiai trükk új üveget hoz: CO2-t és hidrogént fog be

🧠 Az üveggyártás múltjából ismert trükköt a jövő szolgálatába állították a kutatók, akik egy új típusú üveget fejlesztettek ki, amely képes megkötni a szén-dioxidot és a hidrogént...

péntek 15:56

A mesterséges intelligencia gyorsabban ontja a sérülékeny kódot, mint javítani tudnánk

A vállalatok egyre gyakrabban engednek át hibás, ismerten sebezhető kódot az éles rendszerekbe, és mára ez a hozzáállás szinte általánossá vált...

péntek 15:45

A Nereid kilóg a sorból: a James Webb kulcsa a Naprendszerhez

Neptunusz története évmilliárdokkal ezelőtt kezdődött, amikor a bolygó még épp csak kialakult a Naprendszerben...

péntek 15:34

Az MI utoléri az emberi gondolkodást? Kutatók szerint csak mintázatokat magolt.

💡 Bár a tudományos világot megrázta egy tanulmány, amely azt állította, hogy egy haladó nyelvi modell képes az emberi gondolkodás pontos szimulálására, most mindez más megvilágításba került...