2025. 08. 07., 11:51

68-as agyú MI-k, filléres géphadsereg: Megdöbbentő LLM-rangsor – Ezek most a legjobbak!

68-as agyú MI-k, filléres géphadsereg: Megdöbbentő LLM-rangsor – Ezek most a legjobbak!
Az elmúlt időszakban robbanásszerű fejlődés indult meg a nagy nyelvi modellek (LLM-ek) terén, amelyeket olyan óriások fejlesztenek, mint a Google, az OpenAI, a DeepSeek vagy az Anthropic. Több mint 100 ilyen modell teljesítményét hasonlították össze: intelligencia, ár, sebesség, válaszadási késleltetés és memóriakapacitás (kontextusablak) alapján. Érdemes egy pillantást vetni arra, mely modellek teljesítenek a legjobban – és hol találhatók az igazi ár-érték bajnokok.

Intelligencia: Kik az MI-zsenik?

Az MI intelligencia-mutatója szerint jelenleg a Grok 4 és az o3-pro modellek uralják a mezőnyt, 68-as értékkel. Közvetlenül mögöttük a Grok o3 és az o4-mini (mindkettő szintén magas pontszámmal), valamint a Google Gemini 2.5 Pro következik. Érdemes megjegyezni, hogy a piac legdrágább modelljei között nem feltétlenül a legokosabbakat találjuk – a Grok 4 például 68-as intelligenciaszámmal 2,7 millió Ft/1M token áron kapható.

Ezzel szemben akadnak olyan modellek is, amelyek alacsonyabb áron kínálnak figyelemre méltó teljesítményt: a DeepSeek R1, a GLM-4.5 vagy éppen a Qwen3 sorozat bizonyos verziói már 420–450 Ft/1M token áron elérhetők, mégis hasonló (55–60 körüli) intelligencia-mutatót produkálnak.

Kiváló ár-érték arányt kínál a gpt-oss-20B (high) is, amely alig több mint 40 Ft/1M token áron 51 pontot ér el, bőven a középmezőny fölött.

Sebesség és válaszidő: Villámgyors MI-k

Az output sebességét tekintve toronymagasan vezet a Gemini 2.5 Flash-Lite (Érvelés / Reasoning), amely közel 500 token/másodperc tempót hoz – ez kétszerese a gpt-oss-20B (high) sebességének (386 token/másodperc), ami szintén kiemelkedő. Ezt a tempót csak néhány modell, például a Nova Micro, a GLM-4.5-Air vagy a Gemini 2.5 Flash-Lite közelíti meg.

A válaszadási késleltetés (tehát milyen gyorsan kapod az első választ) bajnokai is lenyűgöző eredményt mutatnak: az Aya Expanse 8B (0,14 mp!) és a Command-R (0,15 mp) szinte azonnal reagálnak, míg a LFM 40B és az Aya Expanse 32B is 0,16 mp körül indít. Ez alapján arra lehet következtetni, hogy a sebesség és késleltetés terén főleg a kisebb modellek, illetve a kifejezetten gyorsaságra optimalizált verziók a nyerők.

Árak: Hol a legolcsóbb a token?

Az áraknál jelentős eltérések láthatók. A legalacsonyabb ár, mindössze kb. 13 Ft/1M token, a Gemma 3 4B és a Gemma 3n E4B esetében érhető el – ráadásul egészen jó (14–18-as) intelligenciaérték mellett. Ez váratlanul jó ajánlat azoknak, akiknél a mennyiség fontosabb, mint a minőség.

Szintén meglepően olcsók a Llama 3.2 3B vagy a Mistral 3B, amelyek 15–16 Ft/1M token áron futnak, miközben egyes verzióik egész jó sebességet is hoznak. Ezzel szemben néhány, magas intelligenciájú modell, például az o3-pro vagy a Claude 4 Opus Thinking extrém drágák (akár 16 millió Ft/1M token), cserébe viszont kiemelkedő pontszámmal rendelkeznek.


Kontextusablak: Mekkora szövegre emlékszik?

A kontextusablak (memóriakapacitás) terén is vannak óriások: a Llama 4 Scout egészen elképesztő, 10 millió tokenes ablakot kezel, míg a MiniMax-Text-01 is eléri a 4 milliós határt. Az összes jelentős fejlesztő (Google Gemini, OpenAI, Mistral, Anthropic stb.) kínál már legalább 128 ezer tokenes vagy annál nagyobb memóriájú MI-t. Ez főleg azoknak kedvez, akik nagyon hosszú dokumentumokat vagy összetett feladatokat szeretnének egyben feldolgoztatni.

Kínálat: Óriási a választék – mindenki versenyben

Manapság már nemcsak az OpenAI, a Google vagy a Meta szerepel a mezőnyben: ott van a DeepSeek, Anthropic, Mistral, NVIDIA, IBM, Amazon, Apple, ByteDance vagy éppen a Xiaomi is. Közülük sokan saját, nyílt forráskódú vagy vállalati megoldásokat kínálnak, és külön modelleket fejlesztenek általános, kódolási, képfeldolgozó vagy multimodális felhasználásra.

A jelenlegi LLM-mezőny tehát elképesztően széles: a szuperszonikus sebességre vagy válaszidőre optimalizált modellektől a hatalmas memóriakapacitású vagy filléres megoldásokig rengeteg lehetőség közül lehet választani. Jelentős, hogy egyre több kisebb cég, sőt, teljesen nyílt forráskódú projekt is be tud kerülni a top modellek közé, meglepően jó eredményekkel.

Összegzés: Melyik MI-t válaszd?

Ha az abszolút intelligencia számít, leginkább a Grok 4, az o3-pro vagy a Gemini 2.5 Pro lehet a befutó, de érdemes figyelni az árakat is, hiszen néhány gyorsabb, olcsóbb modell akár sokkal jobb ár-érték aránnyal működik, például a Gemma 3 4B vagy a GLM-4.5. Sebesség és késleltetés terén inkább a könnyített, optimalizált modellekre érdemes fókuszálni; nagyobb dokumentumokhoz pedig az extrém kontextusablakkal rendelkezők ajánlottak. Mindezek alapján az MI-használat jövője jóval differenciáltabb lesz: a különböző igényekre – gyorsaság, ár vagy intelligencia – mindig más modellek kínálhatják a legjobb választ.

2025, adminboss, artificialanalysis.ai alapján

  • Te milyen szempontot tartanál a legfontosabbnak, ha választanod kellene egy ilyen modell közül?
  • Mit gondolsz, jó dolog-e, hogy ilyen sokféle MI-modell létezik?
  • Te mit tennél, ha döntened kellene, hogy minőséget vagy olcsóságot választasz?


Legfrissebb posztok

szerda 21:56

Az óriásbankok is ringbe szállnak az előrejelzési piacokon?

A pénzügyi világban új verseny bontakozik ki: a hagyományos nagybankok – a JPMorgan és a Goldman Sachs – egyre komolyabban fontolgatják, hogy belépnek az úgynevezett előrejelzési piacok területére...

szerda 21:46

Az új csodapirula, a Foundayo, felforgatja a fogyókúrapiacot

Az amerikai Élelmiszer- és Gyógyszerügyi Hivatal (FDA) engedélyezte az Eli Lilly legújabb, GLP-1 típusú, szájon át szedhető gyógyszerét, a Foundayo-t...

szerda 21:26

Az űrtoalett áttörése: kényelmi forradalom a Hold felé

🚽 2026 áprilisában négy űrhajós indul útnak a Hold felé az Artemis II-misszió keretében, és magukkal visznek egy olyan űrtoalettet, amely a szó szoros értelmében forradalmasítja az űrutazás komfortját...

szerda 20:46

Az extrém időjárás már enyhe melegedésnél is könyörtelenül csap le

🌫 Felmerül a kérdés, hogy mennyire vagyunk biztonságban, ha a globális felmelegedést sikerül mérsékelt szinten tartani...

szerda 20:23

Az udvar koronázatlan királya: a Ninja Fireside360 mindent felfűt

A tavaszi esték hűvös leheletére legtöbben gyorsan visszavonulnak a négy fal közé, amikor kint elfogy a meleg...

szerda 20:12

Az iráni hekkerek imádnak hencegni, de ritkán ütnek nagyot

Képzeld el, hogy mindenki arról beszél, mennyire menők az iráni hekkerek, miközben a valóság egészen más képet mutat...

szerda 20:02

Az okosotthonod végre nem falja fel a sávszélt

Az okos otthoni biztonsági rendszered mostantól sokkal hatékonyabb lehet: a legújabb Matter 1...

szerda 19:58

A svéd iskolák visszatérnek a tankönyvekhez: újra hódít a papír

📚 Svédországban egyre inkább háttérbe szorulnak a digitális eszközök a tantermekben: a hagyományos könyvek és a kézírás ismét előtérbe kerülnek...

szerda 19:45

A Hershey visszahozza a Reese’s eredeti ízét – végre!

🍫 Évtizedek óta rajonganak érte, de a Reese’s mogyoróvajas csészék (Reese’s Peanut Butter Cups) népszerűsége ellenére az utóbbi időben változtattak a recepten: néhány különleges alkalomra készült terméken, például a kis húsvéti tojásokon, csökkent a valódi csokoládé aránya, olcsóbb összetevőkkel helyettesítve azt...

szerda 19:35

Az átlátható DNS, ami nem kémkedik: 1.1.1.1

Nyolc évvel ezelőtt indult útjára az 1.1.1.1 nyilvános DNS-feloldó, amelynek célja nem kevesebb volt, mint a világ leggyorsabb, a magánszférát tiszteletben tartó szolgáltatásának létrehozása...

szerda 19:23

Az új Gmail MI‑postaláda tényleg csak a gazdagoké?

Felmerül a kérdés, hogy vajon tényleg mindenkinek szüksége lenne-e a Gmail vadonatúj, MI-alapú postaládájára...

szerda 19:12

Az MI nem elveszi a munkánkat, átformálja – az Nvidia-vezér tanácsai

A fehérgalléros dolgozók közül sokan aggódnak, hogy az MI miatt veszélybe kerülhetnek a munkahelyeik...

szerda 18:57

Az ügyfélszolgálati MI: jó ötlet vagy csapnivaló élmény?

Az automatizált ügyfélszolgálat egyre több vállalatnál válik normává, ám a felhasználók sokszor frusztráló élményekről számolnak be...

szerda 18:45

A leszámolás ideje: Harry herceg hadat üzen a techóriásoknak

Washingtonban mondott beszédében Harry herceg kemény hangot ütött meg a közösségi oldalak működésével kapcsolatban, amikor elismerően szólt két friss, nagy horderejű perről, amelyek főként a gyerekek védelmét érintik...

szerda 18:34

Az álmos hajnalban kezdődik a műszak: segít az új gyógyszer?

😴 A korán kezdődő munkanapok milliók mindennapjait keserítik meg, hiszen a hajnalban kezdődő műszak biológiailag kényszerű kompromisszum: az agy ilyenkor még alvásra van programozva, a teljesítmény pedig jelentősen csökken...

szerda 18:23

A SpaceX tőzsdére készül? Rakétasebességgel a billiók felé

🚀 Elon Musk újra a figyelem középpontjában: a SpaceX titokban beadta a tőzsdei bevezetéshez szükséges papírokat az Egyesült Államok Értékpapír- és Tőzsdebizottságához...

szerda 17:56

Az MI diktál, vége a menedzserek korszakának?

Jack Dorsey, a Block alapítója és vezérigazgatója szerint a vállalatok egy új működési korszak küszöbén állnak, amelyben a középvezetői réteg szerepét nagyrészt a mesterséges intelligencia veheti át...

szerda 17:34

A Google újabb kritikus, nulladik napi rést zárt be a Chrome-ban

A Google sürgősséggel adott ki frissítést a Chrome böngészőhöz, miután felfedeztek egy negyedik, ebben az évben aktívan kihasznált nulladik napi hibát...

szerda 17:25

Az Apple öt legkeményebb kihívása fél évszázad után

Ez a jelenség jól illusztrálható azzal, hogy az Apple, amely évtizedeken át forradalmasította a technológiai világot és termékeivel új szokásokat teremtett, ma saját történetének egyik legkritikusabb szakaszához érkezett...

szerda 17:13

A vízallergia réme: kiütések minden egyes zuhany után

Egy kanadai tinédzser élete teljesen felborult, amikor szinte egyik napról a másikra testét ismeretlen eredetű csalánkiütések lepték el, valahányszor víz érte a bőrét...

szerda 17:01

Az intézményi tőke rohamot indít: jön a tokenizáció hulláma

Érdemes megvizsgálni, hogy a tokenizáció, vagyis eszközök blokklánc-alapú nyilvántartása és átruházása miért vált az utóbbi évek egyik legnagyobb kriptós hívószavává...

szerda 16:46

A gyerekek sincsenek biztonságban az MI által készített YouTube-videóktól

🚧 A gyerekek elképesztő mennyiségben néznek mesterséges intelligenciával gyártott meséket és videókat a YouTube-on...

szerda 16:02

Az MI-ügynökök támadása: védtelen SOC a célkeresztben

🛡 2026 tavaszán a világ legnagyobb kiberbiztonsági konferenciáján futótűzként terjedt egy nyugtalanító felismerés: soha nem volt még ilyen rövid az ablak, amelyen keresztül a védelmezők megállíthatják a támadásokat...

szerda 15:57

Az antibiotikum-rezisztens baktériumok Achilles-sarka: áttörés született

💉 Ilyen lehet például, amikor egy szokatlan molekulára bukkanunk egy rettegett ellenség felszínén...

szerda 15:45

Az új Fitbit-edző a ciklusodra és az étrendedre is figyel

💪 A Gemini-alapú Fitbit egészségügyi edzője mostantól még több funkcióval segíti a felhasználókat...

szerda 15:34

Az Artemis II indulhat, de az időjárás közbeszólhat

A NASA továbbra is április 1-re tervezi az Artemis II küldetés indítását, és jelenleg sem az űrhajóval, sem a csapattal kapcsolatban nincs jelentős technikai probléma...

szerda 15:24

A cseh lottómilliárdos, aki befektetéseivel megelőzte a világot

🎰 Csehországot legtöbben a Škoda, a Pilsner Urquell és Václav Havel nevével kötik össze, de most felkerült a listára egy új világmárka is...

szerda 15:13

Az óceán urai: így élték túl a tintahalak a tömeges kihalást

🐬 A tintahalak és a tintahalak rokonai, vagyis a szepiák (cuttlefish), a tengerek legelképesztőbb lényei közé tartoznak...

szerda 15:02

Az igazi milliárdos történet: Steve Jobs nem az Apple-ből lett szupergazdag

Steve Jobs neve egybeforrt az Apple-lel, az iPhone‑nal, iPaddal és iMaccal, mégis egészen másból származott az a vagyon, amely később milliárdossá tette...