2025. 08. 07., 11:51

68-as agyú MI-k, filléres géphadsereg: Megdöbbentő LLM-rangsor – Ezek most a legjobbak!

Az elmúlt időszakban robbanásszerű fejlődés indult meg a nagy nyelvi modellek (LLM-ek) terén, amelyeket olyan óriások fejlesztenek, mint a Google, az OpenAI, a DeepSeek vagy az Anthropic. Több mint 100 ilyen modell teljesítményét hasonlították össze: intelligencia, ár, sebesség, válaszadási késleltetés és memóriakapacitás (kontextusablak) alapján. Érdemes egy pillantást vetni arra, mely modellek teljesítenek a legjobban – és hol találhatók az igazi ár-érték bajnokok.

Intelligencia: Kik az MI-zsenik?

Az MI intelligencia-mutatója szerint jelenleg a Grok 4 és az o3-pro modellek uralják a mezőnyt, 68-as értékkel. Közvetlenül mögöttük a Grok o3 és az o4-mini (mindkettő szintén magas pontszámmal), valamint a Google Gemini 2.5 Pro következik. Érdemes megjegyezni, hogy a piac legdrágább modelljei között nem feltétlenül a legokosabbakat találjuk – a Grok 4 például 68-as intelligenciaszámmal 2,7 millió Ft/1M token áron kapható.

Ezzel szemben akadnak olyan modellek is, amelyek alacsonyabb áron kínálnak figyelemre méltó teljesítményt: a DeepSeek R1, a GLM-4.5 vagy éppen a Qwen3 sorozat bizonyos verziói már 420–450 Ft/1M token áron elérhetők, mégis hasonló (55–60 körüli) intelligencia-mutatót produkálnak.

Kiváló ár-érték arányt kínál a gpt-oss-20B (high) is, amely alig több mint 40 Ft/1M token áron 51 pontot ér el, bőven a középmezőny fölött.

Sebesség és válaszidő: Villámgyors MI-k

Az output sebességét tekintve toronymagasan vezet a Gemini 2.5 Flash-Lite (Érvelés / Reasoning), amely közel 500 token/másodperc tempót hoz – ez kétszerese a gpt-oss-20B (high) sebességének (386 token/másodperc), ami szintén kiemelkedő. Ezt a tempót csak néhány modell, például a Nova Micro, a GLM-4.5-Air vagy a Gemini 2.5 Flash-Lite közelíti meg.

A válaszadási késleltetés (tehát milyen gyorsan kapod az első választ) bajnokai is lenyűgöző eredményt mutatnak: az Aya Expanse 8B (0,14 mp!) és a Command-R (0,15 mp) szinte azonnal reagálnak, míg a LFM 40B és az Aya Expanse 32B is 0,16 mp körül indít. Ez alapján arra lehet következtetni, hogy a sebesség és késleltetés terén főleg a kisebb modellek, illetve a kifejezetten gyorsaságra optimalizált verziók a nyerők.

Árak: Hol a legolcsóbb a token?

Az áraknál jelentős eltérések láthatók. A legalacsonyabb ár, mindössze kb. 13 Ft/1M token, a Gemma 3 4B és a Gemma 3n E4B esetében érhető el – ráadásul egészen jó (14–18-as) intelligenciaérték mellett. Ez váratlanul jó ajánlat azoknak, akiknél a mennyiség fontosabb, mint a minőség.

Szintén meglepően olcsók a Llama 3.2 3B vagy a Mistral 3B, amelyek 15–16 Ft/1M token áron futnak, miközben egyes verzióik egész jó sebességet is hoznak. Ezzel szemben néhány, magas intelligenciájú modell, például az o3-pro vagy a Claude 4 Opus Thinking extrém drágák (akár 16 millió Ft/1M token), cserébe viszont kiemelkedő pontszámmal rendelkeznek.

Kontextusablak: Mekkora szövegre emlékszik?

A kontextusablak (memóriakapacitás) terén is vannak óriások: a Llama 4 Scout egészen elképesztő, 10 millió tokenes ablakot kezel, míg a MiniMax-Text-01 is eléri a 4 milliós határt. Az összes jelentős fejlesztő (Google Gemini, OpenAI, Mistral, Anthropic stb.) kínál már legalább 128 ezer tokenes vagy annál nagyobb memóriájú MI-t. Ez főleg azoknak kedvez, akik nagyon hosszú dokumentumokat vagy összetett feladatokat szeretnének egyben feldolgoztatni.

Kínálat: Óriási a választék – mindenki versenyben

Manapság már nemcsak az OpenAI, a Google vagy a Meta szerepel a mezőnyben: ott van a DeepSeek, Anthropic, Mistral, NVIDIA, IBM, Amazon, Apple, ByteDance vagy éppen a Xiaomi is. Közülük sokan saját, nyílt forráskódú vagy vállalati megoldásokat kínálnak, és külön modelleket fejlesztenek általános, kódolási, képfeldolgozó vagy multimodális felhasználásra.

A jelenlegi LLM-mezőny tehát elképesztően széles: a szuperszonikus sebességre vagy válaszidőre optimalizált modellektől a hatalmas memóriakapacitású vagy filléres megoldásokig rengeteg lehetőség közül lehet választani. Jelentős, hogy egyre több kisebb cég, sőt, teljesen nyílt forráskódú projekt is be tud kerülni a top modellek közé, meglepően jó eredményekkel.

Összegzés: Melyik MI-t válaszd?

Ha az abszolút intelligencia számít, leginkább a Grok 4, az o3-pro vagy a Gemini 2.5 Pro lehet a befutó, de érdemes figyelni az árakat is, hiszen néhány gyorsabb, olcsóbb modell akár sokkal jobb ár-érték aránnyal működik, például a Gemma 3 4B vagy a GLM-4.5. Sebesség és késleltetés terén inkább a könnyített, optimalizált modellekre érdemes fókuszálni; nagyobb dokumentumokhoz pedig az extrém kontextusablakkal rendelkezők ajánlottak. Mindezek alapján az MI-használat jövője jóval differenciáltabb lesz: a különböző igényekre – gyorsaság, ár vagy intelligencia – mindig más modellek kínálhatják a legjobb választ.

2025, adminboss, artificialanalysis.ai alapján

filózó

Te milyen szempontot tartanál a legfontosabbnak, ha választanod kellene egy ilyen modell közül?
Mit gondolsz, jó dolog-e, hogy ilyen sokféle MI-modell létezik?
Te mit tennél, ha döntened kellene, hogy minőséget vagy olcsóságot választasz?

Legfrissebb posztok

HistoryToday

MA 06:05

Történelmi események a mai napon (Július 10.)

Időutazás a történelembe: Julius Caesar majdnem elszenvedett macedóniai veresége, a Vichy-kormány megalakulása és a Death Valley hőmérsékleti rekordja mind ezen a napon történt...

A Google Home beállításánál sokan elakadnak, és senki sem érti, miért

Színes

MA 06:01

A Google Home beállításánál sokan elakadnak, és senki sem érti, miért

A Google új Home hangszórója igen viharosan rajtolt, hiszen hónapokkal a Pixel 10 bemutatója után, hosszas késlekedést és számos kiszivárgást követően jutott el a felhasználókhoz...

A fák növekedés után is elnyelik a szén-dioxidot

Tudomány

csütörtök 18:31

A fák növekedés után is elnyelik a szén-dioxidot

🌲 Az évszakok változása és az egyre melegebb éghajlat régi elméleteket kérdőjelez meg az erdők szénmegkötésével kapcsolatban...

Az A-vitamin új felfedezése átírja, amit a látásról hittünk

Tudomány

csütörtök 17:01

Az A-vitamin új felfedezése átírja, amit a látásról hittünk

👀 Érdemes megérteni, hogy a Johns Hopkins Egyetem kutatóinak sikerült megfejteniük, miként alakul ki az éles, központi látásunk már születésünk előtt...

A Microsoft befoltozta a Defender nulladik napi RoguePlanet-hibáját

MI Hírek

csütörtök 16:31

A Microsoft befoltozta a Defender nulladik napi RoguePlanet-hibáját

🛡 Érdemes megvizsgálni, hogy a júniusi hibajavítási hullám után egy új, napvilágot látott sebezhetőség miatt ismét frissítést kellett kiadnia a Microsoftnak...

MI Hírek

csütörtök 16:02

Az NHTSA nekimegy az önvezetőknek: útban vannak a mentőknek

🚧 Az Egyesült Államok Közlekedésbiztonsági Hivatala most ultimátumot adott az önvezető autókat fejlesztő cégeknek: július végéig találják meg a megoldást arra, hogy a sofőr nélküli járművek ne zavarják a mentőket vészhelyzetekben...

Tudomány

csütörtök 14:31

A Linux-hiba, amivel kiszökhet a vendég VM — 250 ezer dollár a Google-tól

🚨 Noha a Linux hosszú ideje az egyik legmegbízhatóbb operációs rendszerként él a köztudatban, a közelmúltban két súlyos sebezhetőség is napvilágra került, amelyek alapjaiban rengethetik meg a felhőszolgáltatók biztonságát...

Tudomány

csütörtök 12:01

Az apró szilícium-dioxid-részecskék egerekben kiirtották az agresszív prosztatarákot

🔬 A Cornell Egyetem kutatói új típusú, mikroszkopikus szilícium-dioxid nanorészecskéket fejlesztettek ki, amelyek képesek közvetlenül elpusztítani a prosztatarákos daganatokat, miközben egyidejűleg aktiválják a szervezet immunrendszerét is a rák elleni harcra...

MI Hírek

csütörtök 11:01

A Grok 4.5 már önmagában megéri az X-előfizetést?

💡 Grok 4.5 bemutatkozott, és jelentősen egyszerűsíti a bonyolult feladatok elvégzését. Kódírás, táblázatok és prezentációk készítése most egyetlen munkafolyamatba sűríthető anélkül, hogy újra és újra át kellene írni az utasításokat...

MI Hírek

csütörtök 10:49

A New Horizons felébredt: indul a küldetés a Plútón túl

321 napos alvás után újra felébredt a New Horizons űrszonda, amely már a Naprendszerünk peremén gyűjti az adatokat...

Az Einstein-jóslat beteljesült: a Föld magával sodorja a téridőt

Tudomány

csütörtök 10:36

Az Einstein-jóslat beteljesült: a Föld magával sodorja a téridőt

Több mint száz évvel Einstein elméletének megszületése után az asztrofizikusok ismét igazolták a nagy fizikus forradalmi gondolatát: a Föld valóban maga után húzza a téridőt, miközben kering a Nap körül...

A Samsung PM1763 PCIe Gen6 vállalati SSD már gyártásban

MI Hírek

csütörtök 10:24

A Samsung PM1763 PCIe Gen6 vállalati SSD már gyártásban

A Samsung bemutatta első PCIe 6.0 szabványú üzleti SSD-jét, a PM1763-at, amelyet kifejezetten MI- és nagy teljesítményű számítógépes szerverekhez fejlesztettek...

Az AirPods-gyártó Luxshare több mint 5%-ot zuhan hongkongi debütjén

Színes

csütörtök 10:01

Az AirPods-gyártó Luxshare több mint 5%-ot zuhan hongkongi debütjén

💸 A Luxshare Precision Industry tőzsdei premierje csalódást okozott Hongkongban: a részvényárfolyam több mint 5 százalékot esett csütörtök reggel, annak ellenére, hogy a városban az idei év legnagyobb elsődleges nyilvános részvénykibocsátását (IPO) bonyolította le...

Tudomány

csütörtök 09:49

A diagnosztikai rejtély: évekig hallotta a hangokat, mégsem pszichózis

Egy kanadai nő életét éveken át ismeretlen eredetű hanghallás keserítette meg...

Színes

csütörtök 09:37

A fényben is ütős OLED: Samsung vagy LG a nyerő?

A nappali központja ma már a televízió, főleg, ha nagy fényerejű helyiségben kell helytállnia...

A GPT-Live itt van: a ChatGPT végre emberien beszél

MI Hírek

csütörtök 09:25

A GPT-Live itt van: a ChatGPT végre emberien beszél

Újabb fordulóponthoz érkezett az MI-alapú hangkommunikáció: az OpenAI bemutatta a GPT-Live nevű megoldását, amely minden eddiginél természetesebb, párbeszédszerű beszélgetést tesz lehetővé a ChatGPT-vel...

Színes

csütörtök 09:13

A T‑Mobile két legjobb akcióját már nem kapják meg saját ügyfelei

Megemlíthető, hogy az utóbbi hetekben a T‑Mobile ügyfeleinek egyre több csalódással kellett szembenézniük...

APP

csütörtök 09:11

APPok, Amik Ingyenesek MA, 7/9

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Stack zero (iPhone/iPad)A Stack Zero alkalmazás beépített, Apple által támogatott dokumentum-szkennerével a papíralapú iratok digitalizálása rendkívül egyszerű és gyors...

Színes

csütörtök 08:49

Az adriai harcos herceg 2500 éves sírja szekérrel és sisakkal került elő

Egy itáliai tengerparti kisváros földje alatt bukkantak rá egy rejtélyes ókori uralkodó temetkezési helyére...

A hackerek Roundcube-hibával kémkednek az egyetemi kutatók után

Tudomány

csütörtök 08:37

A hackerek Roundcube-hibával kémkednek az egyetemi kutatók után

🔎 A legutóbbi kiberbiztonsági vizsgálatok szerint veszélybe kerültek az amerikai és kanadai egyetemek kutatói: ismeretlen támadók gyenge pontokat fedeztek fel a Roundcube-levelezőszervereken, és ezt kihasználva fizikusokat, mérnököket, adminisztrátorokat, illetve asztrofizikával, részecskefizikával vagy nemzetbiztonsággal foglalkozó intézményeket is megcéloztak...

Színes

csütörtök 08:25

A tévém lebutításával léptem meg a követést – így tedd te is

Otthon a tévézés már régen nem a magánszféráról szól. Az okostévék folyamatosan figyelik, mit nézel, majd ezt az adatot eladják más cégeknek, vagy éppen azért jelennek meg ugyanazok a hirdetések a telefonodon, a weben vagy a tévéden, amit előzőleg valamelyik online áruházban kerestél...

Színes

csütörtök 08:13

Az FTC kiharcolta: a John Deere traktorai végre szabadon javíthatók

🚜 Az elmúlt évben komoly viták dúltak arról, javíthatják-e a gazdák saját gépeiket, vagy minden apróbb hibával szerelőhöz kell-e fordulniuk...

A nagy Ozempic–Wegovy baki: ezrek a toxikológián

Tudomány

csütörtök 07:48

A nagy Ozempic–Wegovy baki: ezrek a toxikológián

🤒 Tipikus eset, amikor valami, ami elsőre kézenfekvőnek és egyszerűnek látszik, valójában jóval bonyolultabb, mint gondolnánk...

Színes

csütörtök 07:25

A foci-vb új csúcsra pörgette a Google-kereséseket

⚽ Páratlan forgalmat hozott a Google-nek a világbajnokság, minden eddigi keresési csúcsot megdöntve...

Tudomány

csütörtök 07:13

Az óceánfenék születése most tárul fel a legtisztábban

Kilométerekkel az óceán felszíne alatt a Föld tengerfenéke folyamatos mozgásban van...

Tudomány

csütörtök 07:01

A Harvard tudósai DNS-írót faragtak egy szilíciumchipből

🔬 A Harvard Egyetem kutatói forradalmasítják a biotechnológiát: egy szilíciumchip már nemcsak információt dolgoz fel, hanem képes DNS-t is létrehozni...

A heidelbergi fizikusok egyesítettek két ellentétes kvantumelméletet – történelmi áttörés

Tudomány

csütörtök 06:36

A heidelbergi fizikusok egyesítettek két ellentétes kvantumelméletet – történelmi áttörés

💡 Régóta húzódó rejtély oldódott meg a kvantumfizika világában. Egy új elméleti keretrendszer először egyesíti két, egymásnak látszólag ellentmondó modellt arról, hogy miként viselkedik egy különösen szokatlan részecske a zsúfolt kvantumkörnyezetben...

HistoryToday

csütörtök 06:06

Történelmi események a mai napon (Július 9.)

Viharos nap a történelemben: pusztító földrengés Japánban, nagyhatalmi fordulatok Európában, mérföldkő a rabszolgaság felszámolásában, és modern kori sorsfordulók Dél-Szudán függetlenné válásáig...

Az online piactereken még mindig tucatjával kínálnak veszélyes babatermékeket

Színes

csütörtök 06:01

Az online piactereken még mindig tucatjával kínálnak veszélyes babatermékeket

🛑 A brit online piactereken még mindig tucatjával bukkannak fel veszélyes babatermékek, köztük önetető eszközök, párnák és hálózsákok...