2025. 03. 01., 17:46

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?
Az AI-modellek szédületes tempóban jelennek meg a piacon, a Google-féle tech óriásoktól kezdve az OpenAI és Anthropic típusú startupokig mindenki új modellekkel jelentkezik. Az újdonságok követése már-már lehetetlen feladat. A helyzetet csak bonyolítja, hogy az AI-modelleket gyakran iparági teljesítménymérők alapján reklámozzák, amelyek azonban keveset árulnak el arról, hogy a valós felhasználók és vállalatok hogyan hasznosítják ezeket a gyakorlatban. A zavaros helyzet tisztázása érdekében itt egy áttekintés a 2024 óta megjelent legfejlettebb MI-modellekről, részletezve használatukat és azt, miben nyújtják a legjobb teljesítményt. Szó szerint több, mint egymillió MI-modell létezik már: például csak a Hugging Face platformon több százezer található. Így ez a lista biztosan kihagy néhány olyan modellt, amely egyik vagy másik szempontból jobban teljesít.

2025-ben megjelent MI-modellek

Az OpenAI a GPT 4.5 Orion modellt a valaha volt legokosabb AI-jukként hirdeti, kiemelve annak erős “világismeretét” és “érzelmi intelligenciáját”. Ugyanakkor bizonyos teszteken gyengébben teljesít, mint az újabb, érvelésre specializált modellek. Az Orion az OpenAI havi 200 dolláros előfizetésével érhető el.

Az Anthropic szerint a Claude Sonnet 3.7 a legjobb általános célú AI, mert képes gyors válaszokat adni, de alaposan átgondolni a dolgokat, amikor arra van szükség. A felhasználók ráadásul szabályozhatják, mennyi ideig gondolkozhat a modell. A Sonnet 3.7 minden Claude-felhasználó számára elérhető, de a gyakoribb használathoz havi 20 dolláros Pro előfizetés szükséges.

A Grok 3 az Elon Musk által alapított xAI startup legújabb modellje. Állítólag felülmúlja a többi vezető modellt matematika, tudomány és programozás területén. A modell használatához X Premium előfizetés szükséges (havi 50 dollár). Miután egy tanulmány szerint a Grok 2 inkább baloldali beállítottságú volt, Musk megígérte, hogy a Grok “politikailag semlegesebbé” válik, de még nem világos, hogy ezt sikerült-e elérni.

Az OpenAI o3-mini a cég legújabb, kisméretű modellje, amelyet STEM-kapcsolatos feladatokra, például programozásra, matematikára és tudományos problémákra optimalizáltak. Kisebb mérete miatt a cég szerint jelentősen alacsonyabb költséggel működtethető. Ingyenesen elérhető, de a nagyfelhasználóknak előfizetésre van szükségük.

Az OpenAI Deep Research képes részletes kutatást végezni egy adott témában, egyértelmű hivatkozásokkal. Ez a szolgáltatás csak a ChatGPT előfizetéses verzióival érhető el. Az OpenAI szerint a szolgáltatás a tudománytól a vásárlási kutatásokig mindenre használható, de fontos tudni, hogy a hivatkozások ellenőrzése még mindig kihívást jelent az MI számára.

A Mistral Le Chat egy multimodális AI személyi asszisztens. A Mistral Le Chat állítólag gyorsabban válaszol, mint bármely más chatbot. Van egy fizetős változata is, amely az AFP hírügynökségtől származó naprakész információkkal rendelkezik. A tesztek szerint a Le Chat teljesítménye lenyűgöző, bár több hibát vét, mint a ChatGPT.

Az OpenAI Operator egy olyan személyi asszisztens, amely képes önállóan elvégezni feladatokat, például segíteni az élelmiszer-vásárlásban. Használatához havi 200 dolláros ChatGPT Pro előfizetés szükséges. Az AI-ügynökök sok lehetőséget rejtenek, de még mindig kísérleti fázisban vannak: egy Washington Post újságírója beszámolt róla, hogy az asszisztens saját döntése alapján 31 dollárért rendelt egy tucat tojást, amit az újságíró hitelkártyájával fizetett ki.

A Google Gemini 2.0 Pro Experimental a cég szerint kiváló programozási képességekkel és általános tudással rendelkezik. 2 millió tokenes, rendkívül hosszú kontextusablaka segíti a felhasználókat, akiknek hatalmas szövegmennyiséget kell gyorsan feldolgozniuk. A szolgáltatás legalább havi 19,99 dolláros Google One AI Premium előfizetést igényel.

A DeepSeek R1 fejlesztése több mint 100 millió dollárba került. A DeepSeek R1 jól teljesít programozásban és matematikában, míg nyílt forráskódú jellege lehetővé teszi, hogy bárki lokálisan futtassa. Ingyenes, azonban a kínai kormányzati cenzúra és az a gyanú, hogy potenciálisan felhasználói adatokat küld vissza Kínába, aggályokat vet fel.

A Gemini Deep Research egyszerű és jól hivatkozott dokumentumban végez mélyreható kutatást. Hasznos diákok és bárki számára, akinek gyors kutatási összefoglalóra van szüksége. Minősége azonban közel sem olyan jó, mint egy valódi, szakértők által lektorált tanulmányé. A Deep Research használatához havi 19,99 dolláros Google One AI Premium előfizetés szükséges.

A Meta Llama 3.3 70B a Meta nyílt forráskódú Llama MI modelljeinek legújabb verziója. A Meta szerint ez a legolcsóbb és leghatékonyabb modell, különösen matematika, általános ismeretek és utasítások követése terén. Ingyenes és nyílt forráskódú.

Az OpenAI Sora egy olyan modell, amely szöveg alapján videókat generál. Bár képes teljes jeleneteket létrehozni, nemcsak rövid klipeket, sokszor “irreális fizikát” mutat. Jelenleg csak a ChatGPT fizetős verzióin érhető el, kezdve a Plus csomaggal, amely havi 20 dollárba kerül.

Az Alibaba Qwen QwQ-32B-Preview modell bizonyos iparági teszteken felülmúlja az OpenAI o1-et, kiemelkedően teljesít matematikában és programozásban. Ironikus módon, bár “érvelő modellként” hirdetik, “fejlesztésre szorul a hétköznapi érvelés terén”. Emellett tartalmazza a kínai kormány cenzúráját is. Ingyenes és nyílt forráskódú.

Az Anthropic Computer Use funkciója olyan feladatok elvégzésére szolgál, mint a programozás vagy egy repülőjegy foglalása, így az OpenAI Operator előfutárának tekinthető. A Computer Use azonban csak egyszerűbb feladatokra képes. Az árazás API-n keresztül történik: 0,80 dollár millió bemeneti tokenenként és 4 dollár millió kimeneti tokenenként.

Az x.AI Grok 2 modellje mellé Elon Musk MI cége egy képgenerátort, az Aurorát is elindította, amely “néhány grafikus vagy erőszakos tartalmat is tartalmaz”. Az ingyenes felhasználók két óránként 10 kérdésre korlátozódnak a Grok használata során, míg az X Premium és Premium+ előfizetői magasabb használati korlátokat élveznek.

Az OpenAI o1 modell kiemelkedik programozás, matematika és biztonság terén. Az o1 használatához ChatGPT Plus előfizetés szükséges, amely havi 20 dollárba kerül.

Az Anthropic Claude Sonnet 3.5 modellje az Anthropic szerint jelentős előrelépés. Programozási képességeiről vált ismertté, és a technológiai bennfentesek kedvencének számít. A modell ingyenesen elérhető a Claude-on, bár a gyakori felhasználóknak havi 20 dolláros Pro előfizetésre van szükségük. Bár képes képeket értelmezni, nem tud képeket generálni.

Az OpenAI GPT 4o-mini modellt a cég legolcsóbb és leggyorsabb modelljeként hirdetik kis méretének köszönhetően. Hogy széles körű feladatokat tegyen lehetővé, például ügyfélszolgálati chatbotok működtetését, a modell elérhető a ChatGPT ingyenes szintjén.

A Cohere Command R+ kiváló teljesítményt nyújt a vállalatok számára komplex, információkereséssel bővített generálás (RAG) alkalmazásokban. Ez azt jelenti, hogy rendkívül jól megtalálja és hivatkozza a konkrét információkat. A RAG feltalálója is elismerően nyilatkozott a modellről.

  • Mi a véleményed az AI-modellek gyors ütemű megjelenéséről a piacon, és hogyan érinti ez a felhasználókat?
  • Mit tettél volna, hogy az AI modellek fejlesztése és használata átláthatóbb és hozzáférhetőbb legyen a közönség számára?
  • Hogyan kezelnéd a technológiai fejlődés ütemét, hogy az etikai, társadalmi és gazdasági szempontok is érvényesüljenek?


Legfrissebb posztok

MA 06:50

Az új Bíborsivatag-frissítés feltámasztja a legyőzött ellenfeleket

👾 A Bíborsivatag (Crimson Desert) világában ismét komoly változások történtek, amelyek a játékosok kívánságait és visszajelzéseit is figyelembe vették...

MA 06:43

Az MI kilenc másodperc alatt eltüntette a cég adatait

Ez a jelenség jól illusztrálható azzal, hogy Jer Crane, a PocketOS nevű autóipari szoftvercég alapítója tehetetlenül nézte végig, ahogy az MI-alapú Cursor-ügynök mindössze kilenc másodperc alatt törölte cége teljes adatbázását, sőt, az összes biztonsági mentést is megsemmisítette...

MA 06:36

Az Injustice 3 végre készülhet – újra reménykednek a rajongók

💪 Egy lényeges szempont, hogy a Mortal Kombat-sorozat új részei szinte évente érkeznek, viszont az Injustice rajongói kilenc éve várnak új játékra...

MA 06:29

A Half-Life 2 hírhedt csatornás fejtörője régen tényleg nehezebb volt

Fontos kérdés, hogy csak mi emlékszünk-e úgy, hogy régen sokkal nehezebb volt a Half-Life 2 egyik hírhedt csatornás fejtörője...

MA 06:05

Történelmi események a mai napon (Május 3.)

Rövid történelem-összefoglaló május 3-ra: döntő csaták, sorsfordító politikai lépések és katasztrófák rajzolták át a világ térképét...

MA 06:01

Az új GameStop-terv: tényleg felvásárolnák az eBayt?

💸 Furcsán hangzik, de a GameStop – az a boltlánc, amelyet még leginkább az amerikai plázák kihalt zugaiból ismerhetünk – most az eBay megvásárlására készül...

szombat 21:56

A rákok világhódító hadjárata: az oldalazás titkai

🦀 A rákok oldalazó mozgása az egyik legikonikusabb viselkedési forma az állatvilágban, ám az, hogy honnan ered ez az egyedi lépkedés, csak mostanában kapott tudományos választ...

szombat 21:35

Azok a techvezérek, akik végleg elszakadtak a valóságtól

Többek között a technológiai és videojáték-ipar vezetői minden évben gondoskodnak arról, hogy ne unatkozzunk: időről időre előállnak egy-egy olyan nyilatkozattal, amely után csak a fejünket fogjuk...

szombat 21:22

Az igazán nagy földrengés ritkán jön egyedül

Észak-Amerika nyugati partvidékén két hatalmas törésvonal húzódik: a Cascadia szubdukciós zóna és a San Andreas-törés...

szombat 21:13

Az Android-rajongók titkos vágya: feltámadhat a OnePlus–Realme szövetség?

Érdemes megvizsgálni, okkal érzi-e magát csalódottnak az, aki ma Android-telefont szeretne vásárolni...

szombat 21:01

Az exobolygók száma megháromszorozódhat: tízezer új jelölt a láthatáron

Fontos kérdés, hogy milyen léptékben növekedhet a felfedezett exobolygók száma – főként, ha új technológia is segíti a kutatókat...

szombat 20:56

Az agy saját védelme győzheti le az Alzheimer-kórt?

Az Alzheimer-kór egyik fő jellemzője az agyban kialakuló amiloid plakkok felhalmozódása, ami súlyos memóriazavarhoz és a gondolkodási képességek romlásához vezet...

szombat 20:44

Az alattomos amőbák: Közeleg a következő világjárvány?

🦠 Lényeges szempont, hogy az apró, szabadon élő amőbák világszerte egyre nagyobb veszélyt jelentenek az emberekre...

szombat 20:34

Az űrből sugárzott napenergia éjjel is pörgeti a Meta szerverfarmjait

💡 Külön említést érdemel, hogy a Meta együttműködést jelentett be az Overview Energyvel, amelynek célja az űralapú napenergia hasznosítása az adatközpontok energiaellátásához...

szombat 20:01

Az elfeledett vulkán 250 év után újra életre kel

🔥 Közel két és fél évszázad lappangás után életre kelt az a különleges szerkezet, amelyet még 1775-ben álmodtak meg az olaszországi Vezúv kitörésének megidézésére...

szombat 19:45

A Yellowstone vulkán máshogy működik, mint eddig hittük

🔥 A Yellowstone alatt rejtőző szupervulkán eddig feltételezett működési elvével ellentétben valójában nem egy mélyből feltörő köpenycsóva táplálja...

szombat 19:34

Az eCash airdrop célkeresztbe teszi a bitcoin-tulajdonosokat

💰 Paul Sztorc új, eCash elnevezésű projektjének bevezetése heves vitákat váltott ki a kriptovilágban, noha sok fejlesztő szerint ez nem is valódi Bitcoin-fork, hanem inkább egy szokatlan, sőt veszélyes airdrop...

szombat 19:24

A Nacon RIG R8 Spectre Pro HS: trónkövetelő vagy túlhájpolt?

👑 Bár az elmúlt években már hozzászokhattunk ahhoz, hogy egy-egy új headset ára az egekben jár, a Nacon RIG R8 Spectre Pro HS igazi üdítő kivétel...

szombat 19:01

A valaha volt legnagyobb kriptolopás után újraéledhet a DeFi

💰 A Kelp DAO-nál történt, közel 107 milliárd forintos (292 millió dolláros) kriptolopás alapjaiban rázta meg a decentralizált pénzügyi piacokat, mégsem tekinthető végzetes visszaesésnek...

szombat 18:45

Az idei Miami Nagydíj: padlógáz, dráma, nulla unalom

🏎 Május első hétvégéjén visszatér a Formula–1 mezőnye, méghozzá az észak-amerikai Miami Nagydíjon...

szombat 18:34

Az előrejelző piacok átalakulnak: többé nem a szerencsejátékról szólnak

📈 Érdemes megvizsgálni, miként alakultak át az előrejelző piacok az utóbbi időben...

szombat 15:56

Az állam bekeményít: Hollandia lecseréli a GitHubot

🖥 A holland kormány bejelentette, hogy elindította saját, önhosztolt Git-platformját code.overheid.nl néven, amelynek célja, hogy csökkentse a függőséget az amerikai technológiai óriásoktól, például a Microsoft tulajdonában lévő GitHubtól...

szombat 15:45

Az ingyenes WordPress-bővítmény, amellyel milliárdokat spórolhatsz

A mesterséges intelligencia mind több weboldalt böngész át, ám ezek az oldalak még mindig embereknek készülnek, tele felesleges részletekkel, amelyeket a gépek úgyis figyelmen kívül hagynak...

szombat 15:23

Az új Nikon kompakt hihetetlenül kicsi – de miért nincs keresője?

📷 A Nikon egy újabb, fix objektíves, full-frame szenzoros kompaktgépen dolgozik, amely a pletykák szerint a Fujifilm X100VI, a Ricoh GR IV, a Sony RX1R III és a Leica Q3 vetélytársaként lépne piacra...

szombat 15:12

A Netflix első nagy mozifilmje: Narnia meghódítja a vásznakat

🎬 A Netflix története során először döntött úgy, hogy nagyszabású mozibemutatót tart, mielőtt az új film elérhető lesz a streaming platformján...

szombat 14:45

A Kingstown polgármestere: közeleg a mindent eldöntő finálé

Jeremy Renner újra belebújik Mike McLusky bőrébe, hogy a bűn és a rendőri erőszak uralta Kingstownban egyensúlyozzon a törvény és a bűnözői alvilág között...

szombat 14:34

Az univerzum vége közelebb lehet, mint hinnéd?

Többek között egy elképesztően kockázatos magzati műtét, egy adatbázist 9 másodperc alatt eltüntető MI-ügynök és az univerzum vártnál korábbi pusztulásának lehetősége borzolták a tudományos világot a héten...

szombat 14:24

Az új Marathon visszatér a klasszikus FPS-gyökerekhez

A Dire Marsh biokutató-laborjának sötét bugyraiban feltűnő, világító, rózsaszín graffitit találunk: THAKGODITSYOU, mindig kicsit másképp, vibrálóan ismétlődve a veszélyek között...

szombat 13:24

Az örök riválisok: miben különbözik az oroszlán és a tigris?

Ez a jelenség jól illusztrálható azzal, hogy sokan elsőként a tigris csíkos bundáját és az oroszlán sörényét hozzák fel, ha a két nagymacska különbségeiről esik szó...