2025. 03. 01., 17:46

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?
Az AI-modellek szédületes tempóban jelennek meg a piacon, a Google-féle tech óriásoktól kezdve az OpenAI és Anthropic típusú startupokig mindenki új modellekkel jelentkezik. Az újdonságok követése már-már lehetetlen feladat. A helyzetet csak bonyolítja, hogy az AI-modelleket gyakran iparági teljesítménymérők alapján reklámozzák, amelyek azonban keveset árulnak el arról, hogy a valós felhasználók és vállalatok hogyan hasznosítják ezeket a gyakorlatban. A zavaros helyzet tisztázása érdekében itt egy áttekintés a 2024 óta megjelent legfejlettebb MI-modellekről, részletezve használatukat és azt, miben nyújtják a legjobb teljesítményt. Szó szerint több, mint egymillió MI-modell létezik már: például csak a Hugging Face platformon több százezer található. Így ez a lista biztosan kihagy néhány olyan modellt, amely egyik vagy másik szempontból jobban teljesít.

2025-ben megjelent MI-modellek

Az OpenAI a GPT 4.5 Orion modellt a valaha volt legokosabb AI-jukként hirdeti, kiemelve annak erős “világismeretét” és “érzelmi intelligenciáját”. Ugyanakkor bizonyos teszteken gyengébben teljesít, mint az újabb, érvelésre specializált modellek. Az Orion az OpenAI havi 200 dolláros előfizetésével érhető el.

Az Anthropic szerint a Claude Sonnet 3.7 a legjobb általános célú AI, mert képes gyors válaszokat adni, de alaposan átgondolni a dolgokat, amikor arra van szükség. A felhasználók ráadásul szabályozhatják, mennyi ideig gondolkozhat a modell. A Sonnet 3.7 minden Claude-felhasználó számára elérhető, de a gyakoribb használathoz havi 20 dolláros Pro előfizetés szükséges.

A Grok 3 az Elon Musk által alapított xAI startup legújabb modellje. Állítólag felülmúlja a többi vezető modellt matematika, tudomány és programozás területén. A modell használatához X Premium előfizetés szükséges (havi 50 dollár). Miután egy tanulmány szerint a Grok 2 inkább baloldali beállítottságú volt, Musk megígérte, hogy a Grok “politikailag semlegesebbé” válik, de még nem világos, hogy ezt sikerült-e elérni.

Az OpenAI o3-mini a cég legújabb, kisméretű modellje, amelyet STEM-kapcsolatos feladatokra, például programozásra, matematikára és tudományos problémákra optimalizáltak. Kisebb mérete miatt a cég szerint jelentősen alacsonyabb költséggel működtethető. Ingyenesen elérhető, de a nagyfelhasználóknak előfizetésre van szükségük.

Az OpenAI Deep Research képes részletes kutatást végezni egy adott témában, egyértelmű hivatkozásokkal. Ez a szolgáltatás csak a ChatGPT előfizetéses verzióival érhető el. Az OpenAI szerint a szolgáltatás a tudománytól a vásárlási kutatásokig mindenre használható, de fontos tudni, hogy a hivatkozások ellenőrzése még mindig kihívást jelent az MI számára.

A Mistral Le Chat egy multimodális AI személyi asszisztens. A Mistral Le Chat állítólag gyorsabban válaszol, mint bármely más chatbot. Van egy fizetős változata is, amely az AFP hírügynökségtől származó naprakész információkkal rendelkezik. A tesztek szerint a Le Chat teljesítménye lenyűgöző, bár több hibát vét, mint a ChatGPT.

Az OpenAI Operator egy olyan személyi asszisztens, amely képes önállóan elvégezni feladatokat, például segíteni az élelmiszer-vásárlásban. Használatához havi 200 dolláros ChatGPT Pro előfizetés szükséges. Az AI-ügynökök sok lehetőséget rejtenek, de még mindig kísérleti fázisban vannak: egy Washington Post újságírója beszámolt róla, hogy az asszisztens saját döntése alapján 31 dollárért rendelt egy tucat tojást, amit az újságíró hitelkártyájával fizetett ki.

A Google Gemini 2.0 Pro Experimental a cég szerint kiváló programozási képességekkel és általános tudással rendelkezik. 2 millió tokenes, rendkívül hosszú kontextusablaka segíti a felhasználókat, akiknek hatalmas szövegmennyiséget kell gyorsan feldolgozniuk. A szolgáltatás legalább havi 19,99 dolláros Google One AI Premium előfizetést igényel.

A DeepSeek R1 fejlesztése több mint 100 millió dollárba került. A DeepSeek R1 jól teljesít programozásban és matematikában, míg nyílt forráskódú jellege lehetővé teszi, hogy bárki lokálisan futtassa. Ingyenes, azonban a kínai kormányzati cenzúra és az a gyanú, hogy potenciálisan felhasználói adatokat küld vissza Kínába, aggályokat vet fel.

A Gemini Deep Research egyszerű és jól hivatkozott dokumentumban végez mélyreható kutatást. Hasznos diákok és bárki számára, akinek gyors kutatási összefoglalóra van szüksége. Minősége azonban közel sem olyan jó, mint egy valódi, szakértők által lektorált tanulmányé. A Deep Research használatához havi 19,99 dolláros Google One AI Premium előfizetés szükséges.

A Meta Llama 3.3 70B a Meta nyílt forráskódú Llama MI modelljeinek legújabb verziója. A Meta szerint ez a legolcsóbb és leghatékonyabb modell, különösen matematika, általános ismeretek és utasítások követése terén. Ingyenes és nyílt forráskódú.

Az OpenAI Sora egy olyan modell, amely szöveg alapján videókat generál. Bár képes teljes jeleneteket létrehozni, nemcsak rövid klipeket, sokszor “irreális fizikát” mutat. Jelenleg csak a ChatGPT fizetős verzióin érhető el, kezdve a Plus csomaggal, amely havi 20 dollárba kerül.

Az Alibaba Qwen QwQ-32B-Preview modell bizonyos iparági teszteken felülmúlja az OpenAI o1-et, kiemelkedően teljesít matematikában és programozásban. Ironikus módon, bár “érvelő modellként” hirdetik, “fejlesztésre szorul a hétköznapi érvelés terén”. Emellett tartalmazza a kínai kormány cenzúráját is. Ingyenes és nyílt forráskódú.

Az Anthropic Computer Use funkciója olyan feladatok elvégzésére szolgál, mint a programozás vagy egy repülőjegy foglalása, így az OpenAI Operator előfutárának tekinthető. A Computer Use azonban csak egyszerűbb feladatokra képes. Az árazás API-n keresztül történik: 0,80 dollár millió bemeneti tokenenként és 4 dollár millió kimeneti tokenenként.

Az x.AI Grok 2 modellje mellé Elon Musk MI cége egy képgenerátort, az Aurorát is elindította, amely “néhány grafikus vagy erőszakos tartalmat is tartalmaz”. Az ingyenes felhasználók két óránként 10 kérdésre korlátozódnak a Grok használata során, míg az X Premium és Premium+ előfizetői magasabb használati korlátokat élveznek.

Az OpenAI o1 modell kiemelkedik programozás, matematika és biztonság terén. Az o1 használatához ChatGPT Plus előfizetés szükséges, amely havi 20 dollárba kerül.

Az Anthropic Claude Sonnet 3.5 modellje az Anthropic szerint jelentős előrelépés. Programozási képességeiről vált ismertté, és a technológiai bennfentesek kedvencének számít. A modell ingyenesen elérhető a Claude-on, bár a gyakori felhasználóknak havi 20 dolláros Pro előfizetésre van szükségük. Bár képes képeket értelmezni, nem tud képeket generálni.

Az OpenAI GPT 4o-mini modellt a cég legolcsóbb és leggyorsabb modelljeként hirdetik kis méretének köszönhetően. Hogy széles körű feladatokat tegyen lehetővé, például ügyfélszolgálati chatbotok működtetését, a modell elérhető a ChatGPT ingyenes szintjén.

A Cohere Command R+ kiváló teljesítményt nyújt a vállalatok számára komplex, információkereséssel bővített generálás (RAG) alkalmazásokban. Ez azt jelenti, hogy rendkívül jól megtalálja és hivatkozza a konkrét információkat. A RAG feltalálója is elismerően nyilatkozott a modellről.

  • Mi a véleményed az AI-modellek gyors ütemű megjelenéséről a piacon, és hogyan érinti ez a felhasználókat?
  • Mit tettél volna, hogy az AI modellek fejlesztése és használata átláthatóbb és hozzáférhetőbb legyen a közönség számára?
  • Hogyan kezelnéd a technológiai fejlődés ütemét, hogy az etikai, társadalmi és gazdasági szempontok is érvényesüljenek?


Legfrissebb posztok

MA 11:31

A tenger alatti alagutaké a jövő Shetlanden: összekötnék a szigeteket

🚦 Érdemes megvizsgálni, hogy a Shetland-szigetek vezetése radikális változtatásra készül a közlekedésben: egy 1,5 milliárd angol font (650 milliárd forint) értékű terv szerint az elöregedő kompokat víz alatti alagutak válthatják fel a következő nyolc éven belül...

MA 10:50

Az MI-láz: száguldó milliárdok, közeleg a következő válság?

A 19. század csatornaépítési és vasúti láza, a dotkom-lufi 2000-ből – mind gazdaságtörténeti példák arra, hogy valódi technológiai áttörések túlfűtött beruházási hullámokat indíthatnak el, amelyek végül recesszióval végződhetnek...

MA 10:24

Az IBM rekordja: közel 100 milliárd tranzisztor egyetlen chipen

Az IBM újabb mérföldkőhöz érkezett a chiptechnológia világában: bemutatta a világ első, 1 nanométernél kisebb csíkszélességű technológiáját, mellyel egy körömnyi lapkán közel 100 milliárd tranzisztor kap helyet...

MA 10:01

A milliónyi robbanó csillag hamarosan felfedheti a sötét energia titkát

💫 Az Univerzum tágulásának részletesebb vizsgálata és a titokzatos sötét energia megértése közelebb kerülhet, hála egy barcelonai kutatócsoport forradalmi megközelítésének...

MA 09:49

Az emberiség túlélheti – a Föld megúszhatja a Nap halálát

Ez a jelenség jól illusztrálható azzal, hogy a Nap közel ötmilliárd év múlva lenyűgöző változáson megy keresztül: kifogy a hidrogén üzemanyagából, vörös óriássá duzzad, majd még nagyobb méretet öltve aszimptotikus óriáság állapotba lép, végül fehér törpévé zsugorodik...

MA 09:37

A fiatalokat sújtó rákhullám mögött a gyorsabb biológiai öregedés áll?

Az elmúlt években egyre többen néznek szembe azzal, hogy már 50 éves koruk előtt súlyos betegségekkel, például mell-, vastagbél-, vese- vagy méhrákkal diagnosztizálják őket...

MA 09:24

A Gemini már a személyes fotóidból is képeket varázsol

📷 A Google egyre többet tud rólunk, mostantól pedig a Gemini alkalmazáson keresztül már a személyes fotóink felhasználásával is egyedi képeket készít...

MA 09:13

A Nissan elismerte: dolgozói adatai Oracle zero-day támadásban szivárogtak

Külön említést érdemel, hogy a Nissan jelenlegi és volt alkalmazottainak személyes adatai kerültek veszélybe egy kifinomult kibertámadássorozat során...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/30

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Lively Letters – Phonics (iPhone/iPad)Ez az alkalmazás villámgyorsan az App Store fizetős oktatási programjai élére tört...

MA 09:01

A Disney és az Adobe Foundry AI-val álmodja újra a vidámparkokat

A Disney és az Adobe összefog, hogy teljesen új korszakot nyisson a szórakoztatóiparban: közösen tervezik a jövő tematikus parkjait, szállodáit és hajóútjait egy testreszabott MI-megoldás segítségével...

MA 08:49

A NAIC csillapít: csak nyilvános PeopleSoft-adat a ShinyHuntersnél

Érdemes megérteni, hogy a National Association of Insurance Commissioners (NAIC) nagyszabású kibertámadás áldozata lett, miután egy Oracle PeopleSoft-szervert érintő, nulladik napi (zero-day) sebezhetőséget kihasználó támadás révén a ShinyHunters nevű csoport hozzáférést szerzett a szervezet rendszereihez...

MA 08:37

Az ausztrál versenyhatóság perre viszi az Amazont a tisztességtelen Prime-feltételek miatt

Jó példa erre, hogy Ausztrália versenyhivatala, az ACCC pert indított az Amazon helyi részlege ellen, miután a cég a Prime-előfizetések feltételeit állítólag egyoldalúan, a fogyasztók kárára módosította...

MA 08:25

Az utolsó esély: a NASA példátlan küldetésre készül a haldokló űrtávcsőért

🚀 A világűr egyik legmegbízhatóbb teleszkópja, a Swift, napjai meg vannak számlálva...

MA 08:12

A kutatók szerepmodell-trükkel csalták ki az MI-ből kokainrecepteket

A fejlett szövegértelmező rendszerek, mint a modern nagy nyelvi modellek, újfajta támadásokkal néznek szembe...

MA 08:01

Az MI csődöt mondott, a Ford visszahívta a rutinos mérnököket

🚗 A Fordnál a minőségi problémák tartós fennállása miatt vezetői szinten beismerték: a mesterséges intelligencia önmagában nem jelentett megoldást a hibákra...

MA 07:49

Az MI leleplezve: a Tidal címkézi és törli a csaló zenéket

A zenehallgatás új korszakába lép a Tidal: hamarosan egy jól látható „MI” ikon jelenik meg azoknál a zeneszámoknál, amelyeket kizárólag mesterséges intelligencia hozott létre...

MA 07:37

Az áttörés küszöbén: önmegsemmisítésre bírhatók a hasnyálmirigyráksejtek

Ebből következően érdemes megérteni, hogy a hasnyálmirigyrák továbbra is az egyik legnehezebben kezelhető daganatos betegség, főként a KRAS-mutációk gyakori jelenléte miatt...

MA 07:25

A Kobo legjobb, Kindle-verő funkciója mostantól elérhető

📚 A Kobo végre elindította régóta várt újítását: mostantól automatikusan szinkronizálhatod az olvasási előrehaladásodat, aktuális olvasmányaidat és befejezett könyveidet a StoryGraph szolgáltatással...

MA 07:01

A Sony törli a filmeket: tényleg nem a miénk, amit veszünk?

📦 Szeptember 1-jétől a brit PlayStation-felhasználók 551, korábban megvásárolt filmhez és sorozathoz többé nem férnek hozzá, mert a Sony törli őket a PlayStation Store kínálatából...

MA 06:25

A WhatsApp bevezeti a felhasználóneveket: búcsú a látható számoktól

👋 A WhatsApp újdonsága, hogy mostantól lehetőség van egyedi felhasználónév lefoglalására, amivel végre könnyedén elrejtheted a telefonszámodat olyanok elől, akik nincsenek a névjegyzékedben...

MA 06:06

Történelmi események a mai napon (Június 30.)

Időutazás egyetlen napon: a német hatalmi leszámolástól a hongkongi szuverenitás-átadásig, az első 999-es segélyhívótól Yosemite völgyének megóvásáig...

MA 06:01

A WhatsApp felhasználóneveket vezet be: búcsú a telefonszámoktól?

👋 A WhatsApp hamarosan lehetővé teszi, hogy felhasználónevekkel kommunikálj, így nem kell megosztanod a telefonszámodat sem vállalkozásokkal, sem ismeretlenekkel...

hétfő 18:31

A MiCA-határidő tízmillió kriptósnak vághatja el a hozzáférést az EU-ban

Július 1-jén életbe lépnek az Európai Unió Kriptoeszközök piacáról szóló rendeletének (Markets in Crypto-Assets, MiCA) szabályai, amelyek teljesen átalakítják a kriptopénzpiacot...

hétfő 18:01

Az európai hőrekord térdre kényszerítette a párizsi halottasházakat, családok szenvednek

Párizsban szinte percenként csörren meg Zouhaeir Hertelli, egy helyi halottasház vezetőjének telefonja...

hétfő 17:31

A SpaceX 25 milliárd dolláros kötvénykibocsátása rekordkeresletet hoz, de fejfájást okozhat

🚀 A Wall Street az utóbbi napokban a SpaceX-re figyelt, miután a cég minden képzeletet felülmúló, 9000 milliárd forint (25 milliárd dollár) értékben adott el kötvényeket...

hétfő 17:01

Az antarktiszi apróság lehet a melanóma elleni áttörés kulcsa?

A floridai Dél-Floridai Egyetem kutatói egy hathetes antarktiszi expedícióról nem mindennapi felfedezéssel tértek haza: úgy találták, hogy egy apró tengeri élőlény, az aszcídia által termelt bakteriális toxin hatékony fegyver lehet a melanóma, vagyis a legveszélyesebb bőrrák ellen...

hétfő 10:48

A BitMEX kirúgta a vezérigazgatót, a pénzügyi igazgatót és a növekedési vezetőt

🚀 Érdemes megvizsgálni, hogyan próbál túlélni a BitMEX kriptotőzsde egy újabb válságot, ugyanis a cég szinte teljes vezetősége egyszerre távozott...

hétfő 10:38

A Flock-kamerák nem csak rendszámot látnak – villámgyorsan terjednek

🚗 Érdemes megvizsgálni, hogy az utóbbi években mennyire észrevétlenül váltak mindennapjaink részévé a modern megfigyelőrendszerek...

hétfő 10:26

Az amerikai álom haldoklik: az örökölt házak országa lett Amerika?

Nehéz elhinni, de a lakásvásárlás valaha magától értetődő lehetőségnek számított az Egyesült Államokban...