2025. 03. 01., 17:46

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?
Az AI-modellek szédületes tempóban jelennek meg a piacon, a Google-féle tech óriásoktól kezdve az OpenAI és Anthropic típusú startupokig mindenki új modellekkel jelentkezik. Az újdonságok követése már-már lehetetlen feladat. A helyzetet csak bonyolítja, hogy az AI-modelleket gyakran iparági teljesítménymérők alapján reklámozzák, amelyek azonban keveset árulnak el arról, hogy a valós felhasználók és vállalatok hogyan hasznosítják ezeket a gyakorlatban. A zavaros helyzet tisztázása érdekében itt egy áttekintés a 2024 óta megjelent legfejlettebb MI-modellekről, részletezve használatukat és azt, miben nyújtják a legjobb teljesítményt. Szó szerint több, mint egymillió MI-modell létezik már: például csak a Hugging Face platformon több százezer található. Így ez a lista biztosan kihagy néhány olyan modellt, amely egyik vagy másik szempontból jobban teljesít.

2025-ben megjelent MI-modellek

Az OpenAI a GPT 4.5 Orion modellt a valaha volt legokosabb AI-jukként hirdeti, kiemelve annak erős “világismeretét” és “érzelmi intelligenciáját”. Ugyanakkor bizonyos teszteken gyengébben teljesít, mint az újabb, érvelésre specializált modellek. Az Orion az OpenAI havi 200 dolláros előfizetésével érhető el.

Az Anthropic szerint a Claude Sonnet 3.7 a legjobb általános célú AI, mert képes gyors válaszokat adni, de alaposan átgondolni a dolgokat, amikor arra van szükség. A felhasználók ráadásul szabályozhatják, mennyi ideig gondolkozhat a modell. A Sonnet 3.7 minden Claude-felhasználó számára elérhető, de a gyakoribb használathoz havi 20 dolláros Pro előfizetés szükséges.

A Grok 3 az Elon Musk által alapított xAI startup legújabb modellje. Állítólag felülmúlja a többi vezető modellt matematika, tudomány és programozás területén. A modell használatához X Premium előfizetés szükséges (havi 50 dollár). Miután egy tanulmány szerint a Grok 2 inkább baloldali beállítottságú volt, Musk megígérte, hogy a Grok “politikailag semlegesebbé” válik, de még nem világos, hogy ezt sikerült-e elérni.

Az OpenAI o3-mini a cég legújabb, kisméretű modellje, amelyet STEM-kapcsolatos feladatokra, például programozásra, matematikára és tudományos problémákra optimalizáltak. Kisebb mérete miatt a cég szerint jelentősen alacsonyabb költséggel működtethető. Ingyenesen elérhető, de a nagyfelhasználóknak előfizetésre van szükségük.

Az OpenAI Deep Research képes részletes kutatást végezni egy adott témában, egyértelmű hivatkozásokkal. Ez a szolgáltatás csak a ChatGPT előfizetéses verzióival érhető el. Az OpenAI szerint a szolgáltatás a tudománytól a vásárlási kutatásokig mindenre használható, de fontos tudni, hogy a hivatkozások ellenőrzése még mindig kihívást jelent az MI számára.

A Mistral Le Chat egy multimodális AI személyi asszisztens. A Mistral Le Chat állítólag gyorsabban válaszol, mint bármely más chatbot. Van egy fizetős változata is, amely az AFP hírügynökségtől származó naprakész információkkal rendelkezik. A tesztek szerint a Le Chat teljesítménye lenyűgöző, bár több hibát vét, mint a ChatGPT.

Az OpenAI Operator egy olyan személyi asszisztens, amely képes önállóan elvégezni feladatokat, például segíteni az élelmiszer-vásárlásban. Használatához havi 200 dolláros ChatGPT Pro előfizetés szükséges. Az AI-ügynökök sok lehetőséget rejtenek, de még mindig kísérleti fázisban vannak: egy Washington Post újságírója beszámolt róla, hogy az asszisztens saját döntése alapján 31 dollárért rendelt egy tucat tojást, amit az újságíró hitelkártyájával fizetett ki.

A Google Gemini 2.0 Pro Experimental a cég szerint kiváló programozási képességekkel és általános tudással rendelkezik. 2 millió tokenes, rendkívül hosszú kontextusablaka segíti a felhasználókat, akiknek hatalmas szövegmennyiséget kell gyorsan feldolgozniuk. A szolgáltatás legalább havi 19,99 dolláros Google One AI Premium előfizetést igényel.

A DeepSeek R1 fejlesztése több mint 100 millió dollárba került. A DeepSeek R1 jól teljesít programozásban és matematikában, míg nyílt forráskódú jellege lehetővé teszi, hogy bárki lokálisan futtassa. Ingyenes, azonban a kínai kormányzati cenzúra és az a gyanú, hogy potenciálisan felhasználói adatokat küld vissza Kínába, aggályokat vet fel.

A Gemini Deep Research egyszerű és jól hivatkozott dokumentumban végez mélyreható kutatást. Hasznos diákok és bárki számára, akinek gyors kutatási összefoglalóra van szüksége. Minősége azonban közel sem olyan jó, mint egy valódi, szakértők által lektorált tanulmányé. A Deep Research használatához havi 19,99 dolláros Google One AI Premium előfizetés szükséges.

A Meta Llama 3.3 70B a Meta nyílt forráskódú Llama MI modelljeinek legújabb verziója. A Meta szerint ez a legolcsóbb és leghatékonyabb modell, különösen matematika, általános ismeretek és utasítások követése terén. Ingyenes és nyílt forráskódú.

Az OpenAI Sora egy olyan modell, amely szöveg alapján videókat generál. Bár képes teljes jeleneteket létrehozni, nemcsak rövid klipeket, sokszor “irreális fizikát” mutat. Jelenleg csak a ChatGPT fizetős verzióin érhető el, kezdve a Plus csomaggal, amely havi 20 dollárba kerül.

Az Alibaba Qwen QwQ-32B-Preview modell bizonyos iparági teszteken felülmúlja az OpenAI o1-et, kiemelkedően teljesít matematikában és programozásban. Ironikus módon, bár “érvelő modellként” hirdetik, “fejlesztésre szorul a hétköznapi érvelés terén”. Emellett tartalmazza a kínai kormány cenzúráját is. Ingyenes és nyílt forráskódú.

Az Anthropic Computer Use funkciója olyan feladatok elvégzésére szolgál, mint a programozás vagy egy repülőjegy foglalása, így az OpenAI Operator előfutárának tekinthető. A Computer Use azonban csak egyszerűbb feladatokra képes. Az árazás API-n keresztül történik: 0,80 dollár millió bemeneti tokenenként és 4 dollár millió kimeneti tokenenként.

Az x.AI Grok 2 modellje mellé Elon Musk MI cége egy képgenerátort, az Aurorát is elindította, amely “néhány grafikus vagy erőszakos tartalmat is tartalmaz”. Az ingyenes felhasználók két óránként 10 kérdésre korlátozódnak a Grok használata során, míg az X Premium és Premium+ előfizetői magasabb használati korlátokat élveznek.

Az OpenAI o1 modell kiemelkedik programozás, matematika és biztonság terén. Az o1 használatához ChatGPT Plus előfizetés szükséges, amely havi 20 dollárba kerül.

Az Anthropic Claude Sonnet 3.5 modellje az Anthropic szerint jelentős előrelépés. Programozási képességeiről vált ismertté, és a technológiai bennfentesek kedvencének számít. A modell ingyenesen elérhető a Claude-on, bár a gyakori felhasználóknak havi 20 dolláros Pro előfizetésre van szükségük. Bár képes képeket értelmezni, nem tud képeket generálni.

Az OpenAI GPT 4o-mini modellt a cég legolcsóbb és leggyorsabb modelljeként hirdetik kis méretének köszönhetően. Hogy széles körű feladatokat tegyen lehetővé, például ügyfélszolgálati chatbotok működtetését, a modell elérhető a ChatGPT ingyenes szintjén.

A Cohere Command R+ kiváló teljesítményt nyújt a vállalatok számára komplex, információkereséssel bővített generálás (RAG) alkalmazásokban. Ez azt jelenti, hogy rendkívül jól megtalálja és hivatkozza a konkrét információkat. A RAG feltalálója is elismerően nyilatkozott a modellről.

  • Mi a véleményed az AI-modellek gyors ütemű megjelenéséről a piacon, és hogyan érinti ez a felhasználókat?
  • Mit tettél volna, hogy az AI modellek fejlesztése és használata átláthatóbb és hozzáférhetőbb legyen a közönség számára?
  • Hogyan kezelnéd a technológiai fejlődés ütemét, hogy az etikai, társadalmi és gazdasági szempontok is érvényesüljenek?


Legfrissebb posztok

MA 13:48

Az új fényterápiás kütyük tényleg működnek, vagy csak felhajtás?

💡 Az elmúlt néhány évben óriásit ugrott a vörösfény-terápiás eszközök piaca: 2024-ben 158 milliárd forintot tett ki, 2025-re várhatóan 167 milliárd lesz, és 2032-re elérheti a 248 milliárdot is...

MA 13:34

Az első New Glenn sikeresen landolt, az űrséta viszont csúszik

🚀 Senki sem várta volna, hogy a Blue Origin első kereskedelmi küldetése ilyen felemásan alakul: miközben a New Glenn rakéta újrahasznosított első fokozata tökéletesen leszállt a visszatérő hajóra, a fő feladat – a kommunikációs műhold pályára állítása – kudarcba fulladt...

MA 13:23

Az AirPods kamerás verziója nagy bajban: falba ütközött a fejlesztés

Érdekes felvetés, hogy a jövőben akár kamerával felszerelt fülhallgatókat is viselhetünk, ám a legújabb kutatások szerint a technológia közel sem áll még készen ennek megvalósítására...

MA 12:35

Két perc és kész: feltörik az EU korhatár‑ellenőrző appját

🔒 Az Európai Unió nemrég bemutatta saját online életkor‑ellenőrző mobilalkalmazását, amellyel a tervek szerint a gyermekeket akarják védeni a közösségi médiától és a felnőtt tartalmaktól...

MA 12:24

Az MI-cégek mossák kezeiket – veszélyben a felhasználók?

👋 A vállalati digitalizáció korában egyre több technológiai óriás buzdít arra, hogy a biztonsági kihívásokat is MI-re bízzák...

MA 12:03

Az űr újabb blamája: félrement a Blue Origin rakétája

🚀 Érdekes felvetés, hogy mi számít valódi áttörésnek az űriparban: az újrahasznosítható rakéták, vagy inkább a küldetések hibátlan teljesítése?..

MA 11:36

Az okos futárrobotok a vakok új segítői: biztonságosabb járdák

Fontos kérdés, hogyan tehetők városaink járdái mindenki számára biztonságossá, különösen a látássérült emberek számára...

MA 11:02

Az egészség titkos kulcsa a bélmozgás ritmusa

Jellemző példa, hogy a bélmozgás sebessége – vagyis az, hogy a szervezetünk milyen gyorsan szabadul meg a salakanyagoktól – jóval többet elárulhat az egészségünkről, mint gondolnánk...

MA 10:43

A pekingi robotfélmaraton új rekordokat dönt, senki sem esik el a rajtnál

Idén Peking ismét megrendezte a humanoid robotok félmaratonját, és most valóban sikerült elkerülni a tavalyi, közröhej tárgyát képező malőröket...

MA 10:28

Az igazi vagy? A Zoom már megmondja, ember ül-e a gépnél

A Zoom mostantól egészen új szintre emeli a biztonságot: partnerséget kötött Sam Altman íriszszkennelésre épülő startupjával (korábban Worldcoin néven futott), aminek köszönhetően élőben is ellenőrizhető lesz, hogy valódi ember ül-e a cégtalálkozón, vagy valami sunyi AI-avatár próbál belépni...

MA 10:22

A Samsung legújabb frissítése forradalmasítja a fotószerkesztést

📷 A Samsung jelentős frissítést adott ki a Galaxy Enhance-X alkalmazáshoz, amely teljesen új külsőt és rengeteg friss szerkesztési funkciót hozott magával...

MA 10:11

Botrány: Az Anthropic állítólag kémprogramot telepít a Claude Desktop mellé

😱 A Claude Desktop telepítésekor az Anthropic engedély nélkül rejt el egy natív kémprogram-hidat a gépeden, amely minden Chromium-alapú böngészőt érinthet...

MA 10:01

A Nobel-díjas fizikus baljós jóslata: 50 évünk sincs hátra

David Gross, a világhírű Nobel-díjas fizikus szerint az emberiség túlélése drámaian bizonytalanná vált: jó eséllyel már csak néhány évtized van hátra civilizációnk számára...

MA 09:57

Az új KelpDAO-botrány: 110 milliárd forint tűnt el, megrendült a DeFi.

A hétvégén minden eddiginél nagyobb összeomlás rázta meg a kriptoszektort: egy ügyesen kivitelezett támadással 292 millió dollár (kb...

MA 09:37

Az amerikai streptococcusos torokgyulladás eredetét egy 700 éves múmia fedi fel

🔭 Első pillantásra úgy tűnt, hogy csak egy újabb bolíviai múmiát vizsgáltak a kutatók, ám a lelet meghökkentő felfedezést hozott...

MA 09:29

A DeFi-katasztrófa: 4800 milliárd forint olvadt el két nap alatt

💸 A decentralizált pénzügyi szektorban hatalmas mértékű tőkekivonás indult el a hétvégén történt KelpDAO-támadást követően...

MA 09:15

Az NIST ezentúl csak a legveszélyesebb hibákat pontozza

A Nemzeti Szabványügyi és Technológiai Intézet úgy döntött, felhagy az alacsonyabb prioritású sérülékenységek súlyossági pontszámainak megállapításával...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Monthly Dystopia (iPhone/iPad)A Monthly Dystopia egy túlélő játék, amelyet George Orwell 1984 című műve inspirált...

MA 08:57

Az AOC filléres hordozható monitora: mit tud 20 ezerért?

Első pillantásra úgy tűnt, hogy az AOC 16T20 egész egyszerűen a legegyszerűbb, amivel találkozhatunk ebben a kategóriában...

MA 08:43

Az AI új csapdája: úgy ránt be, mint az adathalászat

🖰 Az AI-k világában már nem csak emberek lehetnek átverés áldozatai: a mesterséges intelligenciák is csúnyán pofára eshetnek, ha valaki elég ügyesen csavarja a kérdéseket...

MA 08:29

Az egyedüllét nem okoz demenciát, de kikezdi a memóriát

💡 Az egyedüllét érzése mindannyiunkkal megesik, és ugyan természetes emberi érzelem, mégis képes alattomosan befolyásolni gondolkodásunkat, memóriánkat...

MA 08:03

A legnagyobb DeFi-hack: milliárdok tűntek el pillanatok alatt

💸 A decentralizált pénzügyi szektorban (DeFi) komoly felfordulást okozott az év eddigi legnagyobb hackje, amely során közel 108 milliárd forintnak megfelelő értékű kriptovalutát tulajdonítottak el...

MA 07:57

Az új Vercel-botrány: hackerek pénzzé teszik a lopott adatokat

Érdemes megérteni, hogy a népszerű felhőalapú fejlesztői platformot, a Vercelt jelentős biztonsági incidens érte, melynek során egyes ügyfelek adatai veszélybe kerültek...

MA 07:50

Az utolsó kilométerek: a Voyager–1 az ereje végén jár

Tipikus eset, amikor egy világraszóló felfedezőút lassan lezárul. A Voyager 1, amely 49 éve szeli az űrt, mostanra elérte élettartama határát: energiaforrása, a plutóniumalapú termoelektromos generátor évről évre körülbelül 4 wattal kevesebb teljesítményt ad le, és már nincs napelem, sem újratölthető akkumulátor, amely segítene...

MA 07:36

A Blue Origin beégett: az első újrahasznosított rakéta műholdat veszít

A Blue Origin legújabb, harmadszor repülő New Glenn rakétája megint nagyot szólt, de valahogy mégiscsak a partvonalról nézheti a diadalt: a második fokozat műszaki hibája miatt a fedélzeten lévő BlueBird 7 műhold menthetetlen pályán rekedt, vagyis el is búcsúzhatunk tőle – a biztosító viszont fizetni fog, ami azért enyhíti a csapást...

MA 07:24

Az elemek korszaka véget érhet a talajból nyert árammal?

A Northwestern Egyetem kutatói áttörést értek el a fenntartható energiaellátásban: olyan tüzelőanyagcellát fejlesztettek ki, amelynek működését a talajban élő mikroorganizmusok biztosítják...

MA 07:15

Az Apple-értesítésekkel támadnak a csalók: új adathalász trükk

🚨 Az elmúlt napokban többen kaptak olyan e-maileket, amelyek Apple-fiók módosításáról szóló hivatalos értesítésnek tűnnek, valójában azonban adathalász csalási kísérletek...

MA 07:01

Az Apple-rajongók türelmét próbára teszi a csúszó Mac Studio és MacBook Pro

Akik már tűkön ülnek az új Mac Studio vagy MacBook Pro kiadására várva, kénytelenek még pár hónapot várni...

MA 06:50

A OnePlus új mobilja tényleg kézikonzollá válik

Érdemes megvizsgálni, hogy a OnePlus hamarosan bemutatkozó Ace 6 Ultra készüléke nem egyszerűen egy csúcsmobil lesz, hanem kifejezetten játékosoknak tervezett kézi játékkonzollá is alakítható...