2025. 03. 01., 17:46

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?
Az AI-modellek szédületes tempóban jelennek meg a piacon, a Google-féle tech óriásoktól kezdve az OpenAI és Anthropic típusú startupokig mindenki új modellekkel jelentkezik. Az újdonságok követése már-már lehetetlen feladat. A helyzetet csak bonyolítja, hogy az AI-modelleket gyakran iparági teljesítménymérők alapján reklámozzák, amelyek azonban keveset árulnak el arról, hogy a valós felhasználók és vállalatok hogyan hasznosítják ezeket a gyakorlatban. A zavaros helyzet tisztázása érdekében itt egy áttekintés a 2024 óta megjelent legfejlettebb MI-modellekről, részletezve használatukat és azt, miben nyújtják a legjobb teljesítményt. Szó szerint több, mint egymillió MI-modell létezik már: például csak a Hugging Face platformon több százezer található. Így ez a lista biztosan kihagy néhány olyan modellt, amely egyik vagy másik szempontból jobban teljesít.

2025-ben megjelent MI-modellek

Az OpenAI a GPT 4.5 Orion modellt a valaha volt legokosabb AI-jukként hirdeti, kiemelve annak erős “világismeretét” és “érzelmi intelligenciáját”. Ugyanakkor bizonyos teszteken gyengébben teljesít, mint az újabb, érvelésre specializált modellek. Az Orion az OpenAI havi 200 dolláros előfizetésével érhető el.

Az Anthropic szerint a Claude Sonnet 3.7 a legjobb általános célú AI, mert képes gyors válaszokat adni, de alaposan átgondolni a dolgokat, amikor arra van szükség. A felhasználók ráadásul szabályozhatják, mennyi ideig gondolkozhat a modell. A Sonnet 3.7 minden Claude-felhasználó számára elérhető, de a gyakoribb használathoz havi 20 dolláros Pro előfizetés szükséges.

A Grok 3 az Elon Musk által alapított xAI startup legújabb modellje. Állítólag felülmúlja a többi vezető modellt matematika, tudomány és programozás területén. A modell használatához X Premium előfizetés szükséges (havi 50 dollár). Miután egy tanulmány szerint a Grok 2 inkább baloldali beállítottságú volt, Musk megígérte, hogy a Grok “politikailag semlegesebbé” válik, de még nem világos, hogy ezt sikerült-e elérni.

Az OpenAI o3-mini a cég legújabb, kisméretű modellje, amelyet STEM-kapcsolatos feladatokra, például programozásra, matematikára és tudományos problémákra optimalizáltak. Kisebb mérete miatt a cég szerint jelentősen alacsonyabb költséggel működtethető. Ingyenesen elérhető, de a nagyfelhasználóknak előfizetésre van szükségük.

Az OpenAI Deep Research képes részletes kutatást végezni egy adott témában, egyértelmű hivatkozásokkal. Ez a szolgáltatás csak a ChatGPT előfizetéses verzióival érhető el. Az OpenAI szerint a szolgáltatás a tudománytól a vásárlási kutatásokig mindenre használható, de fontos tudni, hogy a hivatkozások ellenőrzése még mindig kihívást jelent az MI számára.

A Mistral Le Chat egy multimodális AI személyi asszisztens. A Mistral Le Chat állítólag gyorsabban válaszol, mint bármely más chatbot. Van egy fizetős változata is, amely az AFP hírügynökségtől származó naprakész információkkal rendelkezik. A tesztek szerint a Le Chat teljesítménye lenyűgöző, bár több hibát vét, mint a ChatGPT.

Az OpenAI Operator egy olyan személyi asszisztens, amely képes önállóan elvégezni feladatokat, például segíteni az élelmiszer-vásárlásban. Használatához havi 200 dolláros ChatGPT Pro előfizetés szükséges. Az AI-ügynökök sok lehetőséget rejtenek, de még mindig kísérleti fázisban vannak: egy Washington Post újságírója beszámolt róla, hogy az asszisztens saját döntése alapján 31 dollárért rendelt egy tucat tojást, amit az újságíró hitelkártyájával fizetett ki.

A Google Gemini 2.0 Pro Experimental a cég szerint kiváló programozási képességekkel és általános tudással rendelkezik. 2 millió tokenes, rendkívül hosszú kontextusablaka segíti a felhasználókat, akiknek hatalmas szövegmennyiséget kell gyorsan feldolgozniuk. A szolgáltatás legalább havi 19,99 dolláros Google One AI Premium előfizetést igényel.

A DeepSeek R1 fejlesztése több mint 100 millió dollárba került. A DeepSeek R1 jól teljesít programozásban és matematikában, míg nyílt forráskódú jellege lehetővé teszi, hogy bárki lokálisan futtassa. Ingyenes, azonban a kínai kormányzati cenzúra és az a gyanú, hogy potenciálisan felhasználói adatokat küld vissza Kínába, aggályokat vet fel.

A Gemini Deep Research egyszerű és jól hivatkozott dokumentumban végez mélyreható kutatást. Hasznos diákok és bárki számára, akinek gyors kutatási összefoglalóra van szüksége. Minősége azonban közel sem olyan jó, mint egy valódi, szakértők által lektorált tanulmányé. A Deep Research használatához havi 19,99 dolláros Google One AI Premium előfizetés szükséges.

A Meta Llama 3.3 70B a Meta nyílt forráskódú Llama MI modelljeinek legújabb verziója. A Meta szerint ez a legolcsóbb és leghatékonyabb modell, különösen matematika, általános ismeretek és utasítások követése terén. Ingyenes és nyílt forráskódú.

Az OpenAI Sora egy olyan modell, amely szöveg alapján videókat generál. Bár képes teljes jeleneteket létrehozni, nemcsak rövid klipeket, sokszor “irreális fizikát” mutat. Jelenleg csak a ChatGPT fizetős verzióin érhető el, kezdve a Plus csomaggal, amely havi 20 dollárba kerül.

Az Alibaba Qwen QwQ-32B-Preview modell bizonyos iparági teszteken felülmúlja az OpenAI o1-et, kiemelkedően teljesít matematikában és programozásban. Ironikus módon, bár “érvelő modellként” hirdetik, “fejlesztésre szorul a hétköznapi érvelés terén”. Emellett tartalmazza a kínai kormány cenzúráját is. Ingyenes és nyílt forráskódú.

Az Anthropic Computer Use funkciója olyan feladatok elvégzésére szolgál, mint a programozás vagy egy repülőjegy foglalása, így az OpenAI Operator előfutárának tekinthető. A Computer Use azonban csak egyszerűbb feladatokra képes. Az árazás API-n keresztül történik: 0,80 dollár millió bemeneti tokenenként és 4 dollár millió kimeneti tokenenként.

Az x.AI Grok 2 modellje mellé Elon Musk MI cége egy képgenerátort, az Aurorát is elindította, amely “néhány grafikus vagy erőszakos tartalmat is tartalmaz”. Az ingyenes felhasználók két óránként 10 kérdésre korlátozódnak a Grok használata során, míg az X Premium és Premium+ előfizetői magasabb használati korlátokat élveznek.

Az OpenAI o1 modell kiemelkedik programozás, matematika és biztonság terén. Az o1 használatához ChatGPT Plus előfizetés szükséges, amely havi 20 dollárba kerül.

Az Anthropic Claude Sonnet 3.5 modellje az Anthropic szerint jelentős előrelépés. Programozási képességeiről vált ismertté, és a technológiai bennfentesek kedvencének számít. A modell ingyenesen elérhető a Claude-on, bár a gyakori felhasználóknak havi 20 dolláros Pro előfizetésre van szükségük. Bár képes képeket értelmezni, nem tud képeket generálni.

Az OpenAI GPT 4o-mini modellt a cég legolcsóbb és leggyorsabb modelljeként hirdetik kis méretének köszönhetően. Hogy széles körű feladatokat tegyen lehetővé, például ügyfélszolgálati chatbotok működtetését, a modell elérhető a ChatGPT ingyenes szintjén.

A Cohere Command R+ kiváló teljesítményt nyújt a vállalatok számára komplex, információkereséssel bővített generálás (RAG) alkalmazásokban. Ez azt jelenti, hogy rendkívül jól megtalálja és hivatkozza a konkrét információkat. A RAG feltalálója is elismerően nyilatkozott a modellről.

  • Mi a véleményed az AI-modellek gyors ütemű megjelenéséről a piacon, és hogyan érinti ez a felhasználókat?
  • Mit tettél volna, hogy az AI modellek fejlesztése és használata átláthatóbb és hozzáférhetőbb legyen a közönség számára?
  • Hogyan kezelnéd a technológiai fejlődés ütemét, hogy az etikai, társadalmi és gazdasági szempontok is érvényesüljenek?


Legfrissebb posztok

MA 11:34

A kínai pénzlevelű növény leveleinek megdöbbentő matematikai titka

A kínai szerencsepálma (Pilea peperomioides) hosszú ideje népszerű szobanövény, de most újabb izgalmas titokra derült fény: a növény levelei magukban hordoznak egy rendkívül kifinomult, természetes geometriai rendszert, amellyel eddig főleg az informatikában, hálózatok tervezésében vagy a várostervezésben találkozhattunk...

MA 11:12

A légkör meglepő titka: a CO2 lehűti a felső rétegeket

🌓 Felmerül a kérdés, hogy miközben a Föld felszíne folyamatosan melegszik, bolygónk felsőbb légkörei éppen ellenkező irányba változnak: gyorsan hűlnek...

MA 10:55

Az ETF-ekből rekord 635 millió dollár távozott: mi lesz a bitcoin árával?

Az amerikai spot bitcoin ETF-ekből egyetlen nap alatt 226 milliárd forintnyi, azaz 635 millió dollár értékű tőkét vontak ki a befektetők – ez a legnagyobb egynapos kiáramlás január vége óta...

MA 10:47

Az új Dutton Ranch: Beth és Rip felszántják Texast

Beth Dutton és Rip Wheeler elszakadnak a megszokott világtól, és egy egészen új fejezetet nyitnak Texasban – messze az eddig jól ismert Yellowstone-tól...

MA 10:38

A halálos „vörös ég” napviharát ősi fák árulták el

Több mint nyolcszáz évvel ezelőtti óriási napvihar nyomaira bukkantak japán kutatók eltemetett fák gyűrűiben és középkori krónikákban...

MA 10:20

A Bungie feltolja a zsákmányt az első wipe előtt, Cryo Archive 24/7

📚 Sok játékos ismeri az érzést, amikor a lelkesedés alábbhagy: a kihívások egyre nehezebbek, a jutalmak pedig túl ritkán érkeznek...

MA 10:03

A Kongresszus forró májusa: adatbotránytól botránylavináig

Külön említést érdemel, hogy ismét súlyos adatvédelmi botrány borzolja a kedélyeket az Egyesült Államok Kongresszusában...

MA 09:55

Az Anthropic lehagyta az OpenAI-t – de három veszély fenyegeti

Az MI-versenyben drámai fordulat történt: az amerikai vállalatok többet költenek most az Anthropic termékére, a Claude-ra, mint a piacot eddig uraló OpenAI ChatGPT-jére...

MA 09:37

Az Amazon dolgozói mesterségesen pörgetik az MI-használatot a kvótákért

📈 Az Amazonnál egyre nagyobb a nyomás a dolgozókon, hogy minden héten használják az MI-t, akár akarják, akár nem...

MA 09:27

A japánok valódi eredete: óriási DNS-felfedezés átírja a történelmet

Évszázadokon át általános volt a nézet, hogy a japán lakosság elsősorban két ősi népcsoport, a szigetcsoportban évezredek óta élő Jomon vadászó-gyűjtögetők és a később keletről bevándorló, rizstermesztést és új technológiákat meghonosító közösségek leszármazottai...

MA 09:19

A Stardew Valley-ben nem lesz hűtlenség – Nagypapa nem örülne

🌾 A Stardew Valley rajongói között komoly hullámokat kavart, hogy vajon megjelenhet-e valaha a hűtlenség vagy a válás lehetősége a játékban...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/14

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     War Mongrels (iPhone/iPad)A War Mongrels (röviden WM) egy izometrikus nézetű valós idejű taktikai játék, amely a második világháború keleti frontján játszódik...

MA 09:10

A Tejútrendszer felfalta a Loki nevű galaxist – megvannak a maradványai

💫 Több mint tízmilliárd évvel ezelőtt a Tejútrendszer nem arra az égre hasonlított, amit ma ismerünk...

MA 09:02

A Föld ősi szupernóvatörmeléken száguld – bizonyíték az antarktiszi jégben

Földünk egy évezredek óta porladó csillagrobbanás anyagfelhőjén halad keresztül, amelynek radioaktív vasnyomait most mélyen az antarktiszi jégben találták meg a kutatók...

MA 08:56

Az Anthropic visszahozza az OpenClaw-t és a külső ügynököket – de komoly kikötésekkel

🔔 Többek között izgalmas bejelentés rázta meg az MI-fejlesztők világát: ismét lehetőség van az OpenClaw és más, harmadik féltől származó autonóm MI-ügynökök használatára az Anthropic népszerű Claude-előfizetéseinek keretében...

MA 08:46

A 395 ezer dollárnyi bitcoin visszatér: Claude kiszabadítja a gép fogságából

🔑 Majdnem 140 millió forint értékű bitcoin ragadt egy régi számítógépen, de egy váratlan fordulat mindent megváltoztatott...

MA 08:37

A legfejlettebb MI nemcsak töröl, át is ír – és észrevétlenül hibázik

💡 Ahogy a nagy nyelvi modellek egyre okosabbá válnak, egyre többen bízzák rájuk tudásalapú feladatok elvégzését: a gép átnézi, rendszerezi, szerkeszti a dokumentumokat, majd leteszi elénk a kész eredményt...

MA 08:29

A mindennapi kávé 35%-kal csökkentheti a demencia esélyét

Amerikai kutatók több mint 130 000 egészségügyi dolgozót követtek 43 éven át, hogy felmérjék a kávé és tea hosszú távú hatásait az agy egészségére...

MA 08:19

A Warhammer 40,000: Mechanicus 2 jövő héten, a leleplezésekkel teli Skullson debütál

🥂 Erre utal többek között az, hogy a legendás Warhammer Skulls rendezvény idén nemcsak visszahozza a már megszokott izgalmakat, hanem váratlan meglepetéssel is szolgál: a nagy sikerű, körökre osztott taktikai játék, a Warhammer 40,000: Mechanicus 2 már május 21-én, a Skulls eseményén megjelenik...

MA 08:02

Az eddigi legnagyobb és legerősebb Starship indítására készül a SpaceX

🚀 Az űrhajózás történetében ritkán születik akkora izgalom, mint amikor egy vadonatúj, gigászi rakéta készül elhagyni a Földet...

MA 07:46

A Metaplanet halasztja az elsőbbségi részvények tőzsdei debütálását Japánban

A Metaplanet, amely Japán legnagyobb vállalati bitcoin-tulajdonosa és világviszonylatban is a harmadik legnagyobb bitcoin-vagyonkezelő, kénytelen elhalasztani a tervezett Mars és Mercury nevű örökjáradékos preferált részvényeinek tőzsdei bevezetését...

MA 07:38

Az óriás Sony 200–600 G OSS: csoda vagy kompromisszum?

📷 Különösen említést érdemel, hogy a Sony FE 200–600mm f/5.6–6.3 G OSS objektív új szintre emeli a természetfotózást: ha korábban akadály volt a nagy távolság vagy a váratlan mozgás, ezzel az objektívvel minden esélyed megnő az akció tökéletes elkapására...

MA 07:29

A Homo erectus genetikai anyagát először szekvenálták: mély genetikai kapcsolat velünk

🔬 Lényeges, hogy a 400 ezer éves Homo erectus-maradványok elemzése forradalmi áttörést hozott – most először sikerült genetikai anyagot szekvenálni ebből a fajból...

MA 07:19

A gondolkodók játéka: Connections – lásd meg a rejtett kapcsolatokat

Ha szereted a kihívásokat, a Connections nevű szókirakó minden nap új fejtörőt készít neked...

MA 07:10

A Consensys visszakozik: őszre tolódik a tőzsdei debütálás

Felmerül a kérdés, hogy mikor léphet végre tőzsdére a kriptovilág egyik legismertebb szereplője, hiszen a Consensys, a Joe Lubin vezetésével működő Ethereum-alkalmazásfejlesztő vállalat ismét elhalasztotta az amerikai tőzsdére lépését...

MA 07:02

Az MI IQ-láz: emberi skálán mérik, a techvilág szétszakad

Megemlíthető továbbá, hogy évtizedeken át az IQ-teszt számított az egyik legismertebb – és egyben legvitatottabb – mérőszámnak az emberi intelligencia terén...

MA 06:56

Az Alpenglow új korszakot nyithat: már tesztelhető a Solanán

🌅 A Solana hálózat történelmének legnagyobb változása érkezett el az új Alpenglow-frissítéssel, amely mostantól tesztelhető a közösségi teszthálózaton...

MA 06:46

A neandervölgyiek már fogorvoskodtak: 60 ezer éves, fúrt fog Szibériából

Nemcsak az emberiség legkorábbi egészségügyi beavatkozásának, hanem az első, szinte modernnek mondható fogászati kezelésnek a nyomait is felfedezték Szibériában, egy Neander-völgyi ősember hátrahagyott fogán...

MA 06:29

A hadiipar rémálma: ukrán dróngyilkos lézer fillérekből, három mérföldről

Az ukrán Celebra Tech új fejlesztése, a Trident névre keresztelt lézerfegyver forradalmi áttörést ígér a modern hadviselésben...