2025. 03. 01., 17:46

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?
Az AI-modellek szédületes tempóban jelennek meg a piacon, a Google-féle tech óriásoktól kezdve az OpenAI és Anthropic típusú startupokig mindenki új modellekkel jelentkezik. Az újdonságok követése már-már lehetetlen feladat. A helyzetet csak bonyolítja, hogy az AI-modelleket gyakran iparági teljesítménymérők alapján reklámozzák, amelyek azonban keveset árulnak el arról, hogy a valós felhasználók és vállalatok hogyan hasznosítják ezeket a gyakorlatban. A zavaros helyzet tisztázása érdekében itt egy áttekintés a 2024 óta megjelent legfejlettebb MI-modellekről, részletezve használatukat és azt, miben nyújtják a legjobb teljesítményt. Szó szerint több, mint egymillió MI-modell létezik már: például csak a Hugging Face platformon több százezer található. Így ez a lista biztosan kihagy néhány olyan modellt, amely egyik vagy másik szempontból jobban teljesít.

2025-ben megjelent MI-modellek

Az OpenAI a GPT 4.5 Orion modellt a valaha volt legokosabb AI-jukként hirdeti, kiemelve annak erős “világismeretét” és “érzelmi intelligenciáját”. Ugyanakkor bizonyos teszteken gyengébben teljesít, mint az újabb, érvelésre specializált modellek. Az Orion az OpenAI havi 200 dolláros előfizetésével érhető el.

Az Anthropic szerint a Claude Sonnet 3.7 a legjobb általános célú AI, mert képes gyors válaszokat adni, de alaposan átgondolni a dolgokat, amikor arra van szükség. A felhasználók ráadásul szabályozhatják, mennyi ideig gondolkozhat a modell. A Sonnet 3.7 minden Claude-felhasználó számára elérhető, de a gyakoribb használathoz havi 20 dolláros Pro előfizetés szükséges.

A Grok 3 az Elon Musk által alapított xAI startup legújabb modellje. Állítólag felülmúlja a többi vezető modellt matematika, tudomány és programozás területén. A modell használatához X Premium előfizetés szükséges (havi 50 dollár). Miután egy tanulmány szerint a Grok 2 inkább baloldali beállítottságú volt, Musk megígérte, hogy a Grok “politikailag semlegesebbé” válik, de még nem világos, hogy ezt sikerült-e elérni.

Az OpenAI o3-mini a cég legújabb, kisméretű modellje, amelyet STEM-kapcsolatos feladatokra, például programozásra, matematikára és tudományos problémákra optimalizáltak. Kisebb mérete miatt a cég szerint jelentősen alacsonyabb költséggel működtethető. Ingyenesen elérhető, de a nagyfelhasználóknak előfizetésre van szükségük.

Az OpenAI Deep Research képes részletes kutatást végezni egy adott témában, egyértelmű hivatkozásokkal. Ez a szolgáltatás csak a ChatGPT előfizetéses verzióival érhető el. Az OpenAI szerint a szolgáltatás a tudománytól a vásárlási kutatásokig mindenre használható, de fontos tudni, hogy a hivatkozások ellenőrzése még mindig kihívást jelent az MI számára.

A Mistral Le Chat egy multimodális AI személyi asszisztens. A Mistral Le Chat állítólag gyorsabban válaszol, mint bármely más chatbot. Van egy fizetős változata is, amely az AFP hírügynökségtől származó naprakész információkkal rendelkezik. A tesztek szerint a Le Chat teljesítménye lenyűgöző, bár több hibát vét, mint a ChatGPT.

Az OpenAI Operator egy olyan személyi asszisztens, amely képes önállóan elvégezni feladatokat, például segíteni az élelmiszer-vásárlásban. Használatához havi 200 dolláros ChatGPT Pro előfizetés szükséges. Az AI-ügynökök sok lehetőséget rejtenek, de még mindig kísérleti fázisban vannak: egy Washington Post újságírója beszámolt róla, hogy az asszisztens saját döntése alapján 31 dollárért rendelt egy tucat tojást, amit az újságíró hitelkártyájával fizetett ki.

A Google Gemini 2.0 Pro Experimental a cég szerint kiváló programozási képességekkel és általános tudással rendelkezik. 2 millió tokenes, rendkívül hosszú kontextusablaka segíti a felhasználókat, akiknek hatalmas szövegmennyiséget kell gyorsan feldolgozniuk. A szolgáltatás legalább havi 19,99 dolláros Google One AI Premium előfizetést igényel.

A DeepSeek R1 fejlesztése több mint 100 millió dollárba került. A DeepSeek R1 jól teljesít programozásban és matematikában, míg nyílt forráskódú jellege lehetővé teszi, hogy bárki lokálisan futtassa. Ingyenes, azonban a kínai kormányzati cenzúra és az a gyanú, hogy potenciálisan felhasználói adatokat küld vissza Kínába, aggályokat vet fel.

A Gemini Deep Research egyszerű és jól hivatkozott dokumentumban végez mélyreható kutatást. Hasznos diákok és bárki számára, akinek gyors kutatási összefoglalóra van szüksége. Minősége azonban közel sem olyan jó, mint egy valódi, szakértők által lektorált tanulmányé. A Deep Research használatához havi 19,99 dolláros Google One AI Premium előfizetés szükséges.

A Meta Llama 3.3 70B a Meta nyílt forráskódú Llama MI modelljeinek legújabb verziója. A Meta szerint ez a legolcsóbb és leghatékonyabb modell, különösen matematika, általános ismeretek és utasítások követése terén. Ingyenes és nyílt forráskódú.

Az OpenAI Sora egy olyan modell, amely szöveg alapján videókat generál. Bár képes teljes jeleneteket létrehozni, nemcsak rövid klipeket, sokszor “irreális fizikát” mutat. Jelenleg csak a ChatGPT fizetős verzióin érhető el, kezdve a Plus csomaggal, amely havi 20 dollárba kerül.

Az Alibaba Qwen QwQ-32B-Preview modell bizonyos iparági teszteken felülmúlja az OpenAI o1-et, kiemelkedően teljesít matematikában és programozásban. Ironikus módon, bár “érvelő modellként” hirdetik, “fejlesztésre szorul a hétköznapi érvelés terén”. Emellett tartalmazza a kínai kormány cenzúráját is. Ingyenes és nyílt forráskódú.

Az Anthropic Computer Use funkciója olyan feladatok elvégzésére szolgál, mint a programozás vagy egy repülőjegy foglalása, így az OpenAI Operator előfutárának tekinthető. A Computer Use azonban csak egyszerűbb feladatokra képes. Az árazás API-n keresztül történik: 0,80 dollár millió bemeneti tokenenként és 4 dollár millió kimeneti tokenenként.

Az x.AI Grok 2 modellje mellé Elon Musk MI cége egy képgenerátort, az Aurorát is elindította, amely “néhány grafikus vagy erőszakos tartalmat is tartalmaz”. Az ingyenes felhasználók két óránként 10 kérdésre korlátozódnak a Grok használata során, míg az X Premium és Premium+ előfizetői magasabb használati korlátokat élveznek.

Az OpenAI o1 modell kiemelkedik programozás, matematika és biztonság terén. Az o1 használatához ChatGPT Plus előfizetés szükséges, amely havi 20 dollárba kerül.

Az Anthropic Claude Sonnet 3.5 modellje az Anthropic szerint jelentős előrelépés. Programozási képességeiről vált ismertté, és a technológiai bennfentesek kedvencének számít. A modell ingyenesen elérhető a Claude-on, bár a gyakori felhasználóknak havi 20 dolláros Pro előfizetésre van szükségük. Bár képes képeket értelmezni, nem tud képeket generálni.

Az OpenAI GPT 4o-mini modellt a cég legolcsóbb és leggyorsabb modelljeként hirdetik kis méretének köszönhetően. Hogy széles körű feladatokat tegyen lehetővé, például ügyfélszolgálati chatbotok működtetését, a modell elérhető a ChatGPT ingyenes szintjén.

A Cohere Command R+ kiváló teljesítményt nyújt a vállalatok számára komplex, információkereséssel bővített generálás (RAG) alkalmazásokban. Ez azt jelenti, hogy rendkívül jól megtalálja és hivatkozza a konkrét információkat. A RAG feltalálója is elismerően nyilatkozott a modellről.

  • Mi a véleményed az AI-modellek gyors ütemű megjelenéséről a piacon, és hogyan érinti ez a felhasználókat?
  • Mit tettél volna, hogy az AI modellek fejlesztése és használata átláthatóbb és hozzáférhetőbb legyen a közönség számára?
  • Hogyan kezelnéd a technológiai fejlődés ütemét, hogy az etikai, társadalmi és gazdasági szempontok is érvényesüljenek?


Legfrissebb posztok

MA 20:13

Lehet az intersztelláris 3I/ATLAS üstökös az univerzum fosszíliája?

🚀 Egészen elképesztő felfedezés látott napvilágot: a 3I/ATLAS nevű intersztelláris üstökös akár 12 milliárd éves is lehet...

MA 20:01

A Loblaw elleni kibertámadás az adathalászok aranybányája

Kanada legnagyobb kiskereskedelmi vállalata, a Loblaw kibertámadás áldozata lett, amely során a bűnözők az ügyfelek alapvető elérhetőségi adataihoz jutottak hozzá...

MA 19:57

Az MI-ügynököknek soha nem volt ilyen létfontosságú a vektoros keresés

Különösen említést érdemel, hogy az MI-ügynökök térhódítása nemhogy megszüntette volna, hanem jelentősen felerősítette a vektoros keresés iránti igényt...

MA 19:47

Az Nvidia új MI-szörnyetege: 7,2 ezermilliárd forintos nagy dobás

🔥 Egy lényeges szempont, hogy a karácsony előtti utolsó munkanapon óriási port kavart a technológiai világban egy jelentős üzletkötés: az Nvidia körülbelül 7,2 ezer milliárd forintért (20 milliárd dollárért) licencelte egy feltörekvő chipgyártó, a Groq technológiáját, miközben több kulcsembereket, köztük a vezérigazgatót is átcsábította...

MA 19:34

Az új kibertámadókra világszerte lecsaptak a hatóságok

Ez a jelenség jól illusztrálható azzal, hogy a nemzetközi hatóságok egy friss, összehangolt akciója során 45 000 IP-címet és számtalan szervert vontak ki a forgalomból, amivel világszerte elkövetett kibercselekményeket akadályoztak meg...

MA 19:23

A világ első kereskedelmi agyi implantátumát Kína jóváhagyta

Tipikus eset, amikor a tudományos áttörés nem a Szilícium-völgyből, hanem Kínából érkezik...

MA 18:03

A kozmosz rejtett robbanásai: törpegalaxisban felbukkant neutroncsillag-ütközés

Egy rendkívül erős gamma-kitörést figyeltek meg, amely két összeolvadó neutroncsillagból származik – ráadásul ezek egy eddig ismeretlen minigalaxisban rejtőztek el, egy ősi kozmikus ütközés maradványaként...

MA 17:56

Az első Uber-robotaxi megérkezett: Las Vegas utcáin gurul

Lényeges újdonság, hogy Las Vegasban mostantól elérhetők az Uber robotaxis fuvarok...

MA 17:46

Mérgező vörös ásvány egy ukrajnai szkíta sírban

A Chervony Mayak nevű temetőben végzett régészeti ásatások során egy 1900 éves, kétszemélyes szkíta női sírban váratlan leletre bukkantak: mérgező, vörös színű cinóberdarabokra...

MA 17:34

Az Apple nagy dobása: itt a MacBook Neo

Rózsaszín, kék, sárga – végre el se lehet téveszteni a MacBook Neót, ami 13 colos méretben és 600 ezer forintért kerül az Apple boltjaiba...

MA 17:25

A rettegett péntek 13.: ezért jön ki mindig a matek

Tipikus eset, amikor egy dátum köré épülő félelem végigsöpör a világon, pedig minden babona mögött tiszta matematikai törvényszerűség áll...

MA 17:02

Az MI forradalma: most éri meg igazán szoftveriparba lépni

A szoftvervilág történetének egyik legizgalmasabb korszakában élünk: már nemcsak álom, hogy percek alatt térképezzen fel és újítson meg évtizedes, kritikus rendszereket egy MI-algoritmus...

MA 16:56

Az idei tél forrón robbant be Amerikában

🔥 Erre utal többek között az, hogy az Egyesült Államokban idén egyik államban sem dőlt meg hidegrekord a tél folyamán, miközben kilenc államban rekordmeleg uralkodott december és február között...

MA 16:45

A PDF királya távozik: lemond az Adobe vezére 18 év után

Erre utal többek között, hogy Shantanu Narayen, az Adobe vezérigazgatója váratlanul bejelentette távozását, miután 18 évig irányította a világhírű szoftvervállalatot...

MA 16:35

Az MI nem könnyít, inkább még fárasztóbbá teszi a munkát

Érdekes felvetés, hogy a mesterséges intelligencia (MI) egyre inkább teret nyer a munkahelyeken, mégsem tapasztalnak könnyebbséget az alkalmazottak a mindennapos feladatokban...

MA 16:24

Az égi rejtély: elkóborolt fekete lyuk, vagy különös galaxis?

Külön említést érdemel, hogy a csillagászok egy furcsa fénycsíkra bukkantak az univerzumban, amelynek magyarázata évek óta viták és kutatások tárgya...

MA 13:57

Az Apple MacBook Neo átírja az olcsó laptopok szabályait

💻 Amikor az Apple bemutatta a MacBook Neót, szinte minden nagy PC-gyártó meglepetten kapta fel a fejét...

MA 13:45

Az angol gyeplabda válságban: 129 GB-nyi adat forog kockán

🚩 Anglia gyeplabda-szövetségét súlyos kibertámadás érte, miután egy hackercsoport – AiLock néven – magára vállalta adataik ellopását, és bejelentette közzétételének szándékát...

MA 13:37

A MacBook Air M5 rekordgyors – de tényleg erre vártunk?

🚀 Elképesztő, hogy immár négy év telt el azóta, hogy az Apple kívül-belül teljesen újragondolta a MacBook Airt...

MA 13:24

A mindent vivő π-képlet

Több mint kétezer éve matematikusok generációi próbálnak minél gyorsabban és pontosabban kiszámolni a pi (π) értékét, így az évezredek alatt képletek ezrei születtek...

MA 12:02

Az MI végső vizsgája: látványosan kibuktak a gépek hibái

Miközben a mesterségesintelligencia-rendszerek egyre jobb eredményeket érnek el a hagyományos akadémiai teszteken, nyilvánvalóvá vált, hogy ezek a próbák már nem elég összetettek...

MA 11:56

A hajlítható iPhone leveri a Samsungot – tényleg ekkora durranás?

Az Apple végre beszáll a hajtogatható bizniszbe, méghozzá nem is akárhogy: a pletykák szerint 2026-ra 20 millió darab iPhone Fold-kijelzőre adtak le rendelést a Samsungnál, ami simán túltesz a Samsung összes hajtogathatóján – a koreaiak ugyanis ugyanebben az évben 7 millió eladott készülékkel is beérnék...

MA 11:45

Az újabb Chrome-hibák az egész világot veszélybe sodorják

⚠️ Két új kritikus sebezhetőséget találtak a Google Chrome böngészőben, amelyeket a támadók máris kihasználnak...

MA 11:35

Megfejtették az arany születésének húsz éve húzódó atomfizikai rejtélyét

🪙 Lényeges szempont, hogy az arany, a platina és más nehéz elemek csak szélsőséges csillagászati események során jöhetnek létre, például amikor csillagok összeütköznek vagy felrobbannak...

MA 11:23

Az orkáktól űzött delfinek sorra vetődnek partra Patagóniában

🐚 Felmerül a kérdés, hogy mi állhat a döbbenetes delfin-partra vetődések mögött, amelyek Patagónia partjainál ismétlődnek...

MA 11:02

A bonobók igazi arca: egyáltalán nem „hippik”

A bonobókat sokáig a békés, „hippi” emberszabásúak jelképeként tartották számon, a harcias csimpánzok szöges ellentéteként...

MA 10:58

Az új Lucid SUV hozhatja meg a várva várt nyereséget

A Lucid bemutatja új, középkategóriás elektromos platformját, amelyre három vadonatúj SUV-t épít: a Lucid Earth, a Lucid Cosmos és egy egyelőre névtelen, terepre szánt modell...

MA 10:36

Az új MacBook Neo: végre egy javítható Apple-laptop?

Csak hogy tiszta legyen: az Apple MacBook Neo izgalmas újdonság, mert végre nem egy elvarázsolt doboz, ami minden szerelő rémálma...

MA 10:29

Végre hivatalos Chrome érkezik ARM64-es Linuxra

A Linuxot futtató ARM gépek sokáig voltak mostohagyermekei a böngészőiparnak: a felhasználók eddig kénytelenek voltak beérni rivális vagy nem hivatalos Chrome-verziókkal...