2025. 03. 01., 17:46

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?

A MI-modellek rekord sebességgel érkeznek, de melyikre érdemes figyelni?
Az AI-modellek szédületes tempóban jelennek meg a piacon, a Google-féle tech óriásoktól kezdve az OpenAI és Anthropic típusú startupokig mindenki új modellekkel jelentkezik. Az újdonságok követése már-már lehetetlen feladat. A helyzetet csak bonyolítja, hogy az AI-modelleket gyakran iparági teljesítménymérők alapján reklámozzák, amelyek azonban keveset árulnak el arról, hogy a valós felhasználók és vállalatok hogyan hasznosítják ezeket a gyakorlatban. A zavaros helyzet tisztázása érdekében itt egy áttekintés a 2024 óta megjelent legfejlettebb MI-modellekről, részletezve használatukat és azt, miben nyújtják a legjobb teljesítményt. Szó szerint több, mint egymillió MI-modell létezik már: például csak a Hugging Face platformon több százezer található. Így ez a lista biztosan kihagy néhány olyan modellt, amely egyik vagy másik szempontból jobban teljesít.

2025-ben megjelent MI-modellek

Az OpenAI a GPT 4.5 Orion modellt a valaha volt legokosabb AI-jukként hirdeti, kiemelve annak erős “világismeretét” és “érzelmi intelligenciáját”. Ugyanakkor bizonyos teszteken gyengébben teljesít, mint az újabb, érvelésre specializált modellek. Az Orion az OpenAI havi 200 dolláros előfizetésével érhető el.

Az Anthropic szerint a Claude Sonnet 3.7 a legjobb általános célú AI, mert képes gyors válaszokat adni, de alaposan átgondolni a dolgokat, amikor arra van szükség. A felhasználók ráadásul szabályozhatják, mennyi ideig gondolkozhat a modell. A Sonnet 3.7 minden Claude-felhasználó számára elérhető, de a gyakoribb használathoz havi 20 dolláros Pro előfizetés szükséges.

A Grok 3 az Elon Musk által alapított xAI startup legújabb modellje. Állítólag felülmúlja a többi vezető modellt matematika, tudomány és programozás területén. A modell használatához X Premium előfizetés szükséges (havi 50 dollár). Miután egy tanulmány szerint a Grok 2 inkább baloldali beállítottságú volt, Musk megígérte, hogy a Grok “politikailag semlegesebbé” válik, de még nem világos, hogy ezt sikerült-e elérni.

Az OpenAI o3-mini a cég legújabb, kisméretű modellje, amelyet STEM-kapcsolatos feladatokra, például programozásra, matematikára és tudományos problémákra optimalizáltak. Kisebb mérete miatt a cég szerint jelentősen alacsonyabb költséggel működtethető. Ingyenesen elérhető, de a nagyfelhasználóknak előfizetésre van szükségük.

Az OpenAI Deep Research képes részletes kutatást végezni egy adott témában, egyértelmű hivatkozásokkal. Ez a szolgáltatás csak a ChatGPT előfizetéses verzióival érhető el. Az OpenAI szerint a szolgáltatás a tudománytól a vásárlási kutatásokig mindenre használható, de fontos tudni, hogy a hivatkozások ellenőrzése még mindig kihívást jelent az MI számára.

A Mistral Le Chat egy multimodális AI személyi asszisztens. A Mistral Le Chat állítólag gyorsabban válaszol, mint bármely más chatbot. Van egy fizetős változata is, amely az AFP hírügynökségtől származó naprakész információkkal rendelkezik. A tesztek szerint a Le Chat teljesítménye lenyűgöző, bár több hibát vét, mint a ChatGPT.

Az OpenAI Operator egy olyan személyi asszisztens, amely képes önállóan elvégezni feladatokat, például segíteni az élelmiszer-vásárlásban. Használatához havi 200 dolláros ChatGPT Pro előfizetés szükséges. Az AI-ügynökök sok lehetőséget rejtenek, de még mindig kísérleti fázisban vannak: egy Washington Post újságírója beszámolt róla, hogy az asszisztens saját döntése alapján 31 dollárért rendelt egy tucat tojást, amit az újságíró hitelkártyájával fizetett ki.

A Google Gemini 2.0 Pro Experimental a cég szerint kiváló programozási képességekkel és általános tudással rendelkezik. 2 millió tokenes, rendkívül hosszú kontextusablaka segíti a felhasználókat, akiknek hatalmas szövegmennyiséget kell gyorsan feldolgozniuk. A szolgáltatás legalább havi 19,99 dolláros Google One AI Premium előfizetést igényel.

A DeepSeek R1 fejlesztése több mint 100 millió dollárba került. A DeepSeek R1 jól teljesít programozásban és matematikában, míg nyílt forráskódú jellege lehetővé teszi, hogy bárki lokálisan futtassa. Ingyenes, azonban a kínai kormányzati cenzúra és az a gyanú, hogy potenciálisan felhasználói adatokat küld vissza Kínába, aggályokat vet fel.

A Gemini Deep Research egyszerű és jól hivatkozott dokumentumban végez mélyreható kutatást. Hasznos diákok és bárki számára, akinek gyors kutatási összefoglalóra van szüksége. Minősége azonban közel sem olyan jó, mint egy valódi, szakértők által lektorált tanulmányé. A Deep Research használatához havi 19,99 dolláros Google One AI Premium előfizetés szükséges.

A Meta Llama 3.3 70B a Meta nyílt forráskódú Llama MI modelljeinek legújabb verziója. A Meta szerint ez a legolcsóbb és leghatékonyabb modell, különösen matematika, általános ismeretek és utasítások követése terén. Ingyenes és nyílt forráskódú.

Az OpenAI Sora egy olyan modell, amely szöveg alapján videókat generál. Bár képes teljes jeleneteket létrehozni, nemcsak rövid klipeket, sokszor “irreális fizikát” mutat. Jelenleg csak a ChatGPT fizetős verzióin érhető el, kezdve a Plus csomaggal, amely havi 20 dollárba kerül.

Az Alibaba Qwen QwQ-32B-Preview modell bizonyos iparági teszteken felülmúlja az OpenAI o1-et, kiemelkedően teljesít matematikában és programozásban. Ironikus módon, bár “érvelő modellként” hirdetik, “fejlesztésre szorul a hétköznapi érvelés terén”. Emellett tartalmazza a kínai kormány cenzúráját is. Ingyenes és nyílt forráskódú.

Az Anthropic Computer Use funkciója olyan feladatok elvégzésére szolgál, mint a programozás vagy egy repülőjegy foglalása, így az OpenAI Operator előfutárának tekinthető. A Computer Use azonban csak egyszerűbb feladatokra képes. Az árazás API-n keresztül történik: 0,80 dollár millió bemeneti tokenenként és 4 dollár millió kimeneti tokenenként.

Az x.AI Grok 2 modellje mellé Elon Musk MI cége egy képgenerátort, az Aurorát is elindította, amely “néhány grafikus vagy erőszakos tartalmat is tartalmaz”. Az ingyenes felhasználók két óránként 10 kérdésre korlátozódnak a Grok használata során, míg az X Premium és Premium+ előfizetői magasabb használati korlátokat élveznek.

Az OpenAI o1 modell kiemelkedik programozás, matematika és biztonság terén. Az o1 használatához ChatGPT Plus előfizetés szükséges, amely havi 20 dollárba kerül.

Az Anthropic Claude Sonnet 3.5 modellje az Anthropic szerint jelentős előrelépés. Programozási képességeiről vált ismertté, és a technológiai bennfentesek kedvencének számít. A modell ingyenesen elérhető a Claude-on, bár a gyakori felhasználóknak havi 20 dolláros Pro előfizetésre van szükségük. Bár képes képeket értelmezni, nem tud képeket generálni.

Az OpenAI GPT 4o-mini modellt a cég legolcsóbb és leggyorsabb modelljeként hirdetik kis méretének köszönhetően. Hogy széles körű feladatokat tegyen lehetővé, például ügyfélszolgálati chatbotok működtetését, a modell elérhető a ChatGPT ingyenes szintjén.

A Cohere Command R+ kiváló teljesítményt nyújt a vállalatok számára komplex, információkereséssel bővített generálás (RAG) alkalmazásokban. Ez azt jelenti, hogy rendkívül jól megtalálja és hivatkozza a konkrét információkat. A RAG feltalálója is elismerően nyilatkozott a modellről.

  • Mi a véleményed az AI-modellek gyors ütemű megjelenéséről a piacon, és hogyan érinti ez a felhasználókat?
  • Mit tettél volna, hogy az AI modellek fejlesztése és használata átláthatóbb és hozzáférhetőbb legyen a közönség számára?
  • Hogyan kezelnéd a technológiai fejlődés ütemét, hogy az etikai, társadalmi és gazdasági szempontok is érvényesüljenek?


Legfrissebb posztok

MA 06:05

Történelmi események a mai napon (Június 15.)

Viharos háborúk, birodalmak sorsa és sorsfordító természeti katasztrófák jelölik ezt a napot: a rigómezei ütközet és a Mount Pinatubo pusztító kitörése mellett II...

vasárnap 21:12

Az Apple MI-botránya: járhat neked is kártérítés – így derül ki

Sokan vásároltak iPhone 16 vagy iPhone 15 Pro készüléket abban a reményben, hogy az Apple által beharangozott, vadonatúj okosfunkciókat azonnal használhatják...

vasárnap 20:45

A volt iskolai informatikus 21 hónapot kapott munkaadója hackeléséért

Egykori rendszergazda miatt bénult le egy iowai iskolai körzet: 21 hónap börtönre ítélték, miután hónapokon keresztül támadta volt munkahelyének rendszereit...

vasárnap 20:01

A Wall Street és a kripto frontálisan ütközik: átalakul a pénzvilág

💸 A nagyobb kriptotőzsdék alapjaiban változtatják meg működésüket: már nemcsak kriptovalutákkal, hanem részvényekkel, árupiaci termékekkel és indexalapokkal is kereskedhetsz egyetlen platformról, akár éjjel-nappal...

vasárnap 19:34

Az inkák gyerekmúmiái: rituális áldozatok a birodalom terjeszkedéséért

⛰ Több mint ötszáz évvel ezelőtt egy kamaszlány életét áldozták fel az Andok egy fagyos vulkáncsúcsán – testét tökéletesen konzerválta a jeges levegő...

vasárnap 19:23

Az új szabályokkal az egekbe törhet a drónhasználat

🚀 Az amerikai légügyi hatóság hamarosan enyhítheti azt a szabályt, amely eddig előírta, hogy drónt csak akkor lehetett reptetni, ha a pilóta folyamatosan szemmel tartja a gépet...

vasárnap 19:01

A kutatók meglepő buktatót találtak a cukormentes diétákban

🤔 A teljes cukormentes étkezés mögött rejlő tévhiteket dönti meg egy friss kutatás, amely szerint a cukor teljes kiiktatása akár ronthat is az egészségi állapoton...

vasárnap 18:45

Az új Planet: se állatkert, se vidámpark – Resort vagy Festival?

🌎 A Frontier csapata egy teljesen új Planet-menedzsmentjáték fejlesztésén dolgozik, amely végre eltér a már megszokott állatkerti és vidámparki témáktól...

vasárnap 18:34

Az amerikai anyatejben is ott vannak a hormonromboló szerek

Például a seattle-i édesanyáktól vett anyatejmintákban riasztó mennyiségben találtak veszélyes, hormonrendszert zavaró vegyszereket, amelyek között ott van a BPA, a BPS, a melamin, a cianursav és a triklozán is...

vasárnap 18:22

A Bitcoin majdnem felére zuhant 11 hónap alatt

Az utóbbi 11 hónap látványos zuhanást hozott a vezető kriptovaluta piacán...

vasárnap 17:56

A haldokló csillag fekete lyuk helyett új univerzumot szülhet

Érdemes megvizsgálni, hogy egy haldokló csillag végzete nem feltétlenül az, aminek eddig gondoltuk...

vasárnap 17:34

A SpaceX tőzsdei kibocsátása: mi lesz 1,3 milliárd dollárnyi bitcoinjával?

🚀 Ebből következően érdemes megérteni, hogy a SpaceX friss tőzsdére lépése nemcsak az irdatlan, mintegy 27 ezer milliárd forintos (75 milliárd USD) tőkebevonásáról szól, hanem arról is, hogy az eddigi legnagyobb, nyilvánosan bejelentett bitcoin-vagyonnal rendelkező cég került a tőzsdére...

vasárnap 17:23

Az eredeti, bontatlan Super Mario Bros. rekordot döntött: 3 millió dollár

🎮 Egy eredeti, gyári zárású Super Mario Bros. példány rekordáron, közel 1,1 milliárd forintért (3 millió USD) talált gazdára a június 12-i Heritage Auctions árverésen...

vasárnap 16:23

A versenyfutás az új Ebola-vakcina kifejlesztéséért

Az Ebola újabb járványát a Bundibugyo-vírus okozza a Kongói Demokratikus Köztársaságban és Ugandában, amely ellen eddig nem létezett hatékony oltás...

vasárnap 16:01

A tudósok szerint a papagájok neveken szólítják egymást

A papagájokat mindenki beszédutánzó képességükről ismeri, de most úgy tűnik, valójában nemcsak szavakat ismételgetnek, hanem a neveket is az emberekhez hasonlóan használhatják...

vasárnap 15:45

Az Artemis II egyszerre fotózta le mindkét félteke sarki fényét

A NASA Artemis II küldetésének négy űrhajósa különleges pillanatot örökített meg, amikor az Orion űrhajóval elhagyták a Földet, és a Hold felé indultak...

vasárnap 15:23

A rejtett vérnyomásérték, ami a szívedről és az agyadról mesél

💊 Ha vérnyomásmérésre gondolunk, legtöbben a karunkra szorított mandzsettára és a két jól ismert számra asszociálunk...

vasárnap 15:12

A Sony hátrál a PC-től – és így Kínától is

😢 A Sony meglepő visszalépése a PC-s játékkiadások terén nemcsak a PC-s játékosokat érinti, hanem Kínát is, ahol óriási kereslet mutatkozott az olyan címek iránt, mint a Halálháló 2 (Death Stranding 2)...

vasárnap 14:56

A Targetben árult organikus tápszert visszahívták botulizmus-járvány miatt

Az Egyesült Államok több államában csecsemőbotulizmus-fertőzés után visszahívták a Nara Organics organikus babatápszerét, amelyet országosan a Target üzleteiben és online árusítottak...

vasárnap 14:34

Az USA leállíttatta az Anthropic Fable 5, Mythos 5 nyilvános hozzáférését

Érdemes megvizsgálni, mi áll az Anthropic vezető MI-modelljeinek hirtelen lekapcsolása mögött, és milyen hatásai lehetnek az üzleti világ számára...

vasárnap 14:23

A Musk–Page szakítás ellenére a Google és a SpaceX közelebb mint valaha

Elon Musk és Larry Page egykor elválaszthatatlan barátok voltak, mostanra azonban kapcsolatuk inkább szoros üzleti versengéssé és érdekvezérelt együttműködéssé változott...

vasárnap 14:00

A brit rendőrt azzal vádolják, hogy MI-vel hamisított bizonyítékot

Bűnügyi vizsgálat indult az Egyesült Királyságban, miután egy rendőrt azzal gyanúsítanak, hogy mesterséges intelligencia segítségével hamisított bizonyítékokat több ügyben is...

vasárnap 13:55

Az első ember megkapta a sejtfiatalító terápiát – indul az időutazás?

Megérkezett a korszakváltó terápiák első hulláma: egy amerikai vállalat most először próbálja meg visszaforgatni az idő kerekét az emberi sejtekben...

vasárnap 13:44

Az új pacemaker forradalmasíthatja a szívbetegek kezelését

❤️ Külön említést érdemel, hogy a most kifejlesztett szívritmusszabályzó nem igényel műtéti beavatkozást az áramforrás cseréjéhez...

vasárnap 13:34

A Samsungod 5 rejtett funkciója, amiről te sem tudtál

Az Android világában a Samsung készülékek mindig kicsit többet adnak, mint az alapcsomag...

vasárnap 13:01

A sakktáblán életre kelnek: robotok küzdenek egymással

♘ A sakktáblák automatizálása már nem újdonság, hiszen eddig is akadtak olyan megoldások, ahol a bábuk alatt mágnes segítségével vagy kívülről, egy robotkarral mozgatták a figurákat...

vasárnap 12:56

A következő milliárdokat zsákmányoló kriptóhacker emberfeletti gyorsasággal csap le?

Anthropic vadonatúj MI-modellje, a Claude Fable 5, minden eddiginél összetettebb és gyorsabb érvelési és programozási képességeket kínál...

vasárnap 12:01

A lila USB-portok: miért vannak, és miért ritkák az USA-ban?

Sokan bele sem gondolunk, miért van az, hogy az USB-portok más-más színűek, amíg meg nem lepődünk egy különc lila vagy narancssárga csatlakozón...

vasárnap 11:45

A Copilot berobban az angol egészségügybe: félmillió dolgozó kap MI-t

💉 A brit egészségügy szemmel láthatóan komoly digitális fordulat elé néz: több mint félmillió orvos, nővér és háttérdolgozó kap hozzáférést a Microsoft 365 Copilot nevű MI-eszközhöz...