2025. 11. 24., 19:19

A mesterséges intelligencia új királya: a Gemini 3 diadalmenete

A mesterséges intelligencia új királya: a Gemini 3 diadalmenete
Érdekes felvetés, hogy a Google legújabb MI-modellje, a Gemini 3 alaposan felkavarta az iparágat. A keddi bemutatót követően szinte azonnal megjelentek a mémek, az elemzések, és még a legnagyobb versenytársak vezetői is elismerték a modell eredményeit. A Google Gemini 3 modelljét első nap beépítették a Google Keresőbe, és már a debütálás napján több mint egymillióan próbálták ki a Google AI Studio felületén és a Gemini API-n keresztül. A legújabb Gemini nemcsak az OpenAI legfrissebb fejlesztései előtt jár, hanem számos iparági mérőszám alapján vezeti is az MI-modellek rangsorát, például az LMArena toplistáját – ezt tekinthetjük a Billboard Hot 100 MI-megfelelőjének.

Látványos ugrás a teljesítményben

A Gemini 3 már első napján minden korábbi Google-modellnél nagyobb lendületet vett. A Google DeepMind vezetője, Logan Kilpatrick úgy fogalmazott: ilyen gyors elterjedést modelljük még nem tapasztalt. Még Sam Altman, az OpenAI vezetője, és Elon Musk, az xAI első embere is nyilvánosan gratulált a Google csapatának. Marc Benioff, a Salesforce vezérigazgatója azt írta: három év napi ChatGPT-használat után két órányi Gemini 3 minden korábbi tapasztalatát felülírta, mondván: Ez őrület – a következtetési képesség, a sebesség, a képek, a videó mind élesebb és gyorsabb, mintha ismét megváltozott volna a világ.

Wei-Lin Chiang, az LMArena társalapítója szerint a Gemini 3 Pro minden eddigi csúcsmodellt megelőz számos szakmai kategóriában: a kódolásban, matematikai feladatokban, kreatív írásban, sőt a vizuális megértésben is – itt elsőként lépte át az 1500-as pontszámot a platform szöveges toplistáján. A zászlóshajó képességei kiemelkednek: absztrakció, általánosítás, következetes teljesítmény, valamint változatos, valós értékelések során mutatott kiemelkedő eredmények.

Új mércét állít az MI-tesztekben

Alex Conway, a DataRobot vezető fejlesztője arra hívta fel a figyelmet, hogy a Gemini 3 szinte megduplázta bizonyos speciális logikai tesztek eredményeit, miközben a végrehajtási költsége tizede a riválisokénak. A SimpleQA-mérésen – ahol változatos, ritka tudást igénylő kérdésekre kell választ adni – a Gemini 3 Pro ismételten kétszer jobb eredményt ért el, mint az OpenAI GPT-5.1 modellje. Ez magyarázza, hogy a Gemini 3 a speciális témákban és a kutatásokban várhatóan egyre gyakrabban használt eszköz lesz.

A későbbiekben azonban érdemes óvatosan kezelni a toplistákat. Egy MI-modell lehet, hogy laboratóriumi körülmények között lenyűgöző, de a hétköznapi élet komplexitása más elvárásokat támaszt. Professzionális felhasználók szerint a Gemini 3 kiváló általános feladatokban, de az iparági réspiacokon vagy éles helyzetekben többnyire még nem váltja le a jól bevált alternatívákat.

A mindennapos munkában: forradalom vagy óvatosság?

Sokan továbbra is az Anthropic Claude modelljét részesítik előnyben kódoláshoz, mivel a Gemini 3, bár korszakos teljesítményt nyújt, a felhasználói élményben – például az utasítások pontos követésében – még elmarad a legjobbtól. Tim Dettmers, a Carnegie Mellon Egyetem oktatója úgy látja: a Gemini 3 ragyogó, de még kiforratlan a felhasználói élmény szempontjából.

Tulsee Doshi, a Google DeepMind termékigazgatója szerint a Gemini 3 Pro még csak az első tagja a teljes termékcsaládnak, így a további fejlesztések várhatóan orvosolják a fennálló hiányosságokat.

Joel Hron, a Thomson Reuters technológiai igazgatója saját tesztek alapján kiemeli, hogy a Gemini 3 minden releváns területen kimagasló, főként a hosszú dokumentumok és jogi szerződések értelmezésében, nagy ugrás a Gemini 2.5-höz képest, és többnyire az Anthropic, illetve az OpenAI modelljeit is felülmúlja.

Louis Blankemeier, a Cognita radiológiai MI-cég vezetője szerint lenyűgözőek a nyers számok. Ugyanakkor a gyakorlati hasznosság terén bőven akad még kérdőjel: a modell például nehezen ismeri fel a mellkasi röntgeneken a finomabb bordatöréseket vagy ritkább elváltozásokat. A radiológia hasonlóan bonyolult, mint az önvezető autók világa: a szélső esetek döntőek, így előfordulhat, hogy a régebbi, testre szabottabb modellekkel hatékonyabb a munka.

Hasonló tapasztalatai vannak Matt Hoffman-nak, a Longeye cég MI-vezetőjének is. Bár a Gemini 3 Pro-t kiszolgáló Nano Banana Pro képgenerátor kimagasló számokat produkál, a tesztelt benchmarkok nem mindig tükrözik éles felhasználási eseteik igényeit.


Integráció és folyamatos helyezkedés a mezőny élén

A különböző területeken dolgozó cégek továbbra is inkább modellkeveréket használnak. A Built például jelenleg a Google, az Anthropic és az OpenAI eszközeit ötvözi, hogy a komplex dokumentumcsomagokat és igényléseket elemezze. A multimodális feladatok, a nagy kontextusablak, valamint a delegált ügynökök együttesen emelik ki a Google új modelljét – de egyelőre csak vizsgálják a váltást.

Tanmai Gopal, a PromptQL alapítója szerint is érthető a felhajtás, de a versenynek koránt sincs vége; a gyors verzióváltások miatt mindig akad olyan modell, amely pár hétig vagy hónapig vezeti a mezőnyt. Például egy nappal a Gemini 3 debütálása után az OpenAI már ki is hozta a GPT-5.1-Codex-Max frissítését.

A PromptQL csapata egyelőre nem tapasztalt forradalmi különbségeket a jelenlegi kínálathoz képest, de valószínű, hogy a Gemini 3 végül alapértelmezetté válik a hétköznapi, kreatív és képalapú felhasználásokban.

Modern csodafegyver vagy újabb trükk?

Mint minden MI-modell, a Gemini 3 is képes különös hibákat produkálni: a tesztelők szerint bravúrosan teljesít összetett feladatokat, de néha egészen egyszerű kérdéseken akad el. Andrej Karpathy MI-kutató is kiemelte: személyiségben, szöveggenerálásban, programozásban, humorban kiemelkedő, mindennapi használatra tökéletes – de néha furcsán viselkedik, vagy eltéved az egyszerű információk kezelésénél.

A tapasztalatok alapján tehát a Gemini 3 valódi előrelépést jelent, de minden valószínűség szerint átmeneti az uralma a csúcson. Az MI-fejlesztés tempója szédítő, a technológia gyorsan átértékelődik, és hónapról hónapra új modellek tűnnek fel. A Gemini 3 azonban kétségkívül sok dimenzióban hozott érdemi javulást, nemcsak egy-egy részterületen, hanem az MI-fejlesztés szinte minden oldalán.

Ezáltal arra lehet következtetni, hogy az MI-fejlesztés versenye egyre kiélezettebb, de a Google most egy látványos körrel előzte meg a többieket – legalábbis egy időre.

2025, adminboss, www.theverge.com alapján

Legfrissebb posztok

MA 10:50

Az Artemis II űrhajósai diadalmasan tértek vissza holdkerülő küldetésükről

Tíznapos holdkerülő útjuk után sikeresen visszatértek az Artemis II űrhajósai. Az Orion kapszula április 10-én magyar idő szerint éjjel 2:07-kor csapódott a Csendes-óceánba San Diego partjainál, pontosan a terveknek megfelelően...

MA 10:44

A Hold első színes képei forradalmasítják az űrkutatást

Az Artemis II holdmisszió lenyűgöző képei máris heves izgalmat váltottak ki a geológusok és a kutatók körében...

MA 10:36

Az óriások csatája: a Binance és az OKX alapítói a múlton marakodnak

A Binance és az OKX, a világ két legnagyobb kriptotőzsdéjének alapítói ismét egymásnak estek...

MA 10:22

Az új akkumulátorbiztonság valójában új veszélyforrás?

Egy lényeges szempont, hogy a Battle Born LFP-akkumulátorok egyes felhasználói sötétre elszíneződött pozitív sarukat és a túlmelegedésre utaló jeleket tapasztaltak...

MA 10:01

Az amerikai kormány most gamereket toborozna légiforgalmi irányítónak

🛩 Az Egyesült Államok kormánya újra a játékosokat célozza, most azonban nem reklámkampányhoz, hanem komoly toborzáshoz: légiirányítókat keres, és azt állítja, hogy ez valódi karrier...

MA 09:59

A félelmetes MI: miért imádunk rettegni tőle?

Érdekes felvetés, hogy az MI-vel kapcsolatos félelmeink gyakran túlmutatnak a valóságon...

MA 09:50

Ez az óriási gamer tablet, amire végre mindenki várt?

A Lenovo ismét meglepetéssel készül a mobiljátékok szerelmeseinek: egy új, nagyképernyős, Legion-márkás tableten dolgoznak, melynek prototípusát nemrég egy alkalmazott mutatta be Weibo-oldalán...

MA 09:43

Az Amazon Prime titkos benzinkedvezménye, amiről alig tud valaki

🚗 Amerikában simán spórolhatsz tankolásnál, ha van Amazon Prime-tagságod, de ezt alig tudja valaki!..

MA 09:36

Az Epic Disney-vel támad vissza egy új játékkal

🎮 Érdemes megvizsgálni, mire készül az Epic Games a Disneyvel közösen: a hírek szerint novemberben érkezhet egy Disney-univerzumra épülő extraction shooter, amely az Arc Raiders mechanikáit követi...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 4/11

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     TrailPin (iPhone/iPad)A TrailPin egy sokoldalú, magyar nyelven is elérhető alkalmazás, amely minden természetkedvelő számára hasznos társ...

MA 09:02

Az Artemis II legénysége épségben hazatért a Hold mellől

A négy űrhajósból – Reid Wiseman, Victor Glover, Christina Koch és Jeremy Hansen – álló Artemis II legénysége pénteken biztonságosan vízre szállt a Csendes-óceánban, San Diego partjaitól nyugatra...

MA 08:57

A bukás szélén a bhutáni bitcoin-kísérlet

💸 Egyre több jel utal arra, hogy Bhután, a Himalája rejtett gyöngyszeme, csendben likvidálja szinte teljes bitcoin-vagyonát, amelyet saját vízerőműveire alapozva szerzett...

MA 08:51

Az MI új divatszava: a trendslop sötét oldala

A tanácsadók szerepe az üzleti és kormányzati életben évtizedek óta vitatott...

MA 08:45

Az internet őre: a Cloudflare 500 Tbps-os hálózata

🛠 Tizenhat év alatt a Cloudflare globális hálózata elképesztő méretre nőtt, ma már meghaladja az 500 terabit/másodperces (Tbps) külső kapacitást...

MA 08:37

Az egyetlen DNS-csere hím nemi szervet növeszt a nőstény egereknek

👀 A kutatók felfedezték, hogy mindössze egyetlen DNS-bázispár módosítása elegendő ahhoz, hogy nőstény egerek embrionális fejlődése során hím nemi szervek és herék fejlődjenek ki...

MA 08:23

Az Artemis II után jön a NASA nagy dobása?

Péntek este valóban új korszak kezdődött az űrkutatásban: a NASA négy űrhajóst vitt a Hold körül, több mint 1,1 millió kilométert megtéve, majd sikeresen visszahozta őket a Csendes-óceánba, Kalifornia partjai közelében...

MA 08:15

A nagy dobás: az Arc Launcher Google- és Apple TV-hangulattal

Nem mindenki elégedett a Google TV alapértelmezett kinézetével, de hát persze, hogy erre is van már menő alternatíva: itt a vadiúj Arc Launcher...

MA 08:10

Az Orion diadalmas visszatérése: földet ért az Artemis II legénysége

Péntek este az Artemis II űrhajósai sikeresen visszatértek a Földre, amikor az Orion kapszula a Csendes-óceánba csobbant San Diego partjainál...

MA 08:02

Az MI-chipforradalom két nagy nyertese: az AMD és a Broadcom

Felmerül a kérdés, hogy vajon miért szárnyal egyszerre két, egészen eltérő üzleti modellben mozgó MI-chipgyártó a tőzsdén...

MA 07:57

Az OpenAI-vezér célkeresztben: Molotov-koktél és fenyegetések San Franciscóban

🚨 Péntek hajnalban valaki Molotov-koktéllal dobta meg Sam Altman, az OpenAI vezérigazgatójának otthonát San Franciscóban...

MA 07:50

Az univerzum titokzatos részecskéje: új mérések, még több kérdés

A fizikusoknak ismét sikerült pontosabban megmérniük az egyik legnehezebb alapvető részecske, a W-bozon tömegét...

MA 07:45

Az Artemis II történelmet írt: épségben hazatért a legénység

🚀 Fontos kérdés, hogy a hosszú évek óta várt visszatérés után az Egyesült Államok újra érdemi lépést tett a Hold felfedezése felé...

MA 07:37

Az MI-vezérelt hadijátékok rendre atomcsapásba torkollnak

A hadseregek és hírszerző szervezetek egyre gyakrabban támaszkodnak mesterségesintelligencia-rendszerekre, például az információk gyorsabb feldolgozásában vagy válsághelyzetek tervezésében...

MA 07:30

A Yellowstone titka az eltűnt Farallon-lemezben rejtőzik?

📌 Különösen igaz ez akkor, ha Amerika nyugati felét vizsgáljuk: a mai Észak-Amerika számos tájegysége nem létezne a valaha volt Farallon-lemez nélkül...

MA 07:22

Az MI‑felhasználók isszák meg a levét: újabb Microsoft-botrány

Ilyen eset például, amikor a Microsoft minden lehetséges helyre betuszkolja a Copilotot a Windows rendszerben, anélkül hogy erről a felhasználók szabadon dönthetnének...

MA 07:15

Az igazi luxus: tényleg spórol Bill Gates lánya?

💰 Egyetlen virális X-poszt miatt robbant fel a net: Phoebe Gates, Bill Gates és Melinda French Gates legfiatalabb lánya épp egy startupról tárgyalt egy influenszerrel...

MA 07:08

Az Intuit mesterséges intelligenciája forradalmasítja az adózást

Érdemes megvizsgálni, hogy miként sikerült az Intuit fejlesztőcsapatának néhány hónapnyi adótörvény-feldolgozást néhány órába sűríteni, miközben olyan munkafolyamatot dolgoztak ki, amelyből bármelyik szabályozott iparág profitálhat...

MA 07:02

Az FAA a gamerekre vadászik légiforgalmi irányítónak

🛩 A légiforgalmi irányítók hiánya egyre nagyobb problémát jelent az Egyesült Államokban, ezért most a Szövetségi Légügyi Hivatal szokatlan módszerhez nyúl: kifejezetten játékosokat szólít meg új kampányában...

MA 06:58

Az Artemis II történelmet írt: véget ért a rekorddöntő holdkerülés

🚀 Péntek este látványos vízreszállással ért véget az Artemis II küldetés, amikor az Orion űrkapszula mintegy 15 perces, izzó légkörön való áthaladás után biztonságosan a Csendes-óceánba csapódott San Diego partjainál...