A mesterséges intelligencia új királya: a Gemini 3 diadalmenete

A mesterséges intelligencia új királya: a Gemini 3 diadalmenete
Érdekes felvetés, hogy a Google legújabb MI-modellje, a Gemini 3 alaposan felkavarta az iparágat. A keddi bemutatót követően szinte azonnal megjelentek a mémek, az elemzések, és még a legnagyobb versenytársak vezetői is elismerték a modell eredményeit. A Google Gemini 3 modelljét első nap beépítették a Google Keresőbe, és már a debütálás napján több mint egymillióan próbálták ki a Google AI Studio felületén és a Gemini API-n keresztül. A legújabb Gemini nemcsak az OpenAI legfrissebb fejlesztései előtt jár, hanem számos iparági mérőszám alapján vezeti is az MI-modellek rangsorát, például az LMArena toplistáját – ezt tekinthetjük a Billboard Hot 100 MI-megfelelőjének.

Látványos ugrás a teljesítményben

A Gemini 3 már első napján minden korábbi Google-modellnél nagyobb lendületet vett. A Google DeepMind vezetője, Logan Kilpatrick úgy fogalmazott: ilyen gyors elterjedést modelljük még nem tapasztalt. Még Sam Altman, az OpenAI vezetője, és Elon Musk, az xAI első embere is nyilvánosan gratulált a Google csapatának. Marc Benioff, a Salesforce vezérigazgatója azt írta: három év napi ChatGPT-használat után két órányi Gemini 3 minden korábbi tapasztalatát felülírta, mondván: Ez őrület – a következtetési képesség, a sebesség, a képek, a videó mind élesebb és gyorsabb, mintha ismét megváltozott volna a világ.

Wei-Lin Chiang, az LMArena társalapítója szerint a Gemini 3 Pro minden eddigi csúcsmodellt megelőz számos szakmai kategóriában: a kódolásban, matematikai feladatokban, kreatív írásban, sőt a vizuális megértésben is – itt elsőként lépte át az 1500-as pontszámot a platform szöveges toplistáján. A zászlóshajó képességei kiemelkednek: absztrakció, általánosítás, következetes teljesítmény, valamint változatos, valós értékelések során mutatott kiemelkedő eredmények.

Új mércét állít az MI-tesztekben

Alex Conway, a DataRobot vezető fejlesztője arra hívta fel a figyelmet, hogy a Gemini 3 szinte megduplázta bizonyos speciális logikai tesztek eredményeit, miközben a végrehajtási költsége tizede a riválisokénak. A SimpleQA-mérésen – ahol változatos, ritka tudást igénylő kérdésekre kell választ adni – a Gemini 3 Pro ismételten kétszer jobb eredményt ért el, mint az OpenAI GPT-5.1 modellje. Ez magyarázza, hogy a Gemini 3 a speciális témákban és a kutatásokban várhatóan egyre gyakrabban használt eszköz lesz.

A későbbiekben azonban érdemes óvatosan kezelni a toplistákat. Egy MI-modell lehet, hogy laboratóriumi körülmények között lenyűgöző, de a hétköznapi élet komplexitása más elvárásokat támaszt. Professzionális felhasználók szerint a Gemini 3 kiváló általános feladatokban, de az iparági réspiacokon vagy éles helyzetekben többnyire még nem váltja le a jól bevált alternatívákat.

A mindennapos munkában: forradalom vagy óvatosság?

Sokan továbbra is az Anthropic Claude modelljét részesítik előnyben kódoláshoz, mivel a Gemini 3, bár korszakos teljesítményt nyújt, a felhasználói élményben – például az utasítások pontos követésében – még elmarad a legjobbtól. Tim Dettmers, a Carnegie Mellon Egyetem oktatója úgy látja: a Gemini 3 ragyogó, de még kiforratlan a felhasználói élmény szempontjából.

Tulsee Doshi, a Google DeepMind termékigazgatója szerint a Gemini 3 Pro még csak az első tagja a teljes termékcsaládnak, így a további fejlesztések várhatóan orvosolják a fennálló hiányosságokat.

Joel Hron, a Thomson Reuters technológiai igazgatója saját tesztek alapján kiemeli, hogy a Gemini 3 minden releváns területen kimagasló, főként a hosszú dokumentumok és jogi szerződések értelmezésében, nagy ugrás a Gemini 2.5-höz képest, és többnyire az Anthropic, illetve az OpenAI modelljeit is felülmúlja.

Louis Blankemeier, a Cognita radiológiai MI-cég vezetője szerint lenyűgözőek a nyers számok. Ugyanakkor a gyakorlati hasznosság terén bőven akad még kérdőjel: a modell például nehezen ismeri fel a mellkasi röntgeneken a finomabb bordatöréseket vagy ritkább elváltozásokat. A radiológia hasonlóan bonyolult, mint az önvezető autók világa: a szélső esetek döntőek, így előfordulhat, hogy a régebbi, testre szabottabb modellekkel hatékonyabb a munka.

Hasonló tapasztalatai vannak Matt Hoffman-nak, a Longeye cég MI-vezetőjének is. Bár a Gemini 3 Pro-t kiszolgáló Nano Banana Pro képgenerátor kimagasló számokat produkál, a tesztelt benchmarkok nem mindig tükrözik éles felhasználási eseteik igényeit.


Integráció és folyamatos helyezkedés a mezőny élén

A különböző területeken dolgozó cégek továbbra is inkább modellkeveréket használnak. A Built például jelenleg a Google, az Anthropic és az OpenAI eszközeit ötvözi, hogy a komplex dokumentumcsomagokat és igényléseket elemezze. A multimodális feladatok, a nagy kontextusablak, valamint a delegált ügynökök együttesen emelik ki a Google új modelljét – de egyelőre csak vizsgálják a váltást.

Tanmai Gopal, a PromptQL alapítója szerint is érthető a felhajtás, de a versenynek koránt sincs vége; a gyors verzióváltások miatt mindig akad olyan modell, amely pár hétig vagy hónapig vezeti a mezőnyt. Például egy nappal a Gemini 3 debütálása után az OpenAI már ki is hozta a GPT-5.1-Codex-Max frissítését.

A PromptQL csapata egyelőre nem tapasztalt forradalmi különbségeket a jelenlegi kínálathoz képest, de valószínű, hogy a Gemini 3 végül alapértelmezetté válik a hétköznapi, kreatív és képalapú felhasználásokban.

Modern csodafegyver vagy újabb trükk?

Mint minden MI-modell, a Gemini 3 is képes különös hibákat produkálni: a tesztelők szerint bravúrosan teljesít összetett feladatokat, de néha egészen egyszerű kérdéseken akad el. Andrej Karpathy MI-kutató is kiemelte: személyiségben, szöveggenerálásban, programozásban, humorban kiemelkedő, mindennapi használatra tökéletes – de néha furcsán viselkedik, vagy eltéved az egyszerű információk kezelésénél.

A tapasztalatok alapján tehát a Gemini 3 valódi előrelépést jelent, de minden valószínűség szerint átmeneti az uralma a csúcson. Az MI-fejlesztés tempója szédítő, a technológia gyorsan átértékelődik, és hónapról hónapra új modellek tűnnek fel. A Gemini 3 azonban kétségkívül sok dimenzióban hozott érdemi javulást, nemcsak egy-egy részterületen, hanem az MI-fejlesztés szinte minden oldalán.

Ezáltal arra lehet következtetni, hogy az MI-fejlesztés versenye egyre kiélezettebb, de a Google most egy látványos körrel előzte meg a többieket – legalábbis egy időre.

2025, adminboss, www.theverge.com alapján

Legfrissebb posztok

vasárnap 00:01

Az okos varjak, akik megtisztítják a városainkat

🦉 A varjak mindig is különleges madarak voltak. Számtalan történet szól arról, hogy képesek megbarátkozni emberekkel, ajándékokat hoznak, sőt, olykor elveszett tárgyakat is visszaszolgáltatnak gazdáiknak...

Top
hétfő 16:50

Egyetemet végzett milliárdosok – ki mit végzett?

A közvéleményben gyakran keringenek olyan történetek, amelyek a felsőoktatásból kimaradó vállalkozókról szólnak...

MA 19:33

Az agykutatás új sztárjai: végre láthatjuk az igazi asztrocitákat

Az asztrociták a leggyakoribb és legrejtélyesebb agysejtek, amelyek kulcsfontosságú szerepet töltenek be az idegi kommunikáció szabályozásában és a vér–agy gát fenntartásában...

MA 19:01

Az MI-láz csúcsra járatja a memóriaválságot, a Lenovo készletez

A Lenovo, a világ legnagyobb PC-gyártója rekordmennyiségű memóriát és kulcsfontosságú alkatrészeket halmoz fel, hogy kivédje az MI-robbanás okozta ellátási gondokat...

MA 18:49

Az amerikai bankóriásokat újabb, összehangolt kibertámadás érte

💰 November közepén súlyos kibertámadás érte a New York-i SitusAMC nevű pénzügyi technológiai céget, amely több mint ezer banknak, jelzálogcégnek és ingatlanpiaci szereplőnek nyújt szolgáltatásokat...

MA 18:20

Az űrverseny új terepe: a Rocket Lab rákapcsol

🚀 A Rocket Lab idén történelmet írt, amikor 17 sikeres Electron-indítást teljesített, és ezzel új rekordot állított fel...

MA 17:50

Az új COVID-vakcinatechnológia áttörést hozhat a kígyómérgezés kezelésében

Az mRNS-alapú vakcinák, amelyek a COVID–19 elleni harc kulcsszereplői voltak, most reményt hozhatnak a kígyómarások áldozatainak is...

MA 17:01

A Mars új manővere végképp szertefoszlatja a marsi tó álmát

2018-ban a kutatók szenzációs hírt közöltek: a Mars felszíne alatt folyékony vízre utaló jeleket találtak a Mars Advanced Radar for Subsurface and Ionosphere Sounding (MARSIS) műszerrel...

MA 16:50

Az arany nyakék: a trón erejének jelképe

💍 Ez a hatodik századi arany pektorálé (mellékékszer) a bizánci ékszerkészítés egyik kivételes alkotása...

MA 16:33

Az MIT-botrány: kiderült, kamu volt a nagy MI-tanulmány

Májusban az MIT vezetősége bizalmatlanságot szavazott meg egy tudományos előpublikációval szemben, amely azt állította, hogy egy MI-alapú anyagtudományi felfedezőeszköz 1 018 amerikai kutatónak segített áttörő eredményekhez jutni...

MA 16:18

Az MI tényleg képes fénysebességgel gondolkodni?

⚡ A mesterséges intelligencia fejlődése régóta küzd egy alapvető akadállyal: a számítási sebesség és az energiafogyasztás együttes korlátaival...

MA 15:49

Az amerikai DJI-drónoknak tényleg befellegzett?

December 23-ig döntés születik a DJI sorsáról az Egyesült Államokban: ha a kínai vállalatot felveszik a Szövetségi Kommunikációs Bizottság (FCC) úgynevezett tiltólistájára, többé nem hozhatna forgalomba új termékeket az USA-ban...

MA 15:34

Az iPad végre ablakos – de tényleg kézre áll?

💻 Az iPadOS 26 az iPad egyik legnagyobb frissítése, amióta 2010-ben bemutatták az első modellt...

MA 15:17

A CERN új MI-szabályai: így használhatod a mesterséges intelligenciát

A svájci CERN-ben a mesterséges intelligencia ma már mindenütt jelen van: bekerült az eszközökbe, a szoftverekbe, a felhőszolgáltatásokba, de a dolgozók is bevihetik, vagy akár saját maguk is fejleszthetnek MI-megoldásokat...

MA 14:49

A Windows 11 fájlkezelője végre villámgyors és átlátható lesz

⚡ A Microsoft új változtatásokat vezet be a Windows 11 Fájlkezelőjében, hogy gyorsabban induljon, különösen gyengébb hardveren, például tableteken vagy kézi számítógépeken...

MA 14:36

A mesterséges tartalom viharában: videósok harca az MI-vel

📹 Fontos kérdés, hogy az MI-videók rohamos fejlődése miként alakítja át a filmes ipart, és milyen gazdasági, etikai, valamint művészi feszültségeket szül a szakmán belül...

MA 14:17

Az olcsóbb OnePlus 15R és az új kütyük rajtja csúszik

🕒 Az OnePlus idén bemutatta a nagy akkumulátorral felszerelt OnePlus 15-öt, ám az olcsóbb OnePlus 15R bemutatása elmaradt...

MA 14:02

Az elveszett Darwin-címjegyzék nyomában: feltárulnak a titkok

A National University of Singapore (NUS) munkatársai egyedülálló dokumentumot tettek közzé: Charles Darwin eddig ismeretlen címjegyzékének teljes szövegét és átiratát...

MA 13:49

Az olcsó MI-oktatás felbőszítette a brit egyetemistákat

Negyvenegy diák, köztük James és Owen, a University of Staffordshire programozási kurzusán vett részt, abban bízva, hogy egy államilag támogatott programnak köszönhetően kiberbiztonsági szakember vagy szoftvermérnök lehet belőlük...