A mesterséges intelligencia új királya: a Gemini 3 diadalmenete

A mesterséges intelligencia új királya: a Gemini 3 diadalmenete
Érdekes felvetés, hogy a Google legújabb MI-modellje, a Gemini 3 alaposan felkavarta az iparágat. A keddi bemutatót követően szinte azonnal megjelentek a mémek, az elemzések, és még a legnagyobb versenytársak vezetői is elismerték a modell eredményeit. A Google Gemini 3 modelljét első nap beépítették a Google Keresőbe, és már a debütálás napján több mint egymillióan próbálták ki a Google AI Studio felületén és a Gemini API-n keresztül. A legújabb Gemini nemcsak az OpenAI legfrissebb fejlesztései előtt jár, hanem számos iparági mérőszám alapján vezeti is az MI-modellek rangsorát, például az LMArena toplistáját – ezt tekinthetjük a Billboard Hot 100 MI-megfelelőjének.

Látványos ugrás a teljesítményben

A Gemini 3 már első napján minden korábbi Google-modellnél nagyobb lendületet vett. A Google DeepMind vezetője, Logan Kilpatrick úgy fogalmazott: ilyen gyors elterjedést modelljük még nem tapasztalt. Még Sam Altman, az OpenAI vezetője, és Elon Musk, az xAI első embere is nyilvánosan gratulált a Google csapatának. Marc Benioff, a Salesforce vezérigazgatója azt írta: három év napi ChatGPT-használat után két órányi Gemini 3 minden korábbi tapasztalatát felülírta, mondván: Ez őrület – a következtetési képesség, a sebesség, a képek, a videó mind élesebb és gyorsabb, mintha ismét megváltozott volna a világ.

Wei-Lin Chiang, az LMArena társalapítója szerint a Gemini 3 Pro minden eddigi csúcsmodellt megelőz számos szakmai kategóriában: a kódolásban, matematikai feladatokban, kreatív írásban, sőt a vizuális megértésben is – itt elsőként lépte át az 1500-as pontszámot a platform szöveges toplistáján. A zászlóshajó képességei kiemelkednek: absztrakció, általánosítás, következetes teljesítmény, valamint változatos, valós értékelések során mutatott kiemelkedő eredmények.

Új mércét állít az MI-tesztekben

Alex Conway, a DataRobot vezető fejlesztője arra hívta fel a figyelmet, hogy a Gemini 3 szinte megduplázta bizonyos speciális logikai tesztek eredményeit, miközben a végrehajtási költsége tizede a riválisokénak. A SimpleQA-mérésen – ahol változatos, ritka tudást igénylő kérdésekre kell választ adni – a Gemini 3 Pro ismételten kétszer jobb eredményt ért el, mint az OpenAI GPT-5.1 modellje. Ez magyarázza, hogy a Gemini 3 a speciális témákban és a kutatásokban várhatóan egyre gyakrabban használt eszköz lesz.

A későbbiekben azonban érdemes óvatosan kezelni a toplistákat. Egy MI-modell lehet, hogy laboratóriumi körülmények között lenyűgöző, de a hétköznapi élet komplexitása más elvárásokat támaszt. Professzionális felhasználók szerint a Gemini 3 kiváló általános feladatokban, de az iparági réspiacokon vagy éles helyzetekben többnyire még nem váltja le a jól bevált alternatívákat.

A mindennapos munkában: forradalom vagy óvatosság?

Sokan továbbra is az Anthropic Claude modelljét részesítik előnyben kódoláshoz, mivel a Gemini 3, bár korszakos teljesítményt nyújt, a felhasználói élményben – például az utasítások pontos követésében – még elmarad a legjobbtól. Tim Dettmers, a Carnegie Mellon Egyetem oktatója úgy látja: a Gemini 3 ragyogó, de még kiforratlan a felhasználói élmény szempontjából.

Tulsee Doshi, a Google DeepMind termékigazgatója szerint a Gemini 3 Pro még csak az első tagja a teljes termékcsaládnak, így a további fejlesztések várhatóan orvosolják a fennálló hiányosságokat.

Joel Hron, a Thomson Reuters technológiai igazgatója saját tesztek alapján kiemeli, hogy a Gemini 3 minden releváns területen kimagasló, főként a hosszú dokumentumok és jogi szerződések értelmezésében, nagy ugrás a Gemini 2.5-höz képest, és többnyire az Anthropic, illetve az OpenAI modelljeit is felülmúlja.

Louis Blankemeier, a Cognita radiológiai MI-cég vezetője szerint lenyűgözőek a nyers számok. Ugyanakkor a gyakorlati hasznosság terén bőven akad még kérdőjel: a modell például nehezen ismeri fel a mellkasi röntgeneken a finomabb bordatöréseket vagy ritkább elváltozásokat. A radiológia hasonlóan bonyolult, mint az önvezető autók világa: a szélső esetek döntőek, így előfordulhat, hogy a régebbi, testre szabottabb modellekkel hatékonyabb a munka.

Hasonló tapasztalatai vannak Matt Hoffman-nak, a Longeye cég MI-vezetőjének is. Bár a Gemini 3 Pro-t kiszolgáló Nano Banana Pro képgenerátor kimagasló számokat produkál, a tesztelt benchmarkok nem mindig tükrözik éles felhasználási eseteik igényeit.


Integráció és folyamatos helyezkedés a mezőny élén

A különböző területeken dolgozó cégek továbbra is inkább modellkeveréket használnak. A Built például jelenleg a Google, az Anthropic és az OpenAI eszközeit ötvözi, hogy a komplex dokumentumcsomagokat és igényléseket elemezze. A multimodális feladatok, a nagy kontextusablak, valamint a delegált ügynökök együttesen emelik ki a Google új modelljét – de egyelőre csak vizsgálják a váltást.

Tanmai Gopal, a PromptQL alapítója szerint is érthető a felhajtás, de a versenynek koránt sincs vége; a gyors verzióváltások miatt mindig akad olyan modell, amely pár hétig vagy hónapig vezeti a mezőnyt. Például egy nappal a Gemini 3 debütálása után az OpenAI már ki is hozta a GPT-5.1-Codex-Max frissítését.

A PromptQL csapata egyelőre nem tapasztalt forradalmi különbségeket a jelenlegi kínálathoz képest, de valószínű, hogy a Gemini 3 végül alapértelmezetté válik a hétköznapi, kreatív és képalapú felhasználásokban.

Modern csodafegyver vagy újabb trükk?

Mint minden MI-modell, a Gemini 3 is képes különös hibákat produkálni: a tesztelők szerint bravúrosan teljesít összetett feladatokat, de néha egészen egyszerű kérdéseken akad el. Andrej Karpathy MI-kutató is kiemelte: személyiségben, szöveggenerálásban, programozásban, humorban kiemelkedő, mindennapi használatra tökéletes – de néha furcsán viselkedik, vagy eltéved az egyszerű információk kezelésénél.

A tapasztalatok alapján tehát a Gemini 3 valódi előrelépést jelent, de minden valószínűség szerint átmeneti az uralma a csúcson. Az MI-fejlesztés tempója szédítő, a technológia gyorsan átértékelődik, és hónapról hónapra új modellek tűnnek fel. A Gemini 3 azonban kétségkívül sok dimenzióban hozott érdemi javulást, nemcsak egy-egy részterületen, hanem az MI-fejlesztés szinte minden oldalán.

Ezáltal arra lehet következtetni, hogy az MI-fejlesztés versenye egyre kiélezettebb, de a Google most egy látványos körrel előzte meg a többieket – legalábbis egy időre.

2025, adminboss, www.theverge.com alapján

Legfrissebb posztok

szombat 20:52

A CES 2026-on aranyos és félelmetes robotok szabadulnak el

🤖 Érdemes megvizsgálni, hogy a 2026-os Las Vegas-i CES vásáron milyen változatos és meglepő robotokkal találkozhattunk...

szombat 20:35

Az amerikai kriptoautomaták napjai meg vannak számlálva?

💸 A kriptovaluta-automaták, vagyis azok a gépek, amelyek készpénzt alakítanak át digitális valutává, az utóbbi években az átverések első számú eszközévé váltak Amerikában...

szombat 20:18

Az új óriáskígyó felfedi Amazónia legmélyebb titkát

Egy lényeges szempont, hogy az amazóniai esőerdő mélyén nemrég egy új, eddig ismeretlen óriásanakonda-faj bukkant elő a tudósok előtt...

szombat 20:02

Az MI nem váltja ki az embert, mégis minden PC-be költözik

🤖 A Lenovo vezérigazgatója, Yuanqing Yang szerint 2026 végére a vállalati piacra szánt számítógépek fele már MI-alapú lesz...

szombat 19:49

Az első vészhelyzeti ISS-evakuálás: bajba jutott űrhajósok hazatérnek

🚀 Négy űrhajós térhet vissza a Földre először kényszerű evakuálás miatt, miután egyikük rejtélyes, súlyos egészségügyi problémával küzd az ISS-en...

szombat 19:34

Az Ariane–6 újrafelhasználása: Európa Frankenstein-rakétája?

Az európai űripar évtizedekig a hagyományos rakéták egyszer használatos, eldobható modelljéhez ragaszkodott, miközben a világban egyre nagyobb hangsúlyt kapott az újrahasználat...

szombat 19:18

Az év, ami nem négyzetszám, mégis izgalmas: 2026 matematikai titkai

🧠 Érdemes megérteni, hogy bár a 2026-os év első ránézésre nem tűnik rendkívülinek, számos matematikai érdekességet rejt...

szombat 19:01

Az eddigi leglassabb Windows? A Windows 11 legnagyobb bakijai

A legtöbb felhasználó szerint a Windows 11 nemcsak tele van felesleges funkciókkal, amelyeket nehéz kikapcsolni, hanem teljesítményben is nagy csalódást okoz...

szombat 18:50

A kihalt dinoszauruszok és a szunnyadó fekete lyuk rejtélyei

🦖 Boldog új évet! Idén is akadnak meglepő felfedezések: például hogy a vöröshajúak hajpigmentje különleges, és egy regeneratív nanotechnológia képes lehet védeni az agyat...

szombat 18:33

Az iLO 6-ban ez változik, ha Essentialsról Advancedre lépsz

Sokan megszokták, hogy az iLO Advanced funkcióit használják a HPE szervereken, de vannak rendszerek, amelyek csak az alap Essentials kiadással érkeznek...

szombat 18:19

Az okosszemüvegek forradalma: a CES 2026 legütősebb modelljei

👓 Az idei CES kiállításon Las Vegasban az okosszemüvegek vitték a prímet, soha nem látott választékban...

szombat 17:49

Az ír útlevélbotrány: 13 ezer hibás okmányt hívnak vissza

Írország külügyminisztériuma csaknem 13 000 útlevelet hív vissza, mert egy szoftverfrissítés hibája miatt hibásan nyomtatták ki azokat...

szombat 17:33

A kialvatlanság éveket rabol az életedből

🛍 Érdemes megvizsgálni, milyen komoly következményei lehetnek a kevés alvásnak. Rendszeresen kevesebb mint hét órát aludni nemcsak fáradttá tesz, hanem években mérhetően megrövidítheti az életedet...

szombat 17:18

Az űróriás Pandora hamarosan a rejtélyes exobolygók nyomába ered

🚀 A Pandora nevű, hűtőszekrénynyi műhold minden eddiginél pontosabban vizsgálja majd a Naprendszeren túli bolygókat...

szombat 17:02

A bitcoin 2050-re 2,9 millió dollárt érhet – veri az aranyat?

💵 A VanEck alapkezelő szerint a bitcoin elképesztő, 2,9 millió dolláros (kb...

szombat 16:50

Az űrállomás első orvosi mentése: ki a beteg űrhajós?

A NASA váratlanul, néhány nappal a tervezett időpont előtt hazahozza a Nemzetközi Űrállomás négyfős legénységét az egyik űrhajósnál fellépő egészségügyi probléma miatt...

szombat 16:17

Az iPhone Air 2: szebb kijelző, nagyobb akku – de kinek kell?

📱 Az Apple hamarosan újít az iPhone Air-szérián. Bár a jelenlegi modell nem váltotta be igazán a vállalat reményeit, a pletykák szerint 2027-ben jöhet az iPhone Air 2...

szombat 16:04

Az elegáns Goldring GR3 hódít, de egy dolog beárnyékolja

🎧 Érdemes észben tartani, hogy a Goldring hosszú kihagyás után, mintegy húsz év elteltével tér vissza a lemezjátszók világába, méghozzá egy olyan készülékkel, amely egyenlő arányban kínál kényelmet, minőséget és látványos megjelenést...

szombat 15:49

Az életért folyik a harc a Fülöp-szigeteki lerakóomlás után

A Fülöp-szigeteki Cebu városában már napok óta tart a küzdelem a Binaliw nevű hulladéklerakó összeomlása után, ahol a mentők versenyt futnak az idővel, hogy rátaláljanak a több mint harminc eltűnt dolgozóra...