A mesterséges intelligencia új királya: a Gemini 3 diadalmenete

A mesterséges intelligencia új királya: a Gemini 3 diadalmenete
Érdekes felvetés, hogy a Google legújabb MI-modellje, a Gemini 3 alaposan felkavarta az iparágat. A keddi bemutatót követően szinte azonnal megjelentek a mémek, az elemzések, és még a legnagyobb versenytársak vezetői is elismerték a modell eredményeit. A Google Gemini 3 modelljét első nap beépítették a Google Keresőbe, és már a debütálás napján több mint egymillióan próbálták ki a Google AI Studio felületén és a Gemini API-n keresztül. A legújabb Gemini nemcsak az OpenAI legfrissebb fejlesztései előtt jár, hanem számos iparági mérőszám alapján vezeti is az MI-modellek rangsorát, például az LMArena toplistáját – ezt tekinthetjük a Billboard Hot 100 MI-megfelelőjének.

Látványos ugrás a teljesítményben

A Gemini 3 már első napján minden korábbi Google-modellnél nagyobb lendületet vett. A Google DeepMind vezetője, Logan Kilpatrick úgy fogalmazott: ilyen gyors elterjedést modelljük még nem tapasztalt. Még Sam Altman, az OpenAI vezetője, és Elon Musk, az xAI első embere is nyilvánosan gratulált a Google csapatának. Marc Benioff, a Salesforce vezérigazgatója azt írta: három év napi ChatGPT-használat után két órányi Gemini 3 minden korábbi tapasztalatát felülírta, mondván: Ez őrület – a következtetési képesség, a sebesség, a képek, a videó mind élesebb és gyorsabb, mintha ismét megváltozott volna a világ.

Wei-Lin Chiang, az LMArena társalapítója szerint a Gemini 3 Pro minden eddigi csúcsmodellt megelőz számos szakmai kategóriában: a kódolásban, matematikai feladatokban, kreatív írásban, sőt a vizuális megértésben is – itt elsőként lépte át az 1500-as pontszámot a platform szöveges toplistáján. A zászlóshajó képességei kiemelkednek: absztrakció, általánosítás, következetes teljesítmény, valamint változatos, valós értékelések során mutatott kiemelkedő eredmények.

Új mércét állít az MI-tesztekben

Alex Conway, a DataRobot vezető fejlesztője arra hívta fel a figyelmet, hogy a Gemini 3 szinte megduplázta bizonyos speciális logikai tesztek eredményeit, miközben a végrehajtási költsége tizede a riválisokénak. A SimpleQA-mérésen – ahol változatos, ritka tudást igénylő kérdésekre kell választ adni – a Gemini 3 Pro ismételten kétszer jobb eredményt ért el, mint az OpenAI GPT-5.1 modellje. Ez magyarázza, hogy a Gemini 3 a speciális témákban és a kutatásokban várhatóan egyre gyakrabban használt eszköz lesz.

A későbbiekben azonban érdemes óvatosan kezelni a toplistákat. Egy MI-modell lehet, hogy laboratóriumi körülmények között lenyűgöző, de a hétköznapi élet komplexitása más elvárásokat támaszt. Professzionális felhasználók szerint a Gemini 3 kiváló általános feladatokban, de az iparági réspiacokon vagy éles helyzetekben többnyire még nem váltja le a jól bevált alternatívákat.

A mindennapos munkában: forradalom vagy óvatosság?

Sokan továbbra is az Anthropic Claude modelljét részesítik előnyben kódoláshoz, mivel a Gemini 3, bár korszakos teljesítményt nyújt, a felhasználói élményben – például az utasítások pontos követésében – még elmarad a legjobbtól. Tim Dettmers, a Carnegie Mellon Egyetem oktatója úgy látja: a Gemini 3 ragyogó, de még kiforratlan a felhasználói élmény szempontjából.

Tulsee Doshi, a Google DeepMind termékigazgatója szerint a Gemini 3 Pro még csak az első tagja a teljes termékcsaládnak, így a további fejlesztések várhatóan orvosolják a fennálló hiányosságokat.

Joel Hron, a Thomson Reuters technológiai igazgatója saját tesztek alapján kiemeli, hogy a Gemini 3 minden releváns területen kimagasló, főként a hosszú dokumentumok és jogi szerződések értelmezésében, nagy ugrás a Gemini 2.5-höz képest, és többnyire az Anthropic, illetve az OpenAI modelljeit is felülmúlja.

Louis Blankemeier, a Cognita radiológiai MI-cég vezetője szerint lenyűgözőek a nyers számok. Ugyanakkor a gyakorlati hasznosság terén bőven akad még kérdőjel: a modell például nehezen ismeri fel a mellkasi röntgeneken a finomabb bordatöréseket vagy ritkább elváltozásokat. A radiológia hasonlóan bonyolult, mint az önvezető autók világa: a szélső esetek döntőek, így előfordulhat, hogy a régebbi, testre szabottabb modellekkel hatékonyabb a munka.

Hasonló tapasztalatai vannak Matt Hoffman-nak, a Longeye cég MI-vezetőjének is. Bár a Gemini 3 Pro-t kiszolgáló Nano Banana Pro képgenerátor kimagasló számokat produkál, a tesztelt benchmarkok nem mindig tükrözik éles felhasználási eseteik igényeit.


Integráció és folyamatos helyezkedés a mezőny élén

A különböző területeken dolgozó cégek továbbra is inkább modellkeveréket használnak. A Built például jelenleg a Google, az Anthropic és az OpenAI eszközeit ötvözi, hogy a komplex dokumentumcsomagokat és igényléseket elemezze. A multimodális feladatok, a nagy kontextusablak, valamint a delegált ügynökök együttesen emelik ki a Google új modelljét – de egyelőre csak vizsgálják a váltást.

Tanmai Gopal, a PromptQL alapítója szerint is érthető a felhajtás, de a versenynek koránt sincs vége; a gyors verzióváltások miatt mindig akad olyan modell, amely pár hétig vagy hónapig vezeti a mezőnyt. Például egy nappal a Gemini 3 debütálása után az OpenAI már ki is hozta a GPT-5.1-Codex-Max frissítését.

A PromptQL csapata egyelőre nem tapasztalt forradalmi különbségeket a jelenlegi kínálathoz képest, de valószínű, hogy a Gemini 3 végül alapértelmezetté válik a hétköznapi, kreatív és képalapú felhasználásokban.

Modern csodafegyver vagy újabb trükk?

Mint minden MI-modell, a Gemini 3 is képes különös hibákat produkálni: a tesztelők szerint bravúrosan teljesít összetett feladatokat, de néha egészen egyszerű kérdéseken akad el. Andrej Karpathy MI-kutató is kiemelte: személyiségben, szöveggenerálásban, programozásban, humorban kiemelkedő, mindennapi használatra tökéletes – de néha furcsán viselkedik, vagy eltéved az egyszerű információk kezelésénél.

A tapasztalatok alapján tehát a Gemini 3 valódi előrelépést jelent, de minden valószínűség szerint átmeneti az uralma a csúcson. Az MI-fejlesztés tempója szédítő, a technológia gyorsan átértékelődik, és hónapról hónapra új modellek tűnnek fel. A Gemini 3 azonban kétségkívül sok dimenzióban hozott érdemi javulást, nemcsak egy-egy részterületen, hanem az MI-fejlesztés szinte minden oldalán.

Ezáltal arra lehet következtetni, hogy az MI-fejlesztés versenye egyre kiélezettebb, de a Google most egy látványos körrel előzte meg a többieket – legalábbis egy időre.

2025, adminboss, www.theverge.com alapján

Legfrissebb posztok

MA 11:02

Az agy ihlette chipek átírhatják a szuperszámítógépek jövőjét

A Sandia Nemzeti Laboratórium legújabb kutatása szerint az ideghálózathoz hasonló, úgynevezett neuromorf számítógépek nemcsak a mesterségesintelligencia-rendszerek gyorsításában jeleskednek, hanem a bonyolult matematikai egyenletek megoldásában is felülmúlhatják a jövő szuperszámítógépeit...

MA 10:51

Az ISS-en sokkoló eset: lezajlott az első orvosi evakuálás

Érdemes megvizsgálni, hogy milyen orvosi kihívásokkal szembesülhetnek a Nemzetközi Űrállomáson dolgozó asztronauták, és milyen előkészületekkel próbálják mindezt orvosolni...

MA 10:43

Az iPhone is végre megkaphatja az Auracastot – egy kis trükkel

A Bluetooth-alapú Auracast technológia még nem hódította meg teljesen a világot, aminek egyik nagy akadálya, hogy néhány nagyvállalat még mindig nem támogatja – főleg az Apple, amely egyelőre semmit nem mondott arról, mikor lesz elérhető iOS-en...

MA 10:37

Az MI meghódítja a gyűjthető figurák világát

A klasszikus Funko Pop figurák új korszak elé néznek: már MI-vel is felszerelik őket...

MA 10:30

Az amerikai folyók hosszú szakaszai védtelenek – riasztó arányok

Érdekes, hogy az Egyesült Államok több mint 6,4 millió kilométernyi folyóhálózatából a mai napig kevesebb mint 20 százalék esik valamilyen tényleges védelem alá az emberi tevékenységek hatásaival szemben...

MA 10:23

A CES 2026 legkínosabb kütyüi: idegesítő hűtő, MI-barista, anime barátnő

Első pillantásra úgy tűnt, hogy a CES 2026 is csak egy újabb tech-pompa Las Vegasban, de valójában idén is sikerült számos olyan kütyüt bemutatni, amelyek inkább bosszúságot, pazarlást és adatvédelmi rémálmokat hoznak, mint valódi előrelépést...

MA 10:16

A kanyaró az oltatlanok között tombol Dél-Karolinában

Dél-Karolinában október óta tomboló kanyarójárvány mostanra drámai méreteket öltött: péntekig, mindössze három nap alatt újabb 99 megbetegedést regisztráltak...

MA 10:10

Az okosszemüvegek új korszaka: érkeznek az önfókuszáló lencsék

👓 Fontos kérdés, hogy meddig lehet még fejleszteni egy olyan régi technológiát, mint a szemüveg...

MA 10:02

Az új Wegovy-tabletta betört az Amazonra: már rendelhető

Megérkezett az új, szájon át szedhető Wegovy, amelyet mostantól akár az Amazon online gyógyszertárából is meg lehet rendelni...

MA 09:50

Az agyad trükkje: miért halogatod a kellemetlen feladatokat?

😱 Mindenki ismeri az érzést, amikor egy unalmas munkafeladatot, a hűtő kipucolását vagy egy kínos beszélgetést halogat...

MA 09:43

Az Oracle veteránjai sorra távoznak a felsővezetésből

Két legidősebb tagjától búcsúzik az Oracle igazgatótanácsa: George Conrades és Naomi Seligman közel két évtized után visszavonulnak...

MA 09:36

Az Anthropic: átverés a Claude-tilalomról szóló üzenet

💡 Az utóbbi napokban tömegesen terjedt egy képernyőkép az X-en, amely szerint egy Claude-felhasználót végleg kitiltottak, és adatait átadták a hatóságoknak...

MA 09:31

A rejtély: hová tűnt a québeci Rouge-tó?

Manoel Dixon mindössze egy vacsorát követően kapta a döbbenetes üzenetet: a közeli Lake Rouge eltűnt...

MA 09:22

Az Amazon visszatér: óriási szupermarket épül Chicago mellett

🛒 Az Amazon ismét belevág a fizikai boltok világába: a cég 21 300 négyzetméteres, azaz közel négy focipályányi szupermarketet tervez Chicagohoz közel, Orland Parkban...

MA 09:15

A mesterséges intelligencia új csodafegyvere: aranyeső a boltoknak?

💰 Az Accenture komoly tétet tett az MI-re a kiskereskedelemben: jelentős befektetéssel támogatja a Profitmind nevű platformot, amely mesterségesintelligencia-alapú ügynökökkel automatizálja az árazási döntéseket, a készletgazdálkodást és a tervezést...

MA 09:08

Az illinoisi adatbotrány: 700 ezer ember személyes adata szivárgott ki

Az Illinois-i Humánszolgáltatások Minisztériumánál (IDHS) hibás adatvédelmi beállítások miatt csaknem 700 ezer lakos személyes és egészségügyi adatai váltak nyilvánossá...

MA 09:01

A Betelgeuse óriást egy titokzatos kísérő alakítja

💫 A vörös szuperóriás Betelgeuse évtizedek óta foglalkoztatja a csillagászokat kiszámíthatatlan fényváltozásai miatt...

MA 08:57

A grönlandi cápa meghökkentő, rejtett szuperképessége

🦈 A grönlandi cápa az óceán legkülönösebb lakója: hossza meghaladhatja a 6 métert, tömege több mint 1 tonna, és akár 400 évig is élhet...

MA 08:51

A CES 2026 legnagyobb dobásai: ezek taroltak idén

Las Vegasban, a világ legnagyobb tech-kiállításán, ismét minden a technológiáról szólt...