2025. 11. 24., 19:19

A mesterséges intelligencia új királya: a Gemini 3 diadalmenete

Érdekes felvetés, hogy a Google legújabb MI-modellje, a Gemini 3 alaposan felkavarta az iparágat. A keddi bemutatót követően szinte azonnal megjelentek a mémek, az elemzések, és még a legnagyobb versenytársak vezetői is elismerték a modell eredményeit. A Google Gemini 3 modelljét első nap beépítették a Google Keresőbe, és már a debütálás napján több mint egymillióan próbálták ki a Google AI Studio felületén és a Gemini API-n keresztül. A legújabb Gemini nemcsak az OpenAI legfrissebb fejlesztései előtt jár, hanem számos iparági mérőszám alapján vezeti is az MI-modellek rangsorát, például az LMArena toplistáját – ezt tekinthetjük a Billboard Hot 100 MI-megfelelőjének.

Látványos ugrás a teljesítményben

A Gemini 3 már első napján minden korábbi Google-modellnél nagyobb lendületet vett. A Google DeepMind vezetője, Logan Kilpatrick úgy fogalmazott: ilyen gyors elterjedést modelljük még nem tapasztalt. Még Sam Altman, az OpenAI vezetője, és Elon Musk, az xAI első embere is nyilvánosan gratulált a Google csapatának. Marc Benioff, a Salesforce vezérigazgatója azt írta: három év napi ChatGPT-használat után két órányi Gemini 3 minden korábbi tapasztalatát felülírta, mondván: Ez őrület – a következtetési képesség, a sebesség, a képek, a videó mind élesebb és gyorsabb, mintha ismét megváltozott volna a világ.

Wei-Lin Chiang, az LMArena társalapítója szerint a Gemini 3 Pro minden eddigi csúcsmodellt megelőz számos szakmai kategóriában: a kódolásban, matematikai feladatokban, kreatív írásban, sőt a vizuális megértésben is – itt elsőként lépte át az 1500-as pontszámot a platform szöveges toplistáján. A zászlóshajó képességei kiemelkednek: absztrakció, általánosítás, következetes teljesítmény, valamint változatos, valós értékelések során mutatott kiemelkedő eredmények.

Új mércét állít az MI-tesztekben

Alex Conway, a DataRobot vezető fejlesztője arra hívta fel a figyelmet, hogy a Gemini 3 szinte megduplázta bizonyos speciális logikai tesztek eredményeit, miközben a végrehajtási költsége tizede a riválisokénak. A SimpleQA-mérésen – ahol változatos, ritka tudást igénylő kérdésekre kell választ adni – a Gemini 3 Pro ismételten kétszer jobb eredményt ért el, mint az OpenAI GPT-5.1 modellje. Ez magyarázza, hogy a Gemini 3 a speciális témákban és a kutatásokban várhatóan egyre gyakrabban használt eszköz lesz.

A későbbiekben azonban érdemes óvatosan kezelni a toplistákat. Egy MI-modell lehet, hogy laboratóriumi körülmények között lenyűgöző, de a hétköznapi élet komplexitása más elvárásokat támaszt. Professzionális felhasználók szerint a Gemini 3 kiváló általános feladatokban, de az iparági réspiacokon vagy éles helyzetekben többnyire még nem váltja le a jól bevált alternatívákat.

A mindennapos munkában: forradalom vagy óvatosság?

Sokan továbbra is az Anthropic Claude modelljét részesítik előnyben kódoláshoz, mivel a Gemini 3, bár korszakos teljesítményt nyújt, a felhasználói élményben – például az utasítások pontos követésében – még elmarad a legjobbtól. Tim Dettmers, a Carnegie Mellon Egyetem oktatója úgy látja: a Gemini 3 ragyogó, de még kiforratlan a felhasználói élmény szempontjából.

Tulsee Doshi, a Google DeepMind termékigazgatója szerint a Gemini 3 Pro még csak az első tagja a teljes termékcsaládnak, így a további fejlesztések várhatóan orvosolják a fennálló hiányosságokat.

Joel Hron, a Thomson Reuters technológiai igazgatója saját tesztek alapján kiemeli, hogy a Gemini 3 minden releváns területen kimagasló, főként a hosszú dokumentumok és jogi szerződések értelmezésében, nagy ugrás a Gemini 2.5-höz képest, és többnyire az Anthropic, illetve az OpenAI modelljeit is felülmúlja.

Louis Blankemeier, a Cognita radiológiai MI-cég vezetője szerint lenyűgözőek a nyers számok. Ugyanakkor a gyakorlati hasznosság terén bőven akad még kérdőjel: a modell például nehezen ismeri fel a mellkasi röntgeneken a finomabb bordatöréseket vagy ritkább elváltozásokat. A radiológia hasonlóan bonyolult, mint az önvezető autók világa: a szélső esetek döntőek, így előfordulhat, hogy a régebbi, testre szabottabb modellekkel hatékonyabb a munka.

Hasonló tapasztalatai vannak Matt Hoffman-nak, a Longeye cég MI-vezetőjének is. Bár a Gemini 3 Pro-t kiszolgáló Nano Banana Pro képgenerátor kimagasló számokat produkál, a tesztelt benchmarkok nem mindig tükrözik éles felhasználási eseteik igényeit.

Integráció és folyamatos helyezkedés a mezőny élén

A különböző területeken dolgozó cégek továbbra is inkább modellkeveréket használnak. A Built például jelenleg a Google, az Anthropic és az OpenAI eszközeit ötvözi, hogy a komplex dokumentumcsomagokat és igényléseket elemezze. A multimodális feladatok, a nagy kontextusablak, valamint a delegált ügynökök együttesen emelik ki a Google új modelljét – de egyelőre csak vizsgálják a váltást.

Tanmai Gopal, a PromptQL alapítója szerint is érthető a felhajtás, de a versenynek koránt sincs vége; a gyors verzióváltások miatt mindig akad olyan modell, amely pár hétig vagy hónapig vezeti a mezőnyt. Például egy nappal a Gemini 3 debütálása után az OpenAI már ki is hozta a GPT-5.1-Codex-Max frissítését.

A PromptQL csapata egyelőre nem tapasztalt forradalmi különbségeket a jelenlegi kínálathoz képest, de valószínű, hogy a Gemini 3 végül alapértelmezetté válik a hétköznapi, kreatív és képalapú felhasználásokban.

Modern csodafegyver vagy újabb trükk?

Mint minden MI-modell, a Gemini 3 is képes különös hibákat produkálni: a tesztelők szerint bravúrosan teljesít összetett feladatokat, de néha egészen egyszerű kérdéseken akad el. Andrej Karpathy MI-kutató is kiemelte: személyiségben, szöveggenerálásban, programozásban, humorban kiemelkedő, mindennapi használatra tökéletes – de néha furcsán viselkedik, vagy eltéved az egyszerű információk kezelésénél.

A tapasztalatok alapján tehát a Gemini 3 valódi előrelépést jelent, de minden valószínűség szerint átmeneti az uralma a csúcson. Az MI-fejlesztés tempója szédítő, a technológia gyorsan átértékelődik, és hónapról hónapra új modellek tűnnek fel. A Gemini 3 azonban kétségkívül sok dimenzióban hozott érdemi javulást, nemcsak egy-egy részterületen, hanem az MI-fejlesztés szinte minden oldalán.

Ezáltal arra lehet következtetni, hogy az MI-fejlesztés versenye egyre kiélezettebb, de a Google most egy látványos körrel előzte meg a többieket – legalábbis egy időre.

2025, adminboss, www.theverge.com alapján

Legfrissebb posztok

HistoryToday

MA 06:05

Történelmi események a mai napon (Július 12.)

Mi történt ezen a napon a történelemben? Feszült ostromok, sorsfordító csaták és függetlenségi nyilatkozatok alakították ezt a napot: Jeruzsálem falainak áttörése és a Második Templom pusztulása, a Bastille ostromához vezető szikra, a Boyne és Aughrim döntő ütközetei, valamint a Libanon–Izrael háború kezdete mind ide tartozik...

A kínai áttörés: első újrafelhasználható rakétájuk új módszerrel tért vissza

Tudomány

MA 06:02

A kínai áttörés: első újrafelhasználható rakétájuk új módszerrel tért vissza

🚀 Kína történetének egyik legnagyobb űripari eseményét ünnepelte, amikor először sikerült visszanyerni egy újrafelhasználható, orbitális hordozórakéta első fokozatát a Dél-kínai-tengeren...

Az agyfúrás helyett itt a viselhető agytech jövője

MI Hírek

szombat 18:31

Az agyfúrás helyett itt a viselhető agytech jövője

Érdemes megvizsgálni, hogy az emberi elme és a technológia közötti közvetlen kapcsolat mennyire válhat mindennapossá a következő években...

Az MI-ügynökök pereit intézi az első digitális bíróság

MI Hírek

szombat 18:01

Az MI-ügynökök pereit intézi az első digitális bíróság

💻 A mesterséges intelligenciával működő ügynökök egyre gyakrabban üzletelnek és kötnek megállapodásokat emberi beavatkozás nélkül, ám ezek a gépi tranzakciók is ugyanúgy vitákhoz vezethetnek, ahogyan akkor is, amikor emberek állnak egymással szemben...

Az üzleti MI-ügynökök magabiztosan tévednek – hiányzik a kontextus

MI Hírek

szombat 17:01

Az üzleti MI-ügynökök magabiztosan tévednek – hiányzik a kontextus

Ami kezdetben ártalmatlannak tűnt, mára súlyos problémává nőtte ki magát: az üzleti MI-ügynökök magabiztosan hibás válaszokat adnak, mindezt úgy, hogy senki nem veszi észre, amíg valaki vissza nem követi az adatot egy elavult metrikáig vagy egy olyan dokumentumig, amelyet a lekérő rendszer soha nem töltött be...

Az MI-láz ára: a GPU-k 86%-a félgőzzel pörög

Színes

szombat 15:31

Az MI-láz ára: a GPU-k 86%-a félgőzzel pörög

💸 A nagyvállalatok világa az MI-építkezés lázában ég, miközben kiderül: elsiették a fejlesztést, a vezérlési és kontrollrétegek csak utólag épülnek...

A drónok lecsaptak: 100 ezer dolláros bírság az illegális tűzijátékért

Színes

szombat 15:01

A drónok lecsaptak: 100 ezer dolláros bírság az illegális tűzijátékért

🎆 Nehéz elhinni, de a függetlenség napja minden évben nemcsak a látványos ünneplésről, hanem a szabálytalan tűzijátékok miatt kiszabott durva bírságokról is szól...

Kriptó

szombat 14:31

Írország áramának 23%-át már az adatközpontok falják.

Írországban az adatközpontok villamosenergia-fogyasztása 2025-ben újabb 10%-kal nőtt, miközben Dublin környékén továbbra is szinte teljes tiltás volt érvényben az új adatközpontok hálózatra kapcsolására...

Tudomány

szombat 12:01

Az első sikeres kínai hordozórakéta-leszállás orbitális indítás után

Kína történelmi sikert ért el az űrtechnológiában: a Hosszú Menetelés–10B (Long March 10B) hordozórakéta első fokozatát először sikerült épségben visszahozni a Földre, egy a tengerre telepített, hálóval felszerelt platformra...

Színes

szombat 11:31

A Ryuk zsarolóvírus bandatagja Amerikában beismerte bűnét, 15 év várhat rá

🕷 Egy 34 éves örmény férfi bűnösnek vallotta magát az Egyesült Államokban, miután több vállalat számítógépes rendszereibe tört be, és a hírhedt Ryuk zsarolóvírust használta adatállományok titkosítására...

A botrányos Roku-frissítés mindenkinél kiverte a biztosítékot

Színes

szombat 11:01

A botrányos Roku-frissítés mindenkinél kiverte a biztosítékot

Két hete, amikor bekapcsoltam a Roku TV-t a nappaliban, már az első képernyőn egy oktatófelület fogadott, amely arról tájékoztatott, hogy teljesen megújult a főoldal és az egész kezelőfelület...

MI Hírek

szombat 10:48

Az Instagramon vége a rólad gyártott MI-képeknek

Néhány napja még elég volt megjelölni egy nyilvános Instagram-fiókot, és azonnal lehetett MI-vel mélyhamisított képeket generálni bárkiről...

Tudomány

szombat 10:37

A svéd sírok titka: csecsemők és nem rokon felnőttek együtt

Érdemes megvizsgálni, hogy a középkori kereszténység felbukkanásával milyen változások történtek Svédország temetkezési szokásaiban...

MI Hírek

szombat 10:25

Az OpenAI Atlas böngészője még az első szülinapot sem éri meg

Felmerül a kérdés, hogy miért ért véget ilyen hamar a nagyra törő kísérlet: az Atlas böngésző, amelyet az OpenAI még egy éve sem indított el, máris leállította...

Színes

szombat 10:02

A Galaxy Z Fold 8-ra Pókember is hálót dob

Egy friss előzetes szerint már szinte biztos, hogy a Samsung júliusi eseményén bemutatkozik az új, hajlítható Galaxy Z Fold 8...

A Szuper El Niño esélye most drámaian nőtt

Tudomány

szombat 09:48

A Szuper El Niño esélye most drámaian nőtt

A trópusi Csendes-óceánon az átlagosnál jóval melegebb tengerfelszíni hőmérsékletet figyeltek meg június első hetében, a műholdas adatok szerint egyre intenzívebb az El Niño...

Színes

szombat 09:36

A pusztító Windows-hátsókapu, amely több törlőprogramot és zsarolóvírust csomagol egybe

Egy rejtélyes, nemrég felfedezett Windows-hátsókapu többféle pusztító képességet rejt egyetlen csomagban...

A matek szerint nincs több bitcoin-csúcs?

Kriptó

szombat 09:25

A matek szerint nincs több bitcoin-csúcs?

📈 A bitcoin múltbeli, négyéves ciklusai mindig is új rekordárakat hoztak, de ezek az emelkedések egyre visszafogottabbak...

Az áttörés küszöbén: végre megoldódhat a szilárdtest-akkuk legnagyobb baja

Tudomány

szombat 09:13

Az áttörés küszöbén: végre megoldódhat a szilárdtest-akkuk legnagyobb baja

⚡ Az okostelefonok, elektromos autók és más hordozható elektronikai eszközök ma mind akkumulátorokra támaszkodnak, miközben a fogyasztók folyamatosan hosszabb üzemidőt, nagyobb biztonságot és tartósságot várnak el...

APP

szombat 09:11

APPok, Amik Ingyenesek MA, 7/11

Fizetős iOS appok és játékok, amik ingyenesek a mai napon. CrestWall – 4K Wallpapers (iPhone/iPad)A CrestWall egy kézzel válogatott, 4K felbontású háttérképeket kínáló alkalmazás, amely elsősorban azoknak készült, akik fontosnak tartják iPhone-juk kinézetét...

Tudomány

szombat 09:01

A legegyszerűbb folyadékok sem csak folynak – némelyik megreped

💧 Ki gondolná, hogy egy látszólag egyöntetű, sűrű, fekete folyadék képes lehet a szilárd anyagokhoz hasonlóan elpattanni vagy szétrepedni?..

Ellophatta az OpenAI az Apple féltve őrzött titkait?

MI Hírek

szombat 08:37

Ellophatta az OpenAI az Apple féltve őrzött titkait?

Az Apple minden várakozást felülmúló lépésre szánta el magát: pert indított az OpenAI és két volt alkalmazottja ellen, miután súlyos üzleti titoksértéssel vádolja őket...

Az Odyssey-morgók labdába se rúgnak a Batman-rajongók mellett – Nolan

Színes

szombat 08:24

Az Odyssey-morgók labdába se rúgnak a Batman-rajongók mellett – Nolan

A rendezők ritkán élnek át annyi heves online felháborodást, mint Christopher Nolan, akinek a legújabb projektje, az Odüsszeia (Odyssey) szereposztása is vihart kavart a közösségi médiában...

MI Hírek

szombat 08:01

Az OpenAI legújabb MI-je már most veszélyt hordoz?

Az OpenAI új, GPT-5.6 Sol nevű MI-modelljét a vállalat minden eddiginél biztonságosabbnak hirdeti, azonban a brit kormány által végzett előzetes tesztek során az derült ki, hogy a rendszer védelmi korlátai könnyen átléphetők, így potenciálisan veszélyes számítógépes támadásokra is használhatóvá válhat...

MI Hírek

szombat 07:49

A Progress azonnali leállítást kér: hiteles fenyegetés a ShareFile ellen

A Progress Software figyelmezteti azokat a vállalatokat, amelyek a ShareFile Storage Zone Controllert saját Windows-szerveren használják, hogy azonnal állítsák le rendszereiket, mert valós külső biztonsági fenyegetés jelent meg...

Színes

szombat 07:37

A Meta-szemüvegek elleni felzúdulás átírja, vagy elveszi a kedvet a használatuktól

👀 Érdekes kérdés, hogy miként váltak a kezdetben menő, újdonságként beharangozott Meta okosszemüvegek néhány hónap alatt sok helyen szinte vállalhatatlan eszközzé...

Az MI rosszabbá teszi a munkát: lázadnak a Kaiser ápolói

Színes

szombat 06:37

Az MI rosszabbá teszi a munkát: lázadnak a Kaiser ápolói

Tavasszal több ezer ápoló és mentálhigiénés dolgozó vonult utcára San Franciscóban, hogy tiltakozzon a kórházi munkájukban egyre inkább jelen lévő technológiák ellen...

MI Hírek

szombat 06:25

Az MI-verseny irányt vált: olcsóbb, okosabb rendszerek előretörése

🚀 A mesterséges intelligencia fejlődése nemcsak a minél nagyobb modellek építéséről vagy a teljesítménymutatók hajszolásáról szól már...

HistoryToday

szombat 06:05

Történelmi események a mai napon (Július 11.)

Ármány és hatalomváltás Bizáncban, a flamandok nagy győzelme Franciaország felett, Vichy Franciaország megszületése, az első transzatlanti műholdas tévéadás és a Skylab látványos megsemmisülése – sűrű nap a világtörténelemben...