MA 13:21

Az új Gemini 3.1 Pro: finomhangolható észjárás, ütős előnyök

Az új Gemini 3.1 Pro: finomhangolható észjárás, ütős előnyök
Elsőként debütál a Google Gemini 3.1 Pro modell, amely forradalmian új szintet hoz a vállalati MI-fejlesztések világában. Három hónap alatt az előző generáció, a Gemini 3 Pro már az élmezőnybe került, de az MI piacán ennyi idő már egy egész korszakot jelent. A most bemutatott 3.1 Pro lényeges újításokkal bír: három különböző gondolkodási szinttel rendelkezik, amelyek lehetővé teszik, hogy a modell a válaszaihoz éppen annyi erőforrást fordítson, amennyit a feladat indokol. A gyors, rutinszerű válaszoktól a többlépcsős, elmélyült elemzésekig képes skálázódni, így a fejlesztőknek és informatikai vezetőknek elég egyetlen modellt használni a különböző igényekhez.

Állítható gondolkodás a gyakorlatban

A 3.1 Pro legizgalmasabb újdonsága a háromszintű gondolkodási rendszer, amellyel a felhasználó részletesen szabályozhatja, mennyi számítási kapacitást szánjon a mesterséges intelligencia egy-egy válaszra. Amíg a korábbi modell csak alacsony és magas fokozatot kínált, az új egy középső fokozattal bővült, miközben a „magas” jelentése lényegesen megváltozott: innentől a magas szintű gondolkodás a Gemini Deep Think (Mély Gondolat) rendszer miniatűr változataként működik. Ez a rugalmasság óriási könnyebbséget ad a cégeknek: nem kell a feladattól függően többféle modellt bevetni, hanem egyetlen végponton választható, milyen mélységű elemzésre van szükség. Erre utal többek között az is, hogy egy egyszerű dokumentumösszefoglalás alacsony fokozaton szinte azonnal lefut, míg a bonyolultabb analitikai feladatokra a magas szintű gondolkodás az ideális.

Látványos teljesítménynövekedés

A Google által nyilvánosságra hozott teszteredmények azt mutatják, hogy a 3.1 Pro jelentősen meghaladja elődjét a komplex gondolkodási és feladatvégzési képességekben. Az ARC-AGI-2 benchmarkon, amely az elvont problémamegoldást méri, 77,1%-os eredményt ért el – több mint kétszerese a Gemini 3 Pro 31,1%-ának. Ezzel a rivális modelleket is maga mögé utasítja, köztük az Anthropic Sonnet 4.6-ot (58,3%) és az OpenAI GPT-5.2-t (52,9%). Komoly előrelépés látható a „Humanity’s Last Exam” akadémiai teszten is: a 44,4%-os eredmény nemcsak a korábbi Geminit, hanem az összes konkurens nagyvállalati MI-t felülteljesíti. A tudományos kérdésekből álló GPQA Diamondon 94,3%-os eredményt produkált.

Ahol igazán kiemelkedő, az az agentikus – vagyis eszközhasználati és többlépéses – feladatokban nyújtott teljesítmény. A Terminal-Bench 2.0-n (kódolási teljesítmény) 68,5%-ra javult az előző 56,9%-hoz képest. Az MCP Atlas pályán (többlépéses workflow-feladatok) 69,2%-ot hozott, míg a webes keresőfeladatokat tesztelő BrowseCompon 85,9%-os eredményt ért el.

Miért „3.1” és nem nagyobb ugrás?

A Google ezúttal szakított a szokásos verzióléptetési gyakorlattal: a 3.1 azért „pont egyes” verzió, mert a cég jelentősnek tartja a fejlődést ugyan, de ezt inkább folytatásnak, mint forradalmi váltásnak szánja. A fejlesztés során hangsúlyossá vált a megerősítéses tanulás és a Deep Think tapasztalatainak beépítése, amely főleg az elvont gondolkodást, a kódolást és az összetett feladatvégzést javította számottevően. Maga a modell most előzetes változatban érhető el, miközben továbbfejlesztik az ezzel kapcsolatos agentikus munkafolyamatokat.


Verseny és elérhetőség

Az új modell sikere várhatóan versenyhelyzetet teremt a nagy MI-fejlesztők között, különösen mivel a Gemini 3.1 Pro több kategóriában is visszaszerezte a benchmarkbajnoki címet. Most a döntéshozóknak újra át kell gondolniuk, mely partnerrel dolgoznak együtt, hiszen a dinamikus fejlesztési tempó hamar túlhaladja a jelenlegi megoldásokat. A kérdés az, hogy az Anthropic, az OpenAI vagy a nyílt forráskódú közösség mennyi idő alatt rukkol elő válasszal – feltehetőleg hetek, nem hónapok alatt.

A Gemini 3.1 Pro már elérhető előzetes verzióban a Google AI Studio, a Gemini CLI, az Antigravity fejlesztői platform, a Vertex AI, a Gemini Enterprise, az Android Studio, a fogyasztói Gemini alkalmazás, továbbá a NotebookLM felületén.

Összegzésként elmondható, hogy a Google Gemini 3.1 Pro jelentős ugrást hoz az állítható gondolkodási képesség, a skálázhatóság és a vállalati MI-fejlesztés területén, új alapokra helyezve azt, amit a cégek eddig elvárhattak egyetlen MI-modelltől.

2025, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 13:40

Az óriásvírus, amely átírhatja az élet eredetéről alkotott képünket

Egy japán kutatócsoport egészen különleges felfedezést tett: egy új óriásvírust azonosítottak, amely akár az összetett élet keletkezésének titkait is feltárhatja...

MA 12:02

Az MI az utolsó lépésen hasal el? Támadnak az aranycsövek

Ebből következően érdemes megérteni, hogy miért jelent problémát a vállalati MI-rendszerek számára az „utolsó mérföld”, vagyis a végső lépésben történő adatkezelés, és hogyan próbálja ezt feloldani egy új, „aranycső” (golden pipeline) nevű megközelítés...

MA 11:58

Az Android nagytakarítása: 1,75 millió app tiltólistán egy év alatt

🚀 2025-ben a Google elképesztő mennyiségű, több mint 1,75 millió alkalmazás közzétételét akadályozta meg a Play Áruházban, mivel azok nem feleltek meg az előírásoknak...

MA 11:39

Az Amazfit T-Rex Ultra 2: a túrázók álomokosórája, minden földi jóval

🛬 Továbbá az Amazfit bemutatta eddigi legnagyobb okosóráját, a T-Rex Ultra 2-t, amely kifejezetten szabadtéri kalandoroknak készült...

MA 11:21

Az MI-alapú ügyfélélmény árnyoldala: 700 cég már ráfázott

Az ügyfélélmény (CX) platformok ma már elképesztő mennyiségű strukturálatlan adatot dolgoznak fel...

MA 11:02

Az arany és a bitcoin szárnyal: Irán miatti félelem fűti a piacot

Erre utal többek között az, hogy a bitcoin ismét közelít a 68 000 dolláros (kb...

MA 10:55

Az óriáshold, amely kettészakadt: így születhettek a Szaturnusz gyűrűi

🌓 A Szaturnusz legnagyobb holdja, a Titán, valójában két összeolvadt égitestből keletkezhetett, méghozzá egy kozmikus ütközés következtében, mintegy 400 millió évvel ezelőtt...

MA 10:37

Az emberi test rejtett gyulladáskapcsolója: áttörés a krónikus betegségek ellen

A kutatók egy eddig rejtett biológiai folyamatot tártak fel, amely a szervezetben természetes módon leállítja a gyulladást, amikor arra már nincs szükség...

MA 10:27

Az ember és a macska: ugyanaz a rák, ugyanazok a gének?

Felmerül a kérdés, mi köti össze legszorosabban a macskákat az emberekkel...

MA 10:19

Az androidos kártevő, amely mesterséges intelligenciával tartja magát életben

A biztonsági kutatók olyan androidos kártevőt azonosítottak, amely először használ generatív MI-t a működése során...

MA 10:01

A csodagyógyszer, amitől az amerikaiak rettegnek – de miért?

A sztatinokat az orvostudomány szinte csodagyógyszerként ünnepli, hiszen 10 000 szedőből 1 000-nél ténylegesen megelőzik a súlyos szív- és érrendszeri eseményeket...

MA 09:46

Az űridőjárás rázza meg a Földet?

Napkitörések jócskán felforgathatják a Föld légkörét: nemcsak a sarki fényeket hozzák létre, hanem talán a földrengések kialakulására is hatással lehetnek...

MA 09:38

Az Nvidia 11 ezermilliárd forintot pumpálna az OpenAI-ba

💸 Az MI-piac újabb brutális pénzmozgás előtt áll: az Nvidia akár 11 ezermilliárd forintot (30 milliárd USD) fektethet az OpenAI-ba, amely a startupot már 266 ezermilliárd forintra (730 milliárd USD) értékelné...

MA 09:28

Az Apple ellen újabb per: ismét célkeresztben az iCloud

Érdemes megérteni, hogy egy nyugat-virginiai per most komoly nyomást helyez az Apple-re...

MA 09:19

A bouba–kiki-hatás: még a csibék is ráéreznek

Annak megvizsgálására, hogy a bouba–kiki-hatás, amelyben bizonyos hangokat és formákat ösztönösen párosítunk egymással, mennyire ősi lehet az élővilágban, újszülött csibékkel végzett friss kísérletek készültek...

MA 09:12

Az MI-ügynökök átveszik a kasszát – mire készüljenek a márkák?

A mesterséges intelligencia forradalmat indít a vásárlásban. Ma már egyre többen kérik meg MI-ügynököket arra, hogy találják meg, hasonlítsák össze, sőt vásárolják meg a különböző termékeket a nevükben...

MA 09:02

Az autóipari óriásnál adatlopás történt, mégis csendben marad

🚗 A ShinyHunters nevű hírhedt hackercsoport ismét nagyot lépett: most az egyik legnagyobb online autópiac, a CarGurus 1,7 millió belső vállalati rekordját lopták el...

MA 08:47

Az Nvidia az indiai MI-startupok trónjára tör

Az Nvidia elkezdte még korábbi fázisban megszólítani az indiai MI-startupokat, és friss együttműködéseket kötött annak érdekében, hogy már akkor kapcsolatba léphessen az alapítókkal, amikor a cégük még meg sem alakult...

MA 08:38

Az Ősrobbanás őslevese: tényleg így indult a világegyetem?

Érdemes megvizsgálni, mi történt a világegyetem legelső ezredmásodpercében, amikor a tudósok szerint minden anyag egyfajta forró, ősi levesben úszott...

MA 08:28

Az égből termel áramot a kínai repülő szélturbina

Kína egyedülálló légi szélturbinát tesztelt sikeresen, amely léghajóként emelkedik az égbe, hogy ott, a megbízhatóbban fújó szélből termeljen áramot...

MA 07:55

Az új Gemini 3.1 Pro még intelligensebb MI-t hoz

A Google bemutatta legújabb fejlesztését, a Gemini 3.1 Pro MI-modellt, amely jelentős előrelépést jelent a logikai gondolkodás és a problémamegoldás terén...

MA 07:47

Az űrkaland új veszedelme: a holdrengések az űrhajósokat fenyegetik

Fontos kérdés, hogy milyen veszélyek leselkednek mindazokra, akik a következő években tudományos vagy gazdasági céllal készülnek a Holdra lépni...

MA 07:37

Az Apple óriásvásznon robbantja be a Forma–1 őrületét.

A Forma–1 világa végre tényleg óriásira nő, köszönhetően az Apple és az IMAX újdonsült összeborulásának...

MA 07:28

Könnyen lehallgathatók a Grandstream telefonok otthon és az irodában

A népszerű Grandstream GXP1600 sorozatú VoIP-telefonokon súlyos biztonsági rés tette lehetővé, hogy távoli támadók gyakorlatilag bármilyen hitelesítés nélkül átvegyék az eszközök felett az irányítást, és titokban belehallgassanak a beszélgetésekbe...

MA 07:19

Az év indie szenzációja: négyfős káosz a Pusztítsd el a Tornyot 2-ben

Oké, de b*sszus, közben meg ki gondolta volna, hogy a Pusztítsd el a Tornyot 2 (Slay the Spire 2) március 5-én Early Accessben berobban a Steamen?..

APP
MA 07:11

APPok, Amik Ingyenesek MA, 2/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:10

Az üvegkönyvtár tényleg megőrzi adatainkat évezredeken át?

Képzeld el, hogy parányi üvegtáblákon találhatók a világ legfontosabb információi, amelyeket akár tízezer év múlva is el tudnának olvasni...

MA 06:55

A különálló Messengernek vége – a Meta lehúzza a rolót

Áprilisban végleg elsötétül a Messenger különálló weboldala, a messenger.com. A csetszobád persze nem tűnik el teljesen: a Facebookon keresztül továbbra is tudsz majd üzengetni vagy mobilon az appot használhatod...

MA 06:37

Az újabb űrdráma: mit tanít a Starliner fiaskó?

A 2024-es, emberes Boeing Starliner-küldetés kudarca után a NASA alapos vizsgálatot folytatott, amely során számos szervezeti és vezetési hibára világított rá...