Az új Gemini 3.1 Pro: finomhangolható észjárás, ütős előnyök

Elsőként debütál a Google Gemini 3.1 Pro modell, amely forradalmian új szintet hoz a vállalati MI-fejlesztések világában. Három hónap alatt az előző generáció, a Gemini 3 Pro már az élmezőnybe került, de az MI piacán ennyi idő már egy egész korszakot jelent. A most bemutatott 3.1 Pro lényeges újításokkal bír: három különböző gondolkodási szinttel rendelkezik, amelyek lehetővé teszik, hogy a modell a válaszaihoz éppen annyi erőforrást fordítson, amennyit a feladat indokol. A gyors, rutinszerű válaszoktól a többlépcsős, elmélyült elemzésekig képes skálázódni, így a fejlesztőknek és informatikai vezetőknek elég egyetlen modellt használni a különböző igényekhez.

Állítható gondolkodás a gyakorlatban

A 3.1 Pro legizgalmasabb újdonsága a háromszintű gondolkodási rendszer, amellyel a felhasználó részletesen szabályozhatja, mennyi számítási kapacitást szánjon a mesterséges intelligencia egy-egy válaszra. Amíg a korábbi modell csak alacsony és magas fokozatot kínált, az új egy középső fokozattal bővült, miközben a „magas” jelentése lényegesen megváltozott: innentől a magas szintű gondolkodás a Gemini Deep Think (Mély Gondolat) rendszer miniatűr változataként működik. Ez a rugalmasság óriási könnyebbséget ad a cégeknek: nem kell a feladattól függően többféle modellt bevetni, hanem egyetlen végponton választható, milyen mélységű elemzésre van szükség. Erre utal többek között az is, hogy egy egyszerű dokumentumösszefoglalás alacsony fokozaton szinte azonnal lefut, míg a bonyolultabb analitikai feladatokra a magas szintű gondolkodás az ideális.

Látványos teljesítménynövekedés

A Google által nyilvánosságra hozott teszteredmények azt mutatják, hogy a 3.1 Pro jelentősen meghaladja elődjét a komplex gondolkodási és feladatvégzési képességekben. Az ARC-AGI-2 benchmarkon, amely az elvont problémamegoldást méri, 77,1%-os eredményt ért el – több mint kétszerese a Gemini 3 Pro 31,1%-ának. Ezzel a rivális modelleket is maga mögé utasítja, köztük az Anthropic Sonnet 4.6-ot (58,3%) és az OpenAI GPT-5.2-t (52,9%). Komoly előrelépés látható a „Humanity’s Last Exam” akadémiai teszten is: a 44,4%-os eredmény nemcsak a korábbi Geminit, hanem az összes konkurens nagyvállalati MI-t felülteljesíti. A tudományos kérdésekből álló GPQA Diamondon 94,3%-os eredményt produkált.

Ahol igazán kiemelkedő, az az agentikus – vagyis eszközhasználati és többlépéses – feladatokban nyújtott teljesítmény. A Terminal-Bench 2.0-n (kódolási teljesítmény) 68,5%-ra javult az előző 56,9%-hoz képest. Az MCP Atlas pályán (többlépéses workflow-feladatok) 69,2%-ot hozott, míg a webes keresőfeladatokat tesztelő BrowseCompon 85,9%-os eredményt ért el.

Miért „3.1” és nem nagyobb ugrás?

A Google ezúttal szakított a szokásos verzióléptetési gyakorlattal: a 3.1 azért „pont egyes” verzió, mert a cég jelentősnek tartja a fejlődést ugyan, de ezt inkább folytatásnak, mint forradalmi váltásnak szánja. A fejlesztés során hangsúlyossá vált a megerősítéses tanulás és a Deep Think tapasztalatainak beépítése, amely főleg az elvont gondolkodást, a kódolást és az összetett feladatvégzést javította számottevően. Maga a modell most előzetes változatban érhető el, miközben továbbfejlesztik az ezzel kapcsolatos agentikus munkafolyamatokat.

Verseny és elérhetőség

Az új modell sikere várhatóan versenyhelyzetet teremt a nagy MI-fejlesztők között, különösen mivel a Gemini 3.1 Pro több kategóriában is visszaszerezte a benchmarkbajnoki címet. Most a döntéshozóknak újra át kell gondolniuk, mely partnerrel dolgoznak együtt, hiszen a dinamikus fejlesztési tempó hamar túlhaladja a jelenlegi megoldásokat. A kérdés az, hogy az Anthropic, az OpenAI vagy a nyílt forráskódú közösség mennyi idő alatt rukkol elő válasszal – feltehetőleg hetek, nem hónapok alatt.

A Gemini 3.1 Pro már elérhető előzetes verzióban a Google AI Studio, a Gemini CLI, az Antigravity fejlesztői platform, a Vertex AI, a Gemini Enterprise, az Android Studio, a fogyasztói Gemini alkalmazás, továbbá a NotebookLM felületén.

Összegzésként elmondható, hogy a Google Gemini 3.1 Pro jelentős ugrást hoz az állítható gondolkodási képesség, a skálázhatóság és a vállalati MI-fejlesztés területén, új alapokra helyezve azt, amit a cégek eddig elvárhattak egyetlen MI-modelltől.

2025, adminboss, venturebeat.com alapján