
Az MI mélyelemzés új szintje
A Gemini Deep Research ügynöke hatalmas mennyiségű információ összesítésére képes, és egyetlen promptban rendre óriási adathalmazzal birkózik meg. Az ügyfelek a legalaposabb átvilágítástól kezdve a gyógyszerbiztonsági kutatásokig sokféle feladatra használják. Hamarosan ez a fejlett kutató ügynök olyan szolgáltatásokban is megjelenik, mint a Google Search, a Google Finance, a Gemini App és a NotebookLM, ezzel is közelebb hozva azt a világot, ahol már nem emberek keresnek a Google-ben, hanem MI-ügynökeik.
Kevesebb tévesztés, több tény
A Gemini 3 Pro modellt úgy képezték ki, hogy a lehető legkevesebbet hallucináljon, vagyis ne találjon ki tényeket még hosszú, önálló döntéshozatalt igénylő feladatoknál sem. Ez kritikus jelentőségű, hiszen minél összetettebb egy MI-ügynök feladata, annál nagyobb az esélye, hogy egyetlen hibás döntés az egész választ értelmetlenné teheti.
Gyorsan avuló ranglisták
A Google új szintetikus mércét is készített: a DeepSearchQA-t, amelyet bárki szabadon használhat, és amelyen az MI-ügynökök összetett, többlépéses keresési feladatai tesztelhetők. A Gemini Deep Research kiválóan teljesített ezen, sőt az emberiség extrém műveltségi tesztjén (Humanity’s Last Exam) is, és messze lepipálta a böngészőalapú BrowserComp teszten a korábbi MI-ket. Egyedül az OpenAI ChatGPT 5 Pro szorongatta meg igazán, amely a böngészős teszten kicsit még jobb eredményt is ért el.
Ám gyorsan lefutott a verseny: a bemutatóval egy időben megjelent az OpenAI új, Fokhagyma (Garlic) kódnevű GPT 5.2 modellje, amely a legtöbb, köztük a saját mércéin is legyőzte a Google-t — vagyis a nagyok egy pillanatra sem hagyták leülni az MI-bajnokságot.
