Az MI-gigászok csatája: Google kontra OpenAI

A Google bemutatta eddigi legfejlettebb mesterségesintelligencia-kutató ügynökét, a Gemini Deep Research újragondolt változatát, amely immár a Gemini 3 Pro modellre épül. Ez nem csupán kutatási jelentések készítésére alkalmas: mostantól a fejlesztők a Google SATA-modell kutatási képességeit is beágyazhatják saját alkalmazásaikba. Az új Programmatic API segítségével a fejlesztők nagyobb kontrollt kapnak az ügynökalapú MI-korszakában.

Az MI mélyelemzés új szintje

A Gemini Deep Research ügynöke hatalmas mennyiségű információ összesítésére képes, és egyetlen promptban rendre óriási adathalmazzal birkózik meg. Az ügyfelek a legalaposabb átvilágítástól kezdve a gyógyszerbiztonsági kutatásokig sokféle feladatra használják. Hamarosan ez a fejlett kutató ügynök olyan szolgáltatásokban is megjelenik, mint a Google Search, a Google Finance, a Gemini App és a NotebookLM, ezzel is közelebb hozva azt a világot, ahol már nem emberek keresnek a Google-ben, hanem MI-ügynökeik.

Kevesebb tévesztés, több tény

A Gemini 3 Pro modellt úgy képezték ki, hogy a lehető legkevesebbet hallucináljon, vagyis ne találjon ki tényeket még hosszú, önálló döntéshozatalt igénylő feladatoknál sem. Ez kritikus jelentőségű, hiszen minél összetettebb egy MI-ügynök feladata, annál nagyobb az esélye, hogy egyetlen hibás döntés az egész választ értelmetlenné teheti.

Gyorsan avuló ranglisták

A Google új szintetikus mércét is készített: a DeepSearchQA-t, amelyet bárki szabadon használhat, és amelyen az MI-ügynökök összetett, többlépéses keresési feladatai tesztelhetők. A Gemini Deep Research kiválóan teljesített ezen, sőt az emberiség extrém műveltségi tesztjén (Humanity’s Last Exam) is, és messze lepipálta a böngészőalapú BrowserComp teszten a korábbi MI-ket. Egyedül az OpenAI ChatGPT 5 Pro szorongatta meg igazán, amely a böngészős teszten kicsit még jobb eredményt is ért el.

Ám gyorsan lefutott a verseny: a bemutatóval egy időben megjelent az OpenAI új, Fokhagyma (Garlic) kódnevű GPT 5.2 modellje, amely a legtöbb, köztük a saját mércéin is legyőzte a Google-t — vagyis a nagyok egy pillanatra sem hagyták leülni az MI-bajnokságot.

2025, adrienne, techcrunch.com alapján

Share on Social Media