
Minden simán megy? Nem egészen
Nem hagyható figyelmen kívül, hogy az első tapasztalatok jócskán árnyalják a képet. A két leggyakoribb panasz: a Gemini hangasszisztens nem érti meg pontosan a parancsokat (például ha valaki 17 órára állítana ébresztőt, az asszisztens 5 órára teszi), illetve nem képes helyesen vezérelni az otthoni okoseszközöket. Pedig a fények, zárak vezérlése és az egyszerű parancsok pontos végrehajtása egy hangasszisztensnél alapelvárásnak számít – különösen úgy, hogy a Google minden új okoshangszórón a Geminit teszi alapértelmezetté.
Gemini: új MI, új bonyodalmak
A változás része a Google generatív MI-jának beköltöztetése az okosotthon-alkalmazásába. Ez a Google Home új felhasználói felületén jelenik meg, ahol természetes nyelvi parancsokkal is utasíthatók az eszközök. Az újdonság a kamerák irányítására is kiterjed, bár még néhány funkció hiányzik. A Gemini aktiválása jelenleg csak egy bonyolult folyamaton keresztül lehetséges, amely október 28-án indult, és teljesen különáll a korábbi tesztektől. Ettől függetlenül a legtöbbeknek még várniuk kell, hiszen a Gemini csak jövő tavaszra lesz széles körben elérhető. Jelenleg a legtöbb felhasználónak még nincs is hozzáférése.
Beszéd, megértés, hibalehetőség
A Gemini célja, hogy teljesen új szintre emelje a Google hangasszisztensét, gördülékenyebb, természetesebb párbeszédekkel, könnyebb parancskiadással. A Google ígéri: többé nem kell kötött mondatokban beszélni, egyszerre több kérést is végre tud majd hajtani az asszisztens (például: Kapcsold fel a lámpákat mindenhol, kivéve a hálóban, indítsd el a tévét, zárd be a bejárati ajtót, és legyen kicsit melegebb). Legalábbis elvben. Egyelőre viszont több Reddit-felhasználó is jelezte: a parancsláncolás nem működik megfelelően, és a Gemini ebben visszalépést jelent a régebbi Google Assistant funkciókhoz képest.
Okosabb otthon, több kompromisszummal
Ettől függetlenül az MI-s hangasszisztensek lassú rajtja mögött főként az áll, hogy az okosotthon-parancsok végrehajtása továbbra sem problémamentes. A régi vezérlőasszisztensek (mint a korábbi Google Assistant vagy az eredeti Alexa) szigorúan előre programozott sémák szerint dolgoztak. A generatív MI-alapú, nagy nyelvi modellek (LLM) viszont teljesen más logikán működnek: ugyan könnyebben értik meg a beszéd szándékát, a hibalehetőség és a kiszámíthatatlanság azonban nagyságrendekkel nő.
Ezáltal arra lehet következtetni, hogy az okosotthonok teljes vezérlésétől az MI-asszisztensek még messze vannak – egyelőre maradnak a tesztek, az óvatos frissítések és a várakozás.
