
Brutális újítások a képszerkesztésben
Az MI döbbenetes kreativitással dolgozik: például, ha feltöltesz egy törzset ábrázoló fotót, majd egy széket, a Gemini képes úgy szerkeszteni, hogy leültet téged a székre, akár új karokat és lábakat is generálva, amelyek eredetileg egyik képen sem szerepeltek. A logók vagy ruhadarabok kiegészítését, illetve a színek módosítását is gond nélkül elvégzi – például egy fekete nadrágot egyetlen utasításra azonnal világoskék farmerre cserél, mindenféle fennakadás nélkül.
Képeket összemoshatsz, az állatodat odaszerkesztheted magad mellé, gyorsan lecserélheted a háttérben a tapétát, sőt akár a világ bármely pontjára is “elvarázsolhatod” magad. A szerkesztések után a módosított képet újra feltöltheted, és az MI által rövid videóvá is alakíthatod.
Sebesség, minőség, kényelem
Az eredmények másodpercek alatt megszületnek, minden számítás a felhőben zajlik. Érdemes azonban megjegyezni, hogy még egy régebbi Pixel mobilon is villámgyorsan működik. Egy másik tesztnél például két szobor eltávolítását kérték egy lány mellől – a Gemini nemcsak eltüntette őket, hanem az árnyékokat is korrigálta a háttérben, és a lányt egy kattintással a piramisok elé helyezte.
A Google ezzel valódi veszélyt jelenthet az Adobe számára, hiszen mostantól a grafikusoknak percek vagy órák helyett elég néhány másodperc – amit eddig a Photoshoppal bonyolult utómunkával végeztünk, azt most egyszerűen kiadhatjuk hangban vagy szövegben utasításként.
Biztonság és árak
A Gemini által generált képek SynthID vízjellel vannak ellátva, ami segíti azok felismerését, csökkentve az álhírek, spam vagy uszítás okozta problémákat. Bár ez sem fogja teljesen megakadályozni a közelgő MI-spam áradatot, azért néhány biztonsági féket jelent. A rendszer ugyanakkor nem tökéletes: például történelmi személyeket vagy hírességeket (Taylor Swift, Donald Trump) gond nélkül generálni lehet, bár pornográf tartalmaknál szerencsére szigorúbb a szűrés.
Az MI képgeneráló rendszere versenyre kel az OpenAI vagy az xAI (Grok) vizuális megoldásaival is. A Google 8 820 Ft-ért (30 USD) kínál egymillió kimeneti tokent, egy-egy kép előállítása körülbelül 1 290 tokenbe (kb. 39 Ft) kerül. Mindez alapján kijelenthető, hogy megkezdődött a képszerkesztés új korszaka: a gyorsaság, a pontosság és az MI-alapú okosság látványosan megreformálja a hagyományos grafikai szoftverek használatát.