
Komoly technológiai ugrás a képgenerálásban
Noha a Google már korábban piacra lépett saját képmódosító MI-jával, és ezt népszerűvé is tette, az OpenAI most új szintre emeli ezt a technológiát. Az új modell akár négyszer gyorsabb képgenerálást tesz lehetővé az elődjéhez képest, az API-n keresztül pedig 20 százalékkal olcsóbban kínálja a szolgáltatást — akár 500 forintért is elérhető az átlagfelhasználók számára.
Az újdonság lényege, hogy az MI a képeket és a szöveget egységesen, adathalmazként kezeli, nem külön művészeti vagy nyelvi elemekként. Ez azt jelenti, hogy ha például feltöltesz egy képet az édesapádról, majd beírod, hogy öltöztesse fel esküvői szmokingba, a rendszer pontosan ezt fogja tenni. Ezenkívül beállíthatjuk a személyek mozdulatát, nézőpontját, vagy akár teljesen módosíthatjuk a jelenetet is, miközben a személyazonosságuk felismerhető marad.
Könnyen kezelhető, beszélgetős képszerkesztés
Az OpenAI ezért külön, képekhez optimalizált felületet is kialakított a ChatGPT-ben, amely előre beállított szűrőket és népszerű szerkesztési javaslatokat kínál. Jellemző példa, hogy egy családi fotón egyszerre lehet szűrőket alkalmazni, módosítani az öltözetet, megváltoztatni a hátteret, vagy eltüntetni nem kívánt elemeket, mindezt néhány üzenetváltással.
Noha a GPT Image 1.5 elsőre nem mindig tökéletesen értelmezi az utasításokat, a generált képek részletgazdagabbak és hihetőbbek, mint az előző változathoz képest. Ha valaki mégis a korábbi ChatGPT-generátort szeretné használni, továbbra is elérhető külön opcióként.
A hamisítás egyre egyszerűbb
Az új MI elképesztő mértékben csökkenti a hamis képek készítéséhez szükséges erőfeszítést. Míg korábban egy-egy meggyőző hamisítványhoz szakértelem, idő és pénz kellett, ma már néhány kattintás elég, hogy bárki manipulált képeket hozzon létre. Emiatt a társadalomnak fokozatosan újra kell gondolnia, mennyiben lehet hitelesnek tartani a vizuális tartalmakat.
A szoftver képes megőrizni az arcok hasonlóságát minden szerkesztési lépés után, ami egyrészt óriási előnyt jelent a jogos fotómódosításokhoz, ugyanakkor vissza is élhetnek vele. Jellemző példa erre, hogy már eddig is készítettek a segítségével olyan képeket, melyeken igazi emberek szerepelnek engedély nélkül, kompromittáló helyzetben.
Biztonsági szűrők és korlátok
Noha az OpenAI szűrőket alkalmaz, hogy megakadályozza az erőszakos vagy szexuális tartalmak generálását, ezek a korlátok könnyen kijátszhatók, ha a felhasználó elég találékony. Érdekesség, hogy a képeken elhelyeznek egy digitális vízjelet, ami elvileg igazolja, hogy MI generálta őket — ez azonban elveszhet, ha a képet egyszerűen lementjük, majd újrafeltöltjük.
Ami régen a hamis plakátok vagy újságcímek automatizált létrehozásában akadály volt — vagyis az MI rosszul kezelte, eltorzította a szöveget —, azt most az új modell nagyrészt kiküszöböli. Már hosszabb, olvasható újságcikkek, címsorok és korrekt szövegek generálására is alkalmas.
Hol a határ?
Az OpenAI elismeri, hogy a modell még korántsem tökéletes: vannak problémák egyes rajzstílusokkal vagy tudományos pontosságot igénylő képek generálásával. Mindezek ellenére a platform fejlesztői úgy vélik, az MI még csak most kezdi igazán felforgatni a képalkotás világát. Noha a valóság és a manipuláció közötti határok egyre elmosódnak, a technológia naponta fejlődik — az újabb MI-forradalom tehát már a mindennapjainkat alakítja át.
