Az OpenAI képgenerátora bárkiből pillanatok alatt mesterhamisítót csinál

Az OpenAI legújabb fejlesztése, a GPT Image 1.5, forradalmi egyszerűséggel teszi lehetővé a fotók manipulálását. Míg régen egy hitelesnek tűnő kép módosításához sötétkamra, komoly Photoshop-tudás vagy legalább egy jó olló kellett, most már elegendő beírni egy mondatot a ChatGPT felületén. Emiatt ma már szinte bárki képes látványosan valósághű képeket szerkeszteni, mindenféle művészi képzettség nélkül.

Komoly technológiai ugrás a képgenerálásban

Noha a Google már korábban piacra lépett saját képmódosító MI-jával, és ezt népszerűvé is tette, az OpenAI most új szintre emeli ezt a technológiát. Az új modell akár négyszer gyorsabb képgenerálást tesz lehetővé az elődjéhez képest, az API-n keresztül pedig 20 százalékkal olcsóbban kínálja a szolgáltatást — akár 500 forintért is elérhető az átlagfelhasználók számára.

Az újdonság lényege, hogy az MI a képeket és a szöveget egységesen, adathalmazként kezeli, nem külön művészeti vagy nyelvi elemekként. Ez azt jelenti, hogy ha például feltöltesz egy képet az édesapádról, majd beírod, hogy öltöztesse fel esküvői szmokingba, a rendszer pontosan ezt fogja tenni. Ezenkívül beállíthatjuk a személyek mozdulatát, nézőpontját, vagy akár teljesen módosíthatjuk a jelenetet is, miközben a személyazonosságuk felismerhető marad.

Könnyen kezelhető, beszélgetős képszerkesztés

Az OpenAI ezért külön, képekhez optimalizált felületet is kialakított a ChatGPT-ben, amely előre beállított szűrőket és népszerű szerkesztési javaslatokat kínál. Jellemző példa, hogy egy családi fotón egyszerre lehet szűrőket alkalmazni, módosítani az öltözetet, megváltoztatni a hátteret, vagy eltüntetni nem kívánt elemeket, mindezt néhány üzenetváltással.

Noha a GPT Image 1.5 elsőre nem mindig tökéletesen értelmezi az utasításokat, a generált képek részletgazdagabbak és hihetőbbek, mint az előző változathoz képest. Ha valaki mégis a korábbi ChatGPT-generátort szeretné használni, továbbra is elérhető külön opcióként.

A hamisítás egyre egyszerűbb

Az új MI elképesztő mértékben csökkenti a hamis képek készítéséhez szükséges erőfeszítést. Míg korábban egy-egy meggyőző hamisítványhoz szakértelem, idő és pénz kellett, ma már néhány kattintás elég, hogy bárki manipulált képeket hozzon létre. Emiatt a társadalomnak fokozatosan újra kell gondolnia, mennyiben lehet hitelesnek tartani a vizuális tartalmakat.

A szoftver képes megőrizni az arcok hasonlóságát minden szerkesztési lépés után, ami egyrészt óriási előnyt jelent a jogos fotómódosításokhoz, ugyanakkor vissza is élhetnek vele. Jellemző példa erre, hogy már eddig is készítettek a segítségével olyan képeket, melyeken igazi emberek szerepelnek engedély nélkül, kompromittáló helyzetben.

Biztonsági szűrők és korlátok

Noha az OpenAI szűrőket alkalmaz, hogy megakadályozza az erőszakos vagy szexuális tartalmak generálását, ezek a korlátok könnyen kijátszhatók, ha a felhasználó elég találékony. Érdekesség, hogy a képeken elhelyeznek egy digitális vízjelet, ami elvileg igazolja, hogy MI generálta őket — ez azonban elveszhet, ha a képet egyszerűen lementjük, majd újrafeltöltjük.

Ami régen a hamis plakátok vagy újságcímek automatizált létrehozásában akadály volt — vagyis az MI rosszul kezelte, eltorzította a szöveget —, azt most az új modell nagyrészt kiküszöböli. Már hosszabb, olvasható újságcikkek, címsorok és korrekt szövegek generálására is alkalmas.

Hol a határ?

Az OpenAI elismeri, hogy a modell még korántsem tökéletes: vannak problémák egyes rajzstílusokkal vagy tudományos pontosságot igénylő képek generálásával. Mindezek ellenére a platform fejlesztői úgy vélik, az MI még csak most kezdi igazán felforgatni a képalkotás világát. Noha a valóság és a manipuláció közötti határok egyre elmosódnak, a technológia naponta fejlődik — az újabb MI-forradalom tehát már a mindennapjainkat alakítja át.

2025, adminboss, arstechnica.com alapján