MA 07:58

Az OpenAI új képgenerátora a valóság határait feszegeti

Az OpenAI új képgenerátora a valóság határait feszegeti
Néhány hónap telt csak el az OpenAI korábbi, nagy előrelépést jelentő képgeneráló-frissítése óta, máris itt a következő nagy dobás: a ChatGPT Images 2.0. Ez a fejlesztés nem csupán szebb képeket eredményez, hanem hibátlanul képes infografikákat, prezentációkat, térképeket, sőt akár mangákat vagy nyelvileg sokszínű tartalmakat előállítani is. Már a tesztfázisban is lenyűgözte a felhasználókat az a képesség, hogy egyszerre több nyelven, akár több szövegdobozban, olvasható tipográfiával generál képeket — mindezt valósághű webes interfészekkel, képernyőképekkel, híres karakterekkel vagy komplex folyamatábrákkal fűszerezve.

Lehetőségek és képességek bővülése

Mostantól a ChatGPT minden előfizetési szintjén elérhető az új generáló, amely már alaprajzokat, képgyűjteményeket, több nézetből látható karakterfigurákat készít, sőt, feltöltött képeket is képes továbbfejleszteni. Az új GPT-Image-2 modell és az előfizetők számára kínált „Gondolkodó” funkciók a vizuális tartalom létrehozásához teljesen új szemléletet hoznak el. A fejlesztők szerint a képek is egyfajta nyelvként működnek: kiválasztanak, rendeznek és feltárnak — ahogyan egy jó mondat is teszi.

A piacon egyre nagyobb a verseny: idén év elején debütált a Gemini 3 Pro Image (más néven Gemini 3.1 Pro Image), azonban a ChatGPT Images 2.0 hűségesebben adja vissza a felhasználói felületeket, és egyszerre több, egymással összefüggő képet is képes generálni — jelenleg ezzel túlszárnyalja a Google legújabb próbálkozását is.

Fókuszban a biztonság és az etikus használat

Az MI-képek politikai kampányokban vagy félrevezető hirdetésekben való felhasználása miatt a cég megerősítette, hogy minden generált képet ellátnak metaadatokkal, így egyértelműen jelölhető, hogy MI által készült-e. A moderációs folyamat központi elem, különösen választási időszakban és a gyermekeknek szánt tartalmaknál. Az OpenAI továbbra is elérhetővé teszi a régebbi GPT-Image-1.5-öt is API-használók számára, de a fő fókusz már az újabb, fejlettebb modellé.

Forradalom az MI-képgenerálásban: az ok-okozati gondolkodás

A ChatGPT Images 2.0 legnagyobb technikai újítása az úgynevezett „O-szériás” ok-okozati logika. Ahelyett, hogy egyszerűen „lerajzolná”, amit kérünk, a rendszer átgondol, kutat és strukturál, mielőtt az első pixelt megrajzolná. Élő bemutatón például egy bonyolult PowerPoint-fájl stílusát és tartalmát is hűen követő posztert készített — felismerte a megfelelő logókat, a struktúrát és a stílust.

A modell képes valós időben az interneten keresni a legfrissebb adatokért, így az aktuális eseményeket vagy műszaki újdonságokat is helyesen illeszti be a képeibe. 2025 decemberi tudásbázissal dolgozik, így frissen és naprakészen teljesít.

A belső architektúráját teljesen újratervezték: a rendszer úgy működik, mint egy „általános MI” a képekhez, képes 3D-s nézőpontváltásra és bonyolult térbeli viszonyok megjelenítésére — mindehhez elegendő egy rövid szöveges prompt.


Döntő újítások: tipográfia, nyelvi sokszínűség, folyamatosság

Az új rendszer három fő előnye a tipográfiai pontosság, a többnyelvűség és az, hogy sorozatokban is egységesek maradnak a karakterek. Korábban az MI-képek egyik leleplező hibája volt az értelmezhetetlen szöveg; mostantól azonban részletgazdagon, akár tudományos diagramokon, menükben vagy infografikákon is olvashatók a feliratok szinte minden nyelven.

Kiemelkedő fejlesztés a nem latin betűs írásrendszerek támogatása: mostantól precízen megjelenik a japán, koreai, kínai, hindi és bengáli szöveg is. A mellékelt mintaképeken például koreaiul mutatja be a vízkörforgás lépéseit, szinte tankönyvi minőségben.

A kampánytervezőknek, íróknak, grafikusoknak pedig óriási könnyítés, hogy mostantól egyetlen utasításból akár nyolc egymáshoz kapcsolódó képet, sőt, összefüggő képregény- vagy márkaanyag-sorozatot is egyben generálhatnak. Ezáltal megszűnik a hosszas kézi szerkesztés, a karakterek és tárgyak pedig folytonosságot mutatnak a képek között.

Elérhetőség, árak, tudásbeli szintek

A rendszer alapváltozata minden felhasználónak hozzáférhető, a haladó „Gondolkodó” és „Pro” lehetőségek csak előfizetőknek járnak. A fejlesztők a GPT-Image-2 modellt API-n keresztül is elérhetővé tették, amely képeket tud generálni akár 4K felbontásban, 3:1 és 1:3 közötti képarányokkal.

Az árak jelenleg a következők: egy kép előállítása 2 700 forint, egy tárolt (cache-elt) beviteli parancs feldolgozása 700 forint, egy szöveges kimenet 3 800 forint.

A három hozzáférési szintet még nem részletezték teljesen, viszont biztos, hogy a „Gondolkodó” funkcióval a rendszer akár saját logikája alapján több lehetőséget átgondol, a weben kutat, vagy összefüggő sorozatokat készít. A „Pro” szint valószínűleg extra minőségű vagy mennyiségű képgenerálást jelent.

Biztonsági megoldások új szintje

Az OpenAI többrétegű biztonsági intézkedésrendszert vezetett be: vízjelezik az MI-képeket, fejlett szűrőmodellekkel védik a felnőtt és gyermek felhasználókat, valamint aktívan felügyelik a tartalmakat. Az MI-alkotói szabadság maximalizálására törekednek, de szigorúan tiltják a választási folyamatok befolyásolását.

Mit jelent ez a professzionális és vállalati felhasználóknak?

Az új rendszer nem egyszerű felbontásnövelés. A logikai gondolkodás integrációjával a „szándékszakadék” is megszűnik: többé nemcsak egy látványtervet, hanem indokolt, átgondolt, szerkesztett információkat is kapsz a képre integrálva. A rendszer például nemcsak egy enteriőrt rajzol le, hanem teljes alaprajzot, színpalettát, anyaglistát és inspirációs fotókat is ad egyben. Cserébe a „gondolkodás” több időt vesz igénybe, de még így is lényegesen gyorsabb a hagyományos tervezésnél.

Ahogy egyre többen kezdik használni a ChatGPT Images 2.0-t, világos, hogy az MI már nemcsak művészeti segéd, hanem teljes értékű, gazdasági értéket teremtő kreatív erő lehet. Hogy képes lesz-e teljesen helyettesíteni egy emberi tervező szándékát és ötletességét, még a jövő zenéje, de mostantól már valóban szorosabbá vált a verseny.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 09:36

A csalók réme: okos védelem, nyugalom gondok nélkül

🔒 Az online vásárlások és digitális szolgáltatások világában a csalás elleni védelem és a felhasználói élmény folyamatosan ütközik: ha túl szigorú a biztonság, a valódi ügyfelek is elpártolnak; viszont ha túl engedékeny, akkor megsokszorozódnak a kártékony visszaélések...

MA 09:28

A B–52 mechanikus agya menőbb, mint gondolnád

A 20. század légiflottáinak navigálása nem volt gyerekjáték, főleg a B-52 bombázók esetében...

MA 09:22

Az MI-cég titokban eltüntette az ellopott randifotókat

Hárommillió, az OkCupid oldalról begyűjtött profilfotó törlésére kényszerült a Clarifai nevű MI-vállalat, miután az Egyesült Államok Szövetségi Kereskedelmi Bizottságával (FTC) egyezségre jutott egy hosszan húzódó adatvédelmi ügyben...

MA 09:15

A Motorola Razr 2026 összes titka kiszivárgott

🕵 Erre utal többek között, hogy a közelgő Motorola Razr 2026 szinte minden műszaki részletét felfedte egy hatalmas szivárgás, jóval a hivatalos bejelentés előtt...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/22

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     BoobieTime Breastfeeding Timer (iPhone/iPad)A BoobieTime egy 2017-ben létrehozott digitális alkalmazás, melyet az alapítók első gyermekének születése ihletett...

MA 09:02

Az elektromos korszak hajnalán: rekordot dönt a napenergia

☀️ Az elmúlt évben a globális energiafogyasztás alakulása drámai változást hozott: az elektromos áram iránti kereslet kétszer gyorsabban nőtt, mint az összes energiafogyasztás...

MA 08:59

Az okosóra fokozza az egészségszorongást? Így védd magad!

Az egészségmegőrző okoseszközök egyre népszerűbbek, hiszen ígéretesen segítenek abban, hogy jobban megismerjük testünket és követni tudjuk egészségi állapotunkat...

MA 08:37

Az adatvédelem tűzvonalában: botrány Az Elme Szeme fejlesztőinél

🔒 Egyre nő a feszültség a Build A Rocket Boy (BARB) stúdiónál, ahol ezúttal nem a játék hibái, hanem a dolgozók jogainak megsértése került terítékre...

MA 08:23

A példátlan aszály szorongatja Floridát – meddig tart a válság?

Florida rendkívüli aszálytól szenved, amilyet az elmúlt 15 évben nem tapasztaltak...

MA 08:09

Az Uránusz és a Neptunusz mélyén bizarr anyagállapot rejtőzhet

💧 A Naprendszer távoli óriásbolygóinak belsejében a tudósok új, rendkívül furcsa anyagállapotra bukkantak...

MA 08:01

Az új Lotus kártevő lecsapott a venezuelai energiaszektorra

⚠ A venezuelai energia- és közműszolgáltatók ellen új, eddig nem dokumentált adatmegsemmisítő kártevőt, a Lotust vetették be 2025 végén...

MA 07:50

A viharfény rejtélye: fák, melyektől felizzik a levegő

Ez a jelenség jól illusztrálható azzal, hogy amerikai kutatók először figyeltek meg természeti körülmények között gyenge, ibolyaszínben derengő fényjelenséget a fák lombkoronáján vihar idején...

MA 07:42

Az új Framework Laptop Pro: a laptop, ami végre időtálló

Öt év fejlesztés, hat (vagy inkább hét) alaplap és folyamatos frissítések – ezt tudja felmutatni a Framework Laptop 13 története...

MA 07:36

Az új PS2-emulátor, amit minden retrójátékosnak kötelező kipróbálni

🎮 Tipikus helyzet, amikor egy régi kedvenc konzol játékait szeretnéd újra átélni egy modern hordozható gépen, de a tökéletes élményhez rengeteg apró beállítás és trükk szükséges...

MA 07:29

A MI-vel felturbózott Firefox 271 hibát javított rekordidő alatt

Mozilla fejlesztői elképesztő eredményt értek el az Anthropic Claude Mythos nevű MI-jével: 271 sebezhetőséget fedeztek fel és javítottak a Firefox legújabb verziójában, méghozzá úgy, hogy az MI minden olyan hibát felismer, amelyet egyébként az emberek is megtalálnának – csak sokkal gyorsabban...

MA 07:22

A végső tartalékain a Voyager–1: közeleg a Big Bang-manőver

Közel öt évtizednyi űrutazás után a Voyager 1 űrszonda ismét leállított egy tudományos műszert, hogy energiát spóroljon...

MA 07:15

Az idő visszafordítható? A kvantumfizika meglepő válasza

Mi lenne, ha az idő megfordulna, és az események visszafelé játszódnának le a legalapvetőbb szinten?..

MA 07:08

Az MI miatti leépítési hullám söpör végig a Wall Streeten

A nagy amerikai bankok látványos profitemelkedést értek el az idei év első negyedévében: a JPMorgan Chase, a Citi, a Bank of America, a Goldman Sachs, a Morgan Stanley és a Wells Fargo együtt 47 milliárd dolláros (kb...

MA 07:01

Az Ofcom nekimegy a Telegramnak és a tini chatoldalaknak

💥 Az Egyesült Királyság független kommunikációs hatósága, az Ofcom átfogó vizsgálatot indított a Telegram ellen, miután bizonyítékokat kapott arról, hogy a platform gyermekek szexuális bántalmazását ábrázoló anyagok (CSAM) terjesztésére szolgálhat...

MA 06:58

Az Atlanti-áramlat összeomolhat: Európára dermesztő jövő vár

Az Atlanti-óceán egyik legfontosabb áramlatrendszere, az úgynevezett Atlanti meridionális áramlási rendszer (AMOC) a Föld éghajlatának védőernyőjeként működik – egy óriási szállítószalag, amely az északi félteke felé szállítja a melegebb, déli vizeket, miközben a hideg vizeket dél felé szállítja...

MA 06:50

Az OpenClaw MI-kapuja 28 ezer gépet tesz egyszerre sebezhetővé

Az OpenClaw nevű MI-ügynök rohamosan terjed a hétköznapi munkafolyamatokban, de a biztonsági frissítések és óvintézkedések aligha tartják a lépést vele...

MA 06:43

Az Einstein-portrét fényből rajzoló kristály forradalmasíthatja az optikát

Az XPANCEO Emerging Technologies Research Center kutatói, a Nobel-díjas Konsztantyin Novoszjolov vezetésével, elképesztő optikai tulajdonságokat fedeztek fel az arzén-triszulfid (As2S3) kristályos félvezetőben...

MA 06:37

Az eltűnt űr- és atomkutatók: valami sötét készül a háttérben?

Majdnem egy tucat, űr- és nukleáris védelmi kutatásokhoz kapcsolódó amerikai tudós tűnt el, vagy halt meg gyanús körülmények között 2022 óta...

MA 06:29

Az adathalászok lecsaptak: óriási adatlopás a francia okmányirodánál

🔒 Franciaország egyik legfontosabb kormányzati ügynöksége, a France Titres (Agence nationale des titres sécurisés, ANTS) érzékeny adatszivárgást szenvedett el, miután hackertámadást hajtottak végre, és állampolgári adatokat loptak el...

MA 06:22

A Mac gépek új réme: a ClickFix jelszavakat és kriptót lop

🔒 A friss, ClickFix nevű támadási hullám célkeresztjében az ázsiai pénzügyi szektor dolgozói állnak, akik macOS-gépeket használnak...

MA 06:15

A YouTube lecsap a celeb deepfake-ekre – eltünteti az álarcokat

🕵 A generatív mesterséges intelligencia fantasztikus dolgokra képes, de pofátlanul ellophatja az ismert emberek arcát és hangját is...

MA 06:05

Történelmi események a mai napon (Április 22.)

Ma több korszakos fordulópont találkozott: Adolf Hitler a Führerbunkerben beismerte a vereséget, a világ pedig megélte a helikopterek első harci bevetését és az első szóló, megállás nélküli föld körüli vitorlázást...

MA 06:01

Az újabb SD-WAN-sebezhetőség a hackerek célkeresztjében

Az amerikai kibervédelmi hivatal, a CISA négy napot adott az állami szervezeteknek rendszereik befoltozására egy újabb, a támadók által már aktívan kihasznált SD-WAN Manager sebezhetőség miatt...

kedd 21:46

Az Opendoor visszatér: MI-lendület és tőzsdei rali a lakáspiacon

💰 Az Opendoor Technologies részvénye 11%-ot emelkedett egyetlen nap alatt, ahogy a cég egy merőben új útra lépett: most már teljesen MI-alapú, integrált lakáspiaci platformként pozicionálja magát...