MA 07:58

Az OpenAI új képgenerátora a valóság határait feszegeti

Az OpenAI új képgenerátora a valóság határait feszegeti
Néhány hónap telt csak el az OpenAI korábbi, nagy előrelépést jelentő képgeneráló-frissítése óta, máris itt a következő nagy dobás: a ChatGPT Images 2.0. Ez a fejlesztés nem csupán szebb képeket eredményez, hanem hibátlanul képes infografikákat, prezentációkat, térképeket, sőt akár mangákat vagy nyelvileg sokszínű tartalmakat előállítani is. Már a tesztfázisban is lenyűgözte a felhasználókat az a képesség, hogy egyszerre több nyelven, akár több szövegdobozban, olvasható tipográfiával generál képeket — mindezt valósághű webes interfészekkel, képernyőképekkel, híres karakterekkel vagy komplex folyamatábrákkal fűszerezve.

Lehetőségek és képességek bővülése

Mostantól a ChatGPT minden előfizetési szintjén elérhető az új generáló, amely már alaprajzokat, képgyűjteményeket, több nézetből látható karakterfigurákat készít, sőt, feltöltött képeket is képes továbbfejleszteni. Az új GPT-Image-2 modell és az előfizetők számára kínált „Gondolkodó” funkciók a vizuális tartalom létrehozásához teljesen új szemléletet hoznak el. A fejlesztők szerint a képek is egyfajta nyelvként működnek: kiválasztanak, rendeznek és feltárnak — ahogyan egy jó mondat is teszi.

A piacon egyre nagyobb a verseny: idén év elején debütált a Gemini 3 Pro Image (más néven Gemini 3.1 Pro Image), azonban a ChatGPT Images 2.0 hűségesebben adja vissza a felhasználói felületeket, és egyszerre több, egymással összefüggő képet is képes generálni — jelenleg ezzel túlszárnyalja a Google legújabb próbálkozását is.

Fókuszban a biztonság és az etikus használat

Az MI-képek politikai kampányokban vagy félrevezető hirdetésekben való felhasználása miatt a cég megerősítette, hogy minden generált képet ellátnak metaadatokkal, így egyértelműen jelölhető, hogy MI által készült-e. A moderációs folyamat központi elem, különösen választási időszakban és a gyermekeknek szánt tartalmaknál. Az OpenAI továbbra is elérhetővé teszi a régebbi GPT-Image-1.5-öt is API-használók számára, de a fő fókusz már az újabb, fejlettebb modellé.

Forradalom az MI-képgenerálásban: az ok-okozati gondolkodás

A ChatGPT Images 2.0 legnagyobb technikai újítása az úgynevezett „O-szériás” ok-okozati logika. Ahelyett, hogy egyszerűen „lerajzolná”, amit kérünk, a rendszer átgondol, kutat és strukturál, mielőtt az első pixelt megrajzolná. Élő bemutatón például egy bonyolult PowerPoint-fájl stílusát és tartalmát is hűen követő posztert készített — felismerte a megfelelő logókat, a struktúrát és a stílust.

A modell képes valós időben az interneten keresni a legfrissebb adatokért, így az aktuális eseményeket vagy műszaki újdonságokat is helyesen illeszti be a képeibe. 2025 decemberi tudásbázissal dolgozik, így frissen és naprakészen teljesít.

A belső architektúráját teljesen újratervezték: a rendszer úgy működik, mint egy „általános MI” a képekhez, képes 3D-s nézőpontváltásra és bonyolult térbeli viszonyok megjelenítésére — mindehhez elegendő egy rövid szöveges prompt.


Döntő újítások: tipográfia, nyelvi sokszínűség, folyamatosság

Az új rendszer három fő előnye a tipográfiai pontosság, a többnyelvűség és az, hogy sorozatokban is egységesek maradnak a karakterek. Korábban az MI-képek egyik leleplező hibája volt az értelmezhetetlen szöveg; mostantól azonban részletgazdagon, akár tudományos diagramokon, menükben vagy infografikákon is olvashatók a feliratok szinte minden nyelven.

Kiemelkedő fejlesztés a nem latin betűs írásrendszerek támogatása: mostantól precízen megjelenik a japán, koreai, kínai, hindi és bengáli szöveg is. A mellékelt mintaképeken például koreaiul mutatja be a vízkörforgás lépéseit, szinte tankönyvi minőségben.

A kampánytervezőknek, íróknak, grafikusoknak pedig óriási könnyítés, hogy mostantól egyetlen utasításból akár nyolc egymáshoz kapcsolódó képet, sőt, összefüggő képregény- vagy márkaanyag-sorozatot is egyben generálhatnak. Ezáltal megszűnik a hosszas kézi szerkesztés, a karakterek és tárgyak pedig folytonosságot mutatnak a képek között.

Elérhetőség, árak, tudásbeli szintek

A rendszer alapváltozata minden felhasználónak hozzáférhető, a haladó „Gondolkodó” és „Pro” lehetőségek csak előfizetőknek járnak. A fejlesztők a GPT-Image-2 modellt API-n keresztül is elérhetővé tették, amely képeket tud generálni akár 4K felbontásban, 3:1 és 1:3 közötti képarányokkal.

Az árak jelenleg a következők: egy kép előállítása 2 700 forint, egy tárolt (cache-elt) beviteli parancs feldolgozása 700 forint, egy szöveges kimenet 3 800 forint.

A három hozzáférési szintet még nem részletezték teljesen, viszont biztos, hogy a „Gondolkodó” funkcióval a rendszer akár saját logikája alapján több lehetőséget átgondol, a weben kutat, vagy összefüggő sorozatokat készít. A „Pro” szint valószínűleg extra minőségű vagy mennyiségű képgenerálást jelent.

Biztonsági megoldások új szintje

Az OpenAI többrétegű biztonsági intézkedésrendszert vezetett be: vízjelezik az MI-képeket, fejlett szűrőmodellekkel védik a felnőtt és gyermek felhasználókat, valamint aktívan felügyelik a tartalmakat. Az MI-alkotói szabadság maximalizálására törekednek, de szigorúan tiltják a választási folyamatok befolyásolását.

Mit jelent ez a professzionális és vállalati felhasználóknak?

Az új rendszer nem egyszerű felbontásnövelés. A logikai gondolkodás integrációjával a „szándékszakadék” is megszűnik: többé nemcsak egy látványtervet, hanem indokolt, átgondolt, szerkesztett információkat is kapsz a képre integrálva. A rendszer például nemcsak egy enteriőrt rajzol le, hanem teljes alaprajzot, színpalettát, anyaglistát és inspirációs fotókat is ad egyben. Cserébe a „gondolkodás” több időt vesz igénybe, de még így is lényegesen gyorsabb a hagyományos tervezésnél.

Ahogy egyre többen kezdik használni a ChatGPT Images 2.0-t, világos, hogy az MI már nemcsak művészeti segéd, hanem teljes értékű, gazdasági értéket teremtő kreatív erő lehet. Hogy képes lesz-e teljesen helyettesíteni egy emberi tervező szándékát és ötletességét, még a jövő zenéje, de mostantól már valóban szorosabbá vált a verseny.

2026, adminboss, venturebeat.com alapján

Legfrissebb posztok

MA 11:11

Az űr citromcsigája: a Hubble ismét a Trifid-köd bűvöletében

A Hubble űrtávcső idén már 36 éves, és most egy igazán friss, lélegzetelállító képpel ünnepli ezt: a Nyilas (Sagittarius) csillagképben található Trifid-köd legkülönlegesebb alakzata, az űrbéli citromcsiga (Cosmic Sea Lemon) újra lencsevégre került...

MA 11:01

A bosszantó YouTube-értesítéseknek végre vége

A YouTube mobilon mostantól automatikusan némítja azoknak a csatornáknak a push-értesítéseit, amelyeket több mint egy hónapja nem követsz figyelemmel...

MA 10:57

Az amerikai tőke újra lángra lobbantja a Bitcoint

🔥 Lényeges szempont, hogy a bitcoin hónapok óta nem látott tempóban erősödik: 14 egymást követő napon át pozitív a Coinbase-prémium, ami legutóbb tavaly októberben történt, amikor a kriptopénz történelmi csúcson, 126 000 dolláron (kb...

MA 10:50

A mesterséges intelligencia leszámol a Firefox biztonsági hibáival

A Mozilla legfrissebb tesztjei során meglepő eredmények születtek: az Anthropic fejlesztette Mythos Preview MI-modellje 271 biztonsági sérülékenységet azonosított a hamarosan megjelenő Firefox 150 forráskódjában...

MA 10:44

Az OAuth sebezhetőségei: amikor az MI-eszközök kaput nyitnak a hekkereknek

Felmerül a kérdés, hogy miként fordulhat elő, hogy egyetlen alkalmazotti tevékenység elegendő ahhoz, hogy egy egész vállalati infrastruktúrát feltörjék...

MA 10:37

A Honor 600 Pro leveri az iPhone-t – de miért narancssárga?

🟢 A Honor legújabb középkategóriás készüléke, a 600 Pro, már első ránézésre is ismerős lehet – a teljes szélességű, vízszintes kamerasziget, a precízen megmunkált unibody kialakítás és a hátlapi lencsék elrendezése határozottan idézi a prémium telefonok világát...

MA 10:29

A Microsoft Game Pass végre olcsóbb Ausztráliában

🎉 Hatalmas meglepetést okozott a Microsoft azzal, hogy lejjebb vitte a PC- és Xbox Game Pass havidíjait – ezt Ausztráliában már meg is érezhetik a játékosok...

MA 10:22

Az 1300 elavult SharePoint-szerver továbbra is könnyű célpont

🚧 Több mint 1300 Microsoft SharePoint-szerver maradt védtelen egy veszélyes biztonsági rés miatt, amelyet eredetileg nulladik napi támadás során használtak ki, és jelenleg is folyamatosan támadnak...

MA 10:08

A mesterséges intelligencia elszabadult: 271 Firefox-hiba zúdult ránk

A Mozilla most először vetette be az Anthropic-féle Claude Mythos Preview-t, hogy átfésülje a Firefox forráskódját, és hirtelen 271 hibát sikerült feltárni a 150-es verziójában – eddig elképzelhetetlen tempóban...

MA 09:50

A Google új ügynökei már a személyes adataidban vájkálnak

🔎 A Google új szintre emelte kutató MI-ügynökeinek képességeit: a Deep Research és a Deep Research Max egyszerre képesek az internetet és a céges adatbázisokat is átfésülni, miközben átlátható, vizuális jelentéseket készítenek...

MA 09:43

Az anyaság ára: a Zoom és a Deloitte visszavesz a juttatásokból

💸 A vezető tech- és tanácsadó cégek kezdik visszanyesni azokat a juttatásokat, amelyeket eddig irigyelhettünk...

MA 09:36

A csalók réme: okos védelem, nyugalom gondok nélkül

🔒 Az online vásárlások és digitális szolgáltatások világában a csalás elleni védelem és a felhasználói élmény folyamatosan ütközik: ha túl szigorú a biztonság, a valódi ügyfelek is elpártolnak; viszont ha túl engedékeny, akkor megsokszorozódnak a kártékony visszaélések...

MA 09:28

A B–52 mechanikus agya menőbb, mint gondolnád

A 20. század légiflottáinak navigálása nem volt gyerekjáték, főleg a B-52 bombázók esetében...

MA 09:22

Az MI-cég titokban eltüntette az ellopott randifotókat

Hárommillió, az OkCupid oldalról begyűjtött profilfotó törlésére kényszerült a Clarifai nevű MI-vállalat, miután az Egyesült Államok Szövetségi Kereskedelmi Bizottságával (FTC) egyezségre jutott egy hosszan húzódó adatvédelmi ügyben...

MA 09:15

A Motorola Razr 2026 összes titka kiszivárgott

🕵 Erre utal többek között, hogy a közelgő Motorola Razr 2026 szinte minden műszaki részletét felfedte egy hatalmas szivárgás, jóval a hivatalos bejelentés előtt...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/22

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     BoobieTime Breastfeeding Timer (iPhone/iPad)A BoobieTime egy 2017-ben létrehozott digitális alkalmazás, melyet az alapítók első gyermekének születése ihletett...

MA 09:02

Az elektromos korszak hajnalán: rekordot dönt a napenergia

☀️ Az elmúlt évben a globális energiafogyasztás alakulása drámai változást hozott: az elektromos áram iránti kereslet kétszer gyorsabban nőtt, mint az összes energiafogyasztás...

MA 08:59

Az okosóra fokozza az egészségszorongást? Így védd magad!

Az egészségmegőrző okoseszközök egyre népszerűbbek, hiszen ígéretesen segítenek abban, hogy jobban megismerjük testünket és követni tudjuk egészségi állapotunkat...

MA 08:37

Az adatvédelem tűzvonalában: botrány Az Elme Szeme fejlesztőinél

🔒 Egyre nő a feszültség a Build A Rocket Boy (BARB) stúdiónál, ahol ezúttal nem a játék hibái, hanem a dolgozók jogainak megsértése került terítékre...

MA 08:23

A példátlan aszály szorongatja Floridát – meddig tart a válság?

Florida rendkívüli aszálytól szenved, amilyet az elmúlt 15 évben nem tapasztaltak...

MA 08:09

Az Uránusz és a Neptunusz mélyén bizarr anyagállapot rejtőzhet

💧 A Naprendszer távoli óriásbolygóinak belsejében a tudósok új, rendkívül furcsa anyagállapotra bukkantak...

MA 08:01

Az új Lotus kártevő lecsapott a venezuelai energiaszektorra

⚠ A venezuelai energia- és közműszolgáltatók ellen új, eddig nem dokumentált adatmegsemmisítő kártevőt, a Lotust vetették be 2025 végén...

MA 07:50

A viharfény rejtélye: fák, melyektől felizzik a levegő

Ez a jelenség jól illusztrálható azzal, hogy amerikai kutatók először figyeltek meg természeti körülmények között gyenge, ibolyaszínben derengő fényjelenséget a fák lombkoronáján vihar idején...

MA 07:42

Az új Framework Laptop Pro: a laptop, ami végre időtálló

Öt év fejlesztés, hat (vagy inkább hét) alaplap és folyamatos frissítések – ezt tudja felmutatni a Framework Laptop 13 története...

MA 07:36

Az új PS2-emulátor, amit minden retrójátékosnak kötelező kipróbálni

🎮 Tipikus helyzet, amikor egy régi kedvenc konzol játékait szeretnéd újra átélni egy modern hordozható gépen, de a tökéletes élményhez rengeteg apró beállítás és trükk szükséges...

MA 07:29

A MI-vel felturbózott Firefox 271 hibát javított rekordidő alatt

Mozilla fejlesztői elképesztő eredményt értek el az Anthropic Claude Mythos nevű MI-jével: 271 sebezhetőséget fedeztek fel és javítottak a Firefox legújabb verziójában, méghozzá úgy, hogy az MI minden olyan hibát felismer, amelyet egyébként az emberek is megtalálnának – csak sokkal gyorsabban...

MA 07:22

A végső tartalékain a Voyager–1: közeleg a Big Bang-manőver

Közel öt évtizednyi űrutazás után a Voyager 1 űrszonda ismét leállított egy tudományos műszert, hogy energiát spóroljon...

MA 07:15

Az idő visszafordítható? A kvantumfizika meglepő válasza

Mi lenne, ha az idő megfordulna, és az események visszafelé játszódnának le a legalapvetőbb szinten?..

MA 07:08

Az MI miatti leépítési hullám söpör végig a Wall Streeten

A nagy amerikai bankok látványos profitemelkedést értek el az idei év első negyedévében: a JPMorgan Chase, a Citi, a Bank of America, a Goldman Sachs, a Morgan Stanley és a Wells Fargo együtt 47 milliárd dolláros (kb...