Villámgyors képalkotás fénysebességgel, új korszak az optikai mesterséges intelligenciában

Villámgyors képalkotás fénysebességgel, új korszak az optikai mesterséges intelligenciában
A Los Angeles-i Kaliforniai Egyetem kutatói forradalmi áttörést értek el: optikai generatív modelleket fejlesztettek ki, amelyek teljesen új képeket képesek létrehozni a fény fizikai tulajdonságainak felhasználásával, a hagyományos digitális számítások helyett. Ez a megközelítés nemcsak felgyorsítja a mesterséges intelligencia tartalomgenerálását, hanem jelentősen csökkenti az energiafogyasztást is. Lényeges, hogy a jelenlegi generatív MI-modelleket óriási adathalmazok, jelentős hardverigény és ezzel együtt növekvő szénlábnyom jellemzi, így hosszú távon csak a fenntarthatóbb megoldások kínálhatnak kiutat.

Újragondolt képalkotás: amikor a fény teremti a képet

A kutatók egy sekély digitális kódolón és egy szabad térben működő, fény-diffrakción alapuló optikai dekóderen alapuló rendszert alkottak meg, ahol a generatív folyamat nagy részét maga a fény végzi. A véletlen zajból létrehozott optikai generatív magokat lézerfénnyel világítják meg a dekóderen, amely előre optimalizált, statikus kialakításának köszönhetően gyakorlatilag azonnal előállítja a kívánt képet. Érdemes megjegyezni, hogy a digitális modellekkel ellentétben, amelyek akár több ezer iterációval dolgoznak, itt egyetlen fényáteresztés is elegendő.

Kreativitás, gyorsaság, sokoldalúság

A kutatás eredményei szerint az optikai rendszerrel előállított képek – beleértve kézzel írt számjegyeket, ruhadarabokat, lepkéket, emberi arcokat vagy éppen Van Gogh stílusú festményeket – minőségben vetekednek a legfejlettebb digitális diffúziós modellekével. Kiemelendők a többszínű, nagy felbontású, művészi alkotások, amelyek jól mutatják, milyen széles körben alkalmazható az optikai MI. A kutatók kétféle keretrendszert fejlesztettek ki: a snapshot optikai generatív modellek egyetlen fényáteresztéssel hoznak létre friss képeket, míg az iteratív változatok a digitális diffúziót utánozva többlépcsős finomítást tesznek lehetővé – mindezt ugyanazon a hardveren, csupán a bemenet és a dekóder módosításával.

Biztonság, titkosítás, egyéni tartalom

Fontos szempont, hogy az optikai generatív modellek természetüknél fogva beépített adatvédelmet kínálnak. Egyetlen kódolt fázisminta különböző hullámhosszúságú fényekkel is megvilágítható, visszafejteni azonban csak az adott dekóderrel lehetséges – ez a védelem digitális eszközökkel nem érhető el. Így zárt, személyre szabott és biztonságos tartalomszolgáltatás vagy titkos kommunikáció is megvalósítható.


Jövő a zsebben – hordozható optikai MI-megoldások

A kutatók az optikai rendszerek miniatürizálását is célul tűzték ki: nanogyártással, passzív felületek vagy integrált fényelektronika alkalmazásával a technológia beépíthető lenne például okosszemüvegekbe, AR/VR headsetekbe vagy mobil eszközökbe. Ez arra utal, hogy a jövőben az MI valós időben, hordozható módon, azonnal képes lehet kreatív tartalmak előállítására, miközben minimalizálja az energiaigényt.

Ugyanakkor a fejlesztés távlatos jelentősége túlmutat a mindennapi technológiákon: a megoldás áttörést hozhat a biztonságos kommunikáció, az orvosi képalkotás vagy akár az elosztott MI területén is, lehetővé téve a fenntartható, villámgyors, személyre szabott tartalomgyártást.

2025, adminboss, phys.org alapján

  • Te mit gondolsz, etikailag rendben van-e, ha ilyen erős képalkotó MI-t hordozható eszközökbe tesznek?
  • Te mit tennél, ha túlzottan függővé válna a társadalom ezektől a gyors, energiahatékony MI-tartalmaktól?



Legfrissebb posztok

MA 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...

MA 16:37

Az MI újabb átverése: Kamu Nvidia-bemutató szedte áldozatait

Majdnem 100 ezer ember nézte végig, ahogy egy hamis, MI által megalkotott Jensen Huang prezentált egy Nvidia GTC főelőadást, amely valójában kriptovaluta-átverés volt...



MA 16:29

Tényleg erre vágyunk, hogy minden kütyüben MI legyen?

Kevin Rose egyszerű, de annál szemléletesebb szűrőt használ, amikor MI-hardverekbe fektet: ha valakit legszívesebben orrba vágnál azért, mert valamilyen kütyüt visel, inkább kerüld el azt a terméket – és jobb, ha nem ölsz pénzt ilyen fejlesztésbe sem...

MA 16:18

Az apró elektromotor, amely négy Teslát is lepipál

A brit YASA egy új, elképesztően kicsi elektromotort alkotott, amely teljesítményével bőven túlszárnyalja a jelenlegi rekorder motorokat...



MA 16:10

Az MI-chatbotok új generációjával mindenhol ott lehetsz

Az MI-alapú chatbotok forradalma elhozta azt a pillanatot, amikor bárki könnyedén létrehozhat saját, testreszabott virtuális asszisztenst, amely mindenhol bevethető – legyen szó weboldalról, közösségi platformokról vagy vállalati csapatmunkáról...

MA 16:00

Az Amazon elektromos furgonjai végre Kanadában is feltűntek

Az Amazon most először vetette be a Rivian által gyártott elektromos kiszállító furgonokat Kanadában: a Vancouver környékén már 50 ilyen jármű dolgozik...



MA 15:56

Az MI-vel készült zene tényleg olyan, mint az emberi?

🎵 Az MI által készített zene egyre közelebb áll ahhoz, hogy megkülönböztesse magát az emberi alkotástól – legalábbis, ami a hangzást illeti...

MA 15:46

Az MI bakija: Kamuhírekkel kevert szenátorbotrány a Google-nél

A Google kénytelen volt eltávolítani Gemma nevű MI-modelljét az AI Studio platformról, miután Marsha Blackburn amerikai szenátor panaszt tett: a rendszer hamis és súlyos vádakkal illette őt...



MA 15:37

Az 1 petabájtos SSD-k útja: a Meta új tárhelyvíziója

💾 A Meta új korszakot nyitna az adattárolásban és a GPU-kiszolgáló-infrastruktúrában, amikor 1 PB (1024 TB) kapacitású, E2 formátumú SSD-ket vezetne be...



MA 15:28

Az Nvidia óriási pénzzel dobja meg a Poolside-ot

Az Nvidia akár 360 milliárd forinttal is beszállhat a mesterséges intelligenciával foglalkozó Poolside nevű startupba...



MA 15:20

Amikor az állatvilág trükkösen félrevezeti az érzékelést

👀 Az optikai illúziók nem csupán az emberek kiváltsága: számos állat is észleli, sőt, ki is használja őket...

MA 14:46

Egy új vérteszt végre igazolja a krónikus fáradtság szindrómát

Tudósok a University of East Anglia és az Oxford BioDynamics közreműködésével olyan vértesztet fejlesztettek ki, amely 96 százalékos pontossággal képes kimutatni a krónikus fáradtság szindrómát (Myalgic Encephalomyelitis, ME/CFS)...

MA 14:38

A nagyvállalatok profitja már nem függ a dolgozók számától

📈 A technológiai szektorban drámai átalakulás zajlott le az elmúlt évtizedekben: már nem igaz, hogy a bevételnövekedéshez arányosan több dolgozóra van szükség...

MA 14:29

Új aranyláz, őrült roham a ritkaföldfémekért

Lényeges szempont, hogy a világgazdaság újabb nagy átalakuláson megy keresztül. Most nem az arany, nem az olaj, hanem a ritkaföldfémek pörgetik az árfolyamokat, és a befektetők szemében ezek értéke soha nem látott magasságokba emelkedik...

MA 14:19

Miért lassulhat az internet, a CGNAT mindannyiunkat érinti

📡 Ahogy rohamosan fogynak az IPv4-címek a világban, a szolgáltatók forradalmi, de nem problémamentes megoldáshoz fordultak: egyesek már több száz, vagy akár ezer felhasználót tesznek egyetlen IP-cím mögé a Carrier-Grade NAT (CGNAT) technológiával...



MA 14:03

Az Aqara G100 mindent tudó, olcsó biztonsági kamera

📺 A biztonsági kamerák piaca egyre zsúfoltabb, de kevés olyan eszköz akad, amely egyszerre ennyire megfizethető és sokoldalú, mint az Aqara legújabb modellje, a G100...



MA 13:46

Megjött az év legnagyobb Kickstarter-sikere: itt a Snapmaker U1

🚀 A Snapmaker végre bemutatta régóta várt U1 3D nyomtatóját, amely rekordot döntött a Kickstarteren: több mint 20 000 támogatóval közel 7,3 milliárd forintnyi előrendelést gyűjtött...

MA 13:28

Az önvezető taxik harca: a Baidu utolérte a Waymót

A Baidu Apollo Go szolgáltatása heti 250 ezer önvezető robotaxi-fuvart teljesít Kínában, így mostanra beérte az Alphabet Waymóját (Waymo), amely tavasszal szintén ekkora forgalmat jelentett be az Egyesült Államokban...



MA 13:19

Az MI-ügynökök védelme még mindig gyenge

🛡 Az utóbbi időben két új, figyelemre méltó tanulmány is napvilágot látott a nagy nyelvi modellek (LLM) biztonságával és a prompt injection támadásokkal kapcsolatban...