2025. 03. 25., 13:24

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson
Ahogy a mesterséges intelligencia modellek komplexitása növekszik, úgy nő az energiaigényük is. 2024 novemberében az amerikai Szövetségi Energiaszabályozási Bizottság (FERC) elutasította az Amazon kérelmét, amelyben 180 megawatt energia közvetlen vásárlását kérte a Susquehanna atomerőműtől egy közeli adatközpont számára. Az indoklás szerint az ilyen közvetlen vásárlás sértené a többi felhasználó érdekeit.

Az AlexNet pillanat

Az energiaigény hirtelen növekedése 2012-ben kezdődött, amikor Alex Krizhevsky, Ilya Sutskever és Geoffrey E. Hinton, a Torontói Egyetem kutatói megalkották az AlexNet nevű konvolúciós neurális hálózatot. A modell több mint 60 millió paraméterrel és 650 ezer neuronnal rendelkezett, ami túl nagy volt ahhoz, hogy egyetlen GPU-n fusson. A kutatók ezért úgy döntöttek, hogy két GPU között osztják meg a terhelést – a neuronok egyik felét az egyik, a másik felét a másik GPU-ra helyezve.

Az AlexNet nemcsak megnyerte a 2012-es ImageNet versenyt, hanem egy jelentős áttörést is hozott: végérvényesen felszabadította az MI-modellek méretét az egyetlen processzor korlátai alól. Ez a szellem vissza már nem térhetett a palackba.

Az egyensúly művészete

Az AlexNet után az MI-modellek képzése egyre több GPU-t igényelt: tízet, százat, majd ezret. Meglepő módon az adatközpontok energiafogyasztása 2010 és 2020 között viszonylag stabil maradt, a hatékonyság folyamatos javulásának köszönhetően. Az Nvidia adatközponti chipjei ebben az időszakban körülbelül tizenötször hatékonyabbá váltak, ami segített ellensúlyozni a növekvő igényeket.

Ez a trend azonban drasztikusan megváltozott a hatalmas nyelvi modellek, például a ChatGPT, 2022-es megjelenésével. “Hatalmas ugrás következett be, amikor a transzformer modellek széles körben elterjedtek,” mondta Mosharaf Chowdhury, a Michigani Egyetem professzora. Bár az Nvidia tovább növelte hatékonyságát, az amerikai adatközpontok energiafogyasztása így is 76 TWh-ról (2018-ban) 176 TWh-ra nőtt 2023-ra.

Az MI életciklusa

A mai nyelvi modellek tízmilliárdnyi neuronnal rendelkeznek, megközelítve vagy akár túlszárnyalva az emberi agy idegsejtjeinek számát. Például a GPT-4 becslések szerint körülbelül 100 milliárd neuronnal, 100 rétegre osztva és több mint 100 billió paraméterrel bír.

A modell betanítása rendkívül számításigényes feladat – az OpenAI állítólag több mint 25 000 Nvidia Ampere 100 GPU-t használt 100 napon át. A becsült energiafelhasználás 50 gigawattóra, ami elegendő egy közepes méretű város egyéves energiaellátásához. A Google által közölt adatok szerint a képzési szakasz a MI-modellek teljes életciklusbeli energiafelhasználásának 40 százalékát teszi ki, míg a fennmaradó 60 százalék a következtetésre (inference) fordítódik.


Az MI modellek karcsúsítása

A növekvő energiafogyasztás arra sarkallta a számítástechnikai közösséget, hogy olyan módszereket dolgozzon ki, amelyek csökkentik a memória- és számítási igényt. “Az egyik megközelítés a számítások mennyiségének csökkentése,” mondta Jae-Won Chung, a Michigani Egyetem kutatója.

Kezdetben a kutatók a nyesést (pruning) alkalmazták, amely a paraméterek számának redukálására irányul. “Fogsz egy nagy modellt, és lepárolod egy kisebbre, a minőség megőrzése mellett,” magyarázta Chung.

Egy másik hatékony technika a kvantálás (quantization), amely során a paraméterek tárolási formátumát optimalizálják. Az MI-modellek rendszerint 32 bites lebegőpontos számokat használnak, de kisebb formátumra váltva csökkenthető a memóriaigény, és gyorsítható a számítás. Az Nvidia szerint a kvantálás-tudatos képzés 29-51 százalékkal mérsékelheti a memóriahasználatot.

Együtt befejezni

A modellek optimalizációján túl az adatközpontok működése is racionalizálható. A képzési feladatok egyenletes elosztása a 25 000 GPU között nem mindig eredményez hatékony működést. “Amikor a modellt 100 000 GPU-ra bontod szét, több dimenzióban kell szétosztani, és nehéz minden darabot pontosan azonos méretűre szabni,” mondta Chung.

Chung rájött, hogy ha a kisebb munkaterheléssel rendelkező GPU-k lassabban működnek, kevesebb energiát fogyasztva, akkor nagyjából egyszerre fejezik be a munkát a nagyobb terhelésű GPU-kkal, amelyek teljes sebességgel futnak. Ennek érdekében kifejlesztette a Perseus nevű szoftvereszközt, amely elemzi a GPU-k munkaterhelést és meghatározza az ideális futási sebességeket.

A Perseust az OpenAI GPT-3 nyilvánosan elérhető verziójának képzésén tesztelték, és az eredmények ígéretesek voltak. “A Perseus akár 30 százalékkal is csökkenthette az egész rendszer energiafogyasztását,” mondta Chung.

A zárt MI probléma

Miközben szakértők és elemzők próbálnak pontos képet alkotni az adatközpontok jövőbeli energiaigényéről, a valós adatok hiánya nehezíti a pontos kalkulációkat. A Lawrence Berkeley Laboratórium becslése szerint az adatközpontok éves energiafelhasználása 2028-ra 325 és 580 TWh között lehet az Egyesült Államokban – ez az ország teljes villamosenergia-fogyasztásának 6,7-12 százaléka.

Az EPRI arra figyelmeztet, hogy a hatás még jelentősebb lehet, mivel az adatközpontok jellemzően koncentrált helyeken működnek. Virginiában az áramfogyasztás 25 százalékát már most az adatközpontok emésztik fel, míg Írországban várhatóan az áramszükséglet egyharmadát fogják felemészteni.

A nagy nyelvi modellek futtatása jelenleg az adatközpontok energiafogyasztásának csupán 12 százalékát teszi ki, de ez változhat, ha olyan cégek, mint a Google, MI-modelleket integrálnak széles körben használt szolgáltatásaikba.

Chowdhury és Chung szerint azonban a nyilvánosság előtt elérhető számadatok gyakran megbízhatatlanok. “Semmit nem tudunk arról, mi zajlik a ChatGPT vagy a Gemini belsejében, mert az OpenAI és a Google sosem tették közzé az energiafogyasztási adataikat,” állítják.

MI-hatékonysági ranglista

A pontos adatok hiányában a ML Energy Initiative csapata saját méréseket végzett. A ZeusMonitor nevű eszközzel különböző GPU-k energiafogyasztását vizsgálták MI-modellek futtatása során.

A legnagyobb tesztelt modell a Meta Llama 3.1 405B volt, 405 milliárd paraméterrel. Ez kérésenként 3352,92 joule energiát fogyasztott két H100 GPU-n futva, ami körülbelül 0,93 wattóra – lényegesen kevesebb, mint a ChatGPT-re becsült 2,9 wattóra.

Ami továbbra is homályos, az a zártkörű modellek, például a GPT-4, a Gemini vagy a Grok teljesítménye. Chung és Chowdhury szerint a legnagyobb kihívást az átláthatóság hiánya jelenti. “Az olyan cégeknek, mint a Google vagy az OpenAI, nincs ösztönzésük arra, hogy felfedjék az energiafogyasztásukat. Sőt, az ilyen számok nyilvánosságra hozatala kárt okozna nekik,” mondta Chowdhury.

A fák az égig nőnek

“Az adatközpontok energiahatékonysága hasonló trendet mutat, mint a Moore-törvény – csak nagyobb léptékben, nem egyetlen chipre vonatkozóan,” mondta Dion Harris, az Nvidia adatközponti termékmarketingért felelős vezetője. Bár a rackek energiafogyasztása nő, a wattónkénti teljesítmény is jelentős javuláson megy keresztül.

Új, forradalmi technológiák is megjelennek a láthatáron. A fotonikus chipek, amelyek elektronok helyett fényt használnak az információ feldolgozására, nagyságrendekkel energiahatékonyabbak lehetnek a jelenlegi GPU-knál, és a neurális hálózatokat akár fénysebességgel is képesek futtatni.

Egy másik ígéretes fejlesztés a 2D-s félvezetők technológiája, amely lehetővé teszi rendkívül apró tranzisztorok építését, amelyek függőlegesen egymásra helyezhetők, ezáltal jelentősen növelve a számítási sűrűséget.

Ahogyan a történelem mutatja, ha valamit hatékonyabbá teszünk, az emberek hajlamosak többet használni belőle. De Chowdhury szerint, ha már nem áll rendelkezésre elegendő energia a fejlődés fenntartásához, a növekedés lelassul. “Az emberek azonban mindig is jók voltak a megoldások megtalálásában,” tette hozzá.

2025, adminboss, arstechnica.com alapján

  • Mit gondolsz, a személyes életünkben hogyan érinthet minket az adatközpontok növekvő energiafogyasztása?
  • Ha te lennél a FERC tagja, milyen alternatív megoldást javasolnál az Amazon kérelmének elutasítása helyett?
  • Szerinted mi lenne a legfontosabb lépés az AI rendszerek energiahatékonyságának javításában?


Legfrissebb posztok

MA 11:34

Az Oscar-díjas filmek helyett alattomos kártevőbe futhatsz

Tipikus eset, amikor mindenki igyekszik pótolni az Oscar-jelölteket, és eközben egy alattomos vírus vadászik a gyanútlan filmrajongókra...

MA 09:02

Az észvesztő számháború: új csúcsot döntött a pí

Fontos kérdés, mennyire érdemes az ősrégi matematikai rejtély, a pí soha véget nem érő tizedesjegyeit számolgatni, amikor már ott tartunk, hogy egyetlen szerver is képes volt 314 billió (!)..

MA 08:59

Az olcsó Russell Hobbs kávéfőző egy meglepően bosszantó hibát rejt

A Russell Hobbs Everyday Espresso Machine már első ránézésre kiváló választásnak tűnik azok számára, akik szeretnének áttérni a kapszulás főzésről a friss őrlemény használatára...

MA 08:50

Az életet vezérlő fánkfehérje: így szaporodnak a baktériumok

🍩 A sejtosztódás elengedhetetlen minden élőlény számára, de a baktériumokban ezt a folyamatot sokáig egy rejtélyes fehérje szabályozta...

MA 08:37

Az emberiség új nyomozói a Mars légkörének nyomába erednek

🔍 A Mars ma már igencsak eltér attól a bolygótól, ami több milliárd évvel ezelőtt lehetett: egykor bőven volt rajta folyékony víz, vastag légkör és jóval melegebb éghajlat...

MA 08:21

Az első nagy amerikai tengeri szélerőmű végre hálózatra kapcsolt

A Vineyard Wind névre keresztelt, gigantikus tengeri szélerőmű végre elkészült Massachusetts partjainál, és 62 turbina most már 800 megawatt tiszta energiát juttat a hálózatra, ellátva 400 000 otthont...

MA 07:57

A legjobb szórakozás titka: a könyvtár, amit imádni fogsz

A 2026-os szórakozás nagyjából olyan, mint egy kétélű kard: elképesztő, hogy bármikor, bárhonnan elérhetők a legjobb filmek és sorozatok, ráadásul olyan életszerűen, ahogy húsz éve még sci-fi lett volna...

MA 07:44

Az analóg hobbik visszatérnek: nagyi kedvencei újra hódítanak

Amikor Emma MacTaggart még csak 23 éves volt, már feltűnt neki, mennyire ritka lett a szabadideje, főleg, ha azt is figyelembe vesszük, mennyire nehéz volt azt képernyőmentesen eltölteni...

MA 07:36

Az új Windows 11-frissítés betöm egy veszélyes biztonsági rést

🔒 A Microsoft rendkívüli, azonnali (OOB) frissítéssel lépett fel a Windows 11 Enterprise eszközöket érintő súlyos sérülékenység ellen, amelyek a hagyományos Patch Tuesday javítócsomagok helyett ún...

MA 07:29

Az MI-videógenerátor, amit a Disney is kaszált – Hollywood leállítja

Nem hiszem el, de a ByteDance kénytelen volt felfüggeszteni az új Seedance 2...

MA 07:22

Az óceán mélyének titkos fegyverei: szuperdiagnosztikus fehérjék

🐋 Elképesztő ellenállóképességű, eddig rejtett fehérjék kerültek elő izlandi vulkáni tavakból és az Atlanti-óceán fenekén húzódó hidrotermális kürtők mélyéről...

MA 07:15

Az AppsFlyer Web SDK körül kriptolopási botrány robbant

🚨 Az AppsFlyer Web SDK-t egy rövid időre feltörték, és rosszindulatú kódot juttattak a rendszerbe, amellyel kriptovaluták ellopására alkalmas támadást hajtottak végre...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/15

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ForkYa!..

MA 07:08

Az ALS-fehérje lehet a hiányzó láncszem rák és demencia közt

🧠 Egy kulcsfontosságú fehérjéről, amely eddig főként az ALS-hez (amiotrófiás laterálszklerózis) és a demencia egyes formáihoz, például a frontotemporális demenciához kötődött, most kiderült, hogy jóval átfogóbb betegségi folyamatokban játszik szerepet, mint korábban gondolták...

MA 07:02

A kötelező fedélzeti kémkedés 2027-től jön

A következő autód már nemcsak a titkaidat őrzi, hanem mindent figyel majd veled kapcsolatban...

MA 06:58

A Mars ősi pókhálója: titokzatos víznyomok a vörös bolygón

🔬 Érdekes, pókhálószerű mintázatot fedezett fel a Curiosity a Mars felszínén. Ezek az egybefonódó, keskeny, 1-2 méter magas gerincek úgy szelik át a tájat, mint egy óriási pókháló, és a kutatók szerint fontos bizonyítékot hordoznak a bolygó vízmúltjáról...

MA 06:43

Hosszú szünet jön az F1-ben: a közel-keleti háború törölte a futamokat

🏁 Most őszintén, feltűnt már, hogy a Forma-1 vezetősége tényleg nem szeret kockáztatni?..

MA 06:36

Az új Spotify-csoda: mostantól te irányítod a zenét

A Spotify új csodafegyvere, a Taste Profile mostantól rád bízza, hogy finomhangold az algoritmus zenei ajánlásait...

MA 06:30

Az MI-hallucinációk tényleg rávesznek minket a túlköltésre?

Az elmúlt időszakban a San Diegó-i Kaliforniai Egyetemen végzett kutatás meglepő eredményre jutott: ha az emberek MI által készített termékösszefoglalókat olvasnak, nagyobb valószínűséggel döntenek a vásárlás mellett, mint amikor ember által írt értékelést olvasnak el...

MA 06:22

Az ikerrejtély: Elárulja-e a DNS, ki a tettes?

Felmerül a kérdés, hogy az egypetéjű ikrek megkülönböztethetők-e egymástól, ha DNS-nyomot hagynak egy bűncselekmény helyszínén...

MA 06:08

Az Apple ötven éve másképp gondolkodik – ez a titka

Ötven évvel ezelőtt egy apró garázsban indult útjára egy nagy ötlet, amelynek lényege az volt, hogy a technológia legyen minél személyesebb...

MA 06:06

Történelmi események a mai napon (Március 15.)

Erős nap a történelemben: kitör a magyar forradalom, lemond az utolsó orosz cár, és megszületik az első internetes domain...

szombat 21:46

Az ausztrál laborokban tápfolyadékot kapnak az idegsejtek

🧠 A nap kezdetén a melbourne-i Cortical Labs adatközpontjában nem a kávé és a szerverek zaja jelenti a rutint: a technikusok először egy agy-gerincvelői folyadékra emlékeztető oldatot töltenek a számítógépekbe...

szombat 21:35

Az E Ink monitor, amit jobb, ha csak megálmodsz

A Bigme B251 egy szemet gyönyörködtető újdonságként próbál berobbanni a monitorpiacra, hiszen 25,3 colos színes E Ink kijelzővel várja a felhasználókat...

szombat 21:23

Az új MacBook Air M5: király, vagy örök középső?

💻 Oké, mindenki figyeljen: megjelent az új MacBook Air M5, de ha instant forradalmat vársz, csalódni fogsz...

szombat 21:12

Az új MacBook Neóból ezek az appok hozzák ki a maximumot

💻 Az új MacBook Neo az Apple-től váratlanul alacsony áron jelent meg a héten, ami nagy meglepetést keltett a technológiai világban...

szombat 21:01

Valóban elűzi az internet unalmát a BuzzFeed kreatív játszótere?

A BuzzFeed ismét robbant: a cuki kvízeiről elhíresült oldal most egy igazán bevállalós új projektet indított Branch Office néven...

szombat 20:45

A papírnaptár, amelyre a Google Naptár is féltékeny

Oké, valljuk be: a hagyományos papírnaptárat még mindig semmi nem tudja teljesen kinyírni...

szombat 20:34

Az eltűnt skóciai római erőd titkainak nyomában

Skóciában régészek egy eddig ismeretlen római erőd maradványaira bukkantak, a Hadrianus-faltól jóval északabbra...