2025. 03. 25., 13:24

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson
Ahogy a mesterséges intelligencia modellek komplexitása növekszik, úgy nő az energiaigényük is. 2024 novemberében az amerikai Szövetségi Energiaszabályozási Bizottság (FERC) elutasította az Amazon kérelmét, amelyben 180 megawatt energia közvetlen vásárlását kérte a Susquehanna atomerőműtől egy közeli adatközpont számára. Az indoklás szerint az ilyen közvetlen vásárlás sértené a többi felhasználó érdekeit.

Az AlexNet pillanat

Az energiaigény hirtelen növekedése 2012-ben kezdődött, amikor Alex Krizhevsky, Ilya Sutskever és Geoffrey E. Hinton, a Torontói Egyetem kutatói megalkották az AlexNet nevű konvolúciós neurális hálózatot. A modell több mint 60 millió paraméterrel és 650 ezer neuronnal rendelkezett, ami túl nagy volt ahhoz, hogy egyetlen GPU-n fusson. A kutatók ezért úgy döntöttek, hogy két GPU között osztják meg a terhelést – a neuronok egyik felét az egyik, a másik felét a másik GPU-ra helyezve.

Az AlexNet nemcsak megnyerte a 2012-es ImageNet versenyt, hanem egy jelentős áttörést is hozott: végérvényesen felszabadította az MI-modellek méretét az egyetlen processzor korlátai alól. Ez a szellem vissza már nem térhetett a palackba.

Az egyensúly művészete

Az AlexNet után az MI-modellek képzése egyre több GPU-t igényelt: tízet, százat, majd ezret. Meglepő módon az adatközpontok energiafogyasztása 2010 és 2020 között viszonylag stabil maradt, a hatékonyság folyamatos javulásának köszönhetően. Az Nvidia adatközponti chipjei ebben az időszakban körülbelül tizenötször hatékonyabbá váltak, ami segített ellensúlyozni a növekvő igényeket.

Ez a trend azonban drasztikusan megváltozott a hatalmas nyelvi modellek, például a ChatGPT, 2022-es megjelenésével. “Hatalmas ugrás következett be, amikor a transzformer modellek széles körben elterjedtek,” mondta Mosharaf Chowdhury, a Michigani Egyetem professzora. Bár az Nvidia tovább növelte hatékonyságát, az amerikai adatközpontok energiafogyasztása így is 76 TWh-ról (2018-ban) 176 TWh-ra nőtt 2023-ra.

Az MI életciklusa

A mai nyelvi modellek tízmilliárdnyi neuronnal rendelkeznek, megközelítve vagy akár túlszárnyalva az emberi agy idegsejtjeinek számát. Például a GPT-4 becslések szerint körülbelül 100 milliárd neuronnal, 100 rétegre osztva és több mint 100 billió paraméterrel bír.

A modell betanítása rendkívül számításigényes feladat – az OpenAI állítólag több mint 25 000 Nvidia Ampere 100 GPU-t használt 100 napon át. A becsült energiafelhasználás 50 gigawattóra, ami elegendő egy közepes méretű város egyéves energiaellátásához. A Google által közölt adatok szerint a képzési szakasz a MI-modellek teljes életciklusbeli energiafelhasználásának 40 százalékát teszi ki, míg a fennmaradó 60 százalék a következtetésre (inference) fordítódik.


Az MI modellek karcsúsítása

A növekvő energiafogyasztás arra sarkallta a számítástechnikai közösséget, hogy olyan módszereket dolgozzon ki, amelyek csökkentik a memória- és számítási igényt. “Az egyik megközelítés a számítások mennyiségének csökkentése,” mondta Jae-Won Chung, a Michigani Egyetem kutatója.

Kezdetben a kutatók a nyesést (pruning) alkalmazták, amely a paraméterek számának redukálására irányul. “Fogsz egy nagy modellt, és lepárolod egy kisebbre, a minőség megőrzése mellett,” magyarázta Chung.

Egy másik hatékony technika a kvantálás (quantization), amely során a paraméterek tárolási formátumát optimalizálják. Az MI-modellek rendszerint 32 bites lebegőpontos számokat használnak, de kisebb formátumra váltva csökkenthető a memóriaigény, és gyorsítható a számítás. Az Nvidia szerint a kvantálás-tudatos képzés 29-51 százalékkal mérsékelheti a memóriahasználatot.

Együtt befejezni

A modellek optimalizációján túl az adatközpontok működése is racionalizálható. A képzési feladatok egyenletes elosztása a 25 000 GPU között nem mindig eredményez hatékony működést. “Amikor a modellt 100 000 GPU-ra bontod szét, több dimenzióban kell szétosztani, és nehéz minden darabot pontosan azonos méretűre szabni,” mondta Chung.

Chung rájött, hogy ha a kisebb munkaterheléssel rendelkező GPU-k lassabban működnek, kevesebb energiát fogyasztva, akkor nagyjából egyszerre fejezik be a munkát a nagyobb terhelésű GPU-kkal, amelyek teljes sebességgel futnak. Ennek érdekében kifejlesztette a Perseus nevű szoftvereszközt, amely elemzi a GPU-k munkaterhelést és meghatározza az ideális futási sebességeket.

A Perseust az OpenAI GPT-3 nyilvánosan elérhető verziójának képzésén tesztelték, és az eredmények ígéretesek voltak. “A Perseus akár 30 százalékkal is csökkenthette az egész rendszer energiafogyasztását,” mondta Chung.

A zárt MI probléma

Miközben szakértők és elemzők próbálnak pontos képet alkotni az adatközpontok jövőbeli energiaigényéről, a valós adatok hiánya nehezíti a pontos kalkulációkat. A Lawrence Berkeley Laboratórium becslése szerint az adatközpontok éves energiafelhasználása 2028-ra 325 és 580 TWh között lehet az Egyesült Államokban – ez az ország teljes villamosenergia-fogyasztásának 6,7-12 százaléka.

Az EPRI arra figyelmeztet, hogy a hatás még jelentősebb lehet, mivel az adatközpontok jellemzően koncentrált helyeken működnek. Virginiában az áramfogyasztás 25 százalékát már most az adatközpontok emésztik fel, míg Írországban várhatóan az áramszükséglet egyharmadát fogják felemészteni.

A nagy nyelvi modellek futtatása jelenleg az adatközpontok energiafogyasztásának csupán 12 százalékát teszi ki, de ez változhat, ha olyan cégek, mint a Google, MI-modelleket integrálnak széles körben használt szolgáltatásaikba.

Chowdhury és Chung szerint azonban a nyilvánosság előtt elérhető számadatok gyakran megbízhatatlanok. “Semmit nem tudunk arról, mi zajlik a ChatGPT vagy a Gemini belsejében, mert az OpenAI és a Google sosem tették közzé az energiafogyasztási adataikat,” állítják.

MI-hatékonysági ranglista

A pontos adatok hiányában a ML Energy Initiative csapata saját méréseket végzett. A ZeusMonitor nevű eszközzel különböző GPU-k energiafogyasztását vizsgálták MI-modellek futtatása során.

A legnagyobb tesztelt modell a Meta Llama 3.1 405B volt, 405 milliárd paraméterrel. Ez kérésenként 3352,92 joule energiát fogyasztott két H100 GPU-n futva, ami körülbelül 0,93 wattóra – lényegesen kevesebb, mint a ChatGPT-re becsült 2,9 wattóra.

Ami továbbra is homályos, az a zártkörű modellek, például a GPT-4, a Gemini vagy a Grok teljesítménye. Chung és Chowdhury szerint a legnagyobb kihívást az átláthatóság hiánya jelenti. “Az olyan cégeknek, mint a Google vagy az OpenAI, nincs ösztönzésük arra, hogy felfedjék az energiafogyasztásukat. Sőt, az ilyen számok nyilvánosságra hozatala kárt okozna nekik,” mondta Chowdhury.

A fák az égig nőnek

“Az adatközpontok energiahatékonysága hasonló trendet mutat, mint a Moore-törvény – csak nagyobb léptékben, nem egyetlen chipre vonatkozóan,” mondta Dion Harris, az Nvidia adatközponti termékmarketingért felelős vezetője. Bár a rackek energiafogyasztása nő, a wattónkénti teljesítmény is jelentős javuláson megy keresztül.

Új, forradalmi technológiák is megjelennek a láthatáron. A fotonikus chipek, amelyek elektronok helyett fényt használnak az információ feldolgozására, nagyságrendekkel energiahatékonyabbak lehetnek a jelenlegi GPU-knál, és a neurális hálózatokat akár fénysebességgel is képesek futtatni.

Egy másik ígéretes fejlesztés a 2D-s félvezetők technológiája, amely lehetővé teszi rendkívül apró tranzisztorok építését, amelyek függőlegesen egymásra helyezhetők, ezáltal jelentősen növelve a számítási sűrűséget.

Ahogyan a történelem mutatja, ha valamit hatékonyabbá teszünk, az emberek hajlamosak többet használni belőle. De Chowdhury szerint, ha már nem áll rendelkezésre elegendő energia a fejlődés fenntartásához, a növekedés lelassul. “Az emberek azonban mindig is jók voltak a megoldások megtalálásában,” tette hozzá.

2025, adminboss, arstechnica.com alapján

  • Mit gondolsz, a személyes életünkben hogyan érinthet minket az adatközpontok növekvő energiafogyasztása?
  • Ha te lennél a FERC tagja, milyen alternatív megoldást javasolnál az Amazon kérelmének elutasítása helyett?
  • Szerinted mi lenne a legfontosabb lépés az AI rendszerek energiahatékonyságának javításában?


Legfrissebb posztok

MA 17:37

A Samsung titkos aduja lehet a Galaxy S25 FE

🔐 A Samsung hamarosan bemutatja az új Galaxy S26 modelleket, de a szivárgások szerint az elérhető árú verziók főleg csak apróbb fejlesztéseket kapnak...

MA 15:19

Az Xcode 26.3 elhozza az eszközön futó MI-fejlesztés erejét

💻 Frissült az Xcode, és a 26.3-as verzió már támogatja az ügynökalapú programozást...

MA 15:02

A Sysmon végre alapfunkció lesz a Windows 11-ben

💡 A Microsoft elindította a beépített Sysmon-támogatás tesztelését a Windows 11 rendszerben, igaz, egyelőre csak a Windows Insider programban részt vevő felhasználók élvezhetik az újdonságot...

MA 14:56

Az Nvidia és az OpenAI gigaüzlete füstbe ment: 36 billió forint

💸 Lényeges, hogy tavaly szeptemberben az Nvidia és az OpenAI szándéknyilatkozatot írt alá, miszerint az Nvidia akár 36 billió forint (100 milliárd dollár) értékben fektetne be az OpenAI MI-infrastruktúrájába...

MA 14:37

Az ingyenes MI-kamerák korszaka: így védheted az otthonod

Az okosotthonokba lassan bekúszik az MI, és ma már nem luxus, ha egy kamera felismeri a családtagokat, különbséget tesz egy futár és a saját kutyád között, vagy kiértékeli a nap eseményeit...

MA 14:20

Az Artemis II startja megint csúszik: hidrogénszivárgás a holdrakétán

🚀 A NASA újabb késést jelentett be az Artemis II misszióban, miután a rakéta főpróbáján ismét hidrogénszivárgást észleltek...

MA 14:02

Olvad az Antarktisz: összeomolhat a Föld szénelnyelője

🌨 A Nyugat-Antarktiszi jégtakaró olvadása meglepő változásokat idézhet elő abban, ahogyan a Déli-óceán elnyeli a légköri szén-dioxidot...

MA 13:55

Az óriás Tether meghátrál: milliárdokkal vágja vissza a tőkebevonást

💸 A Tether, a világ egyik legismertebb stabilcoin-kibocsátója drasztikusan visszafogta tőkebevonási terveit, miután a befektetők nem igazán voltak lenyűgözve az akár 180 000 milliárd forintos (500 milliárd USD) álomértékeléstől...

MA 13:19

A gerinc születésének titka: egy sorsfordító gén nyomában

A gerinces állatok, azaz az emlősök, halak, hüllők és kétéltűek fejlődésének rejtélyeit segíthet megfejteni egy friss genetikai kutatás...

MA 13:02

Az összehajtható telefonok 2026-ban már tényleg megérik?

📱 Érdemes megvizsgálni, mennyire éri meg összehajtható telefont venni 2026-ban, hiszen egyre több gyártó dob piacra ilyen készüléket, és a felhasználók véleménye is sokat árnyalja a képet...

MA 12:55

A fehérzajgép tönkreteheti az éjszakai nyugalmadat

Sokan használják a hálószobában a különféle hanggépeket, például pink noise-t (rózsaszín zajt), abban a hitben, hogy ezek elősegítik az egészséges alvást...

MA 12:36

Az óriás visszavág: a Walmart belép az egybillió dolláros klubba

A Walmart piaci értéke átlépte az 1 billió dolláros, vagyis 370 000 milliárd forintos határt, ezzel az amerikai kiskereskedelmi lánc bejutott a legértékesebb cégek szűk körébe, amelyet eddig főként techóriások uraltak...

MA 12:19

Az Igazságügyi Minisztérium ismét nekimegy a Google-nek

Az amerikai Igazságügyi Minisztérium (DOJ) újabb fellebbezést nyújtott be a Google ellen indított versenyjogi perben, amely az internetes kereső- és hirdetési piac monopolhelyzetéről szól...

MA 12:02

A nyers tej miatt halt meg egy újszülött Új-Mexikóban

😷 Egy Új-Mexikó-i újszülött életét vesztette liszteriózis következtében, miután édesanyja terhessége alatt nyers tejet ivott...

MA 11:56

A Gemini átveszi az irányítást a mobilod felett?

Az MI térhódítása az Android-eszközökön megállíthatatlanul halad előre, és a Gemini hamarosan olyan funkciókat kap, amelyekkel akár teljesen átveheti az irányítást a telefonod felett...

MA 11:37

Az MI-botok visszatértek: ma leálltak a ChatGPT és a Claude

🤖 Ma délután sokan nem tudták használni a ChatGPT-t, amikor a népszerű MI-csevegőbot részleges leállást szenvedett el...

MA 10:58

Az árnyék-CDC: ki tölti be a közegészségügyi űrt?

👀 Az amerikai közegészségügy történetének egyik legnagyobb válságát éli. A Centers for Disease Control and Prevention (CDC) évtizedeken át a megbízható, bizonyítékalapú egészségügyi iránymutatás és a járványügyi védelem csúcsintézménye volt...

MA 10:49

Az új vezér megfordítja a PayPal sorsát?

Hatalmas változás előtt áll a PayPal: Enrique Lores veszi át az irányítást, miután a társaság vezetése elégedetlen volt a korábbi vezérigazgató, Alex Chriss teljesítményével...

MA 10:42

A Holdon hatalmas villanást okozhat ez az aszteroida

Erre utal többek között az, hogy a 2024 YR4 nevű, épületméretű aszteroida 4,3%-os eséllyel csapódhat a Holdba 2032 decemberében, a becsapódás pedig akár szabad szemmel is megfigyelhető, látványos fényjelenséget eredményezhet...

MA 10:17

Az új Xbox 2027-ben érkezhet – odaszúrt az AMD

🎮 A Microsoft már gőzerővel dolgozik a következő generációs Xbox konzolon, amelyhez egyedi fejlesztésű AMD-chipeket használ majd...

MA 10:03

A valódi fedélzeti Wi-Fi: kipróbáltuk a United Starlinket

Utazásom során az internetkapcsolat majdnem olyan zavartalan volt, mintha otthon, a megszokott szélessávon lettem volna...

MA 09:57

Az igazságügy is hadat üzen a Google monopóliumának

Az amerikai Igazságügyi Minisztérium (DOJ) és több állam fellebbezést nyújtottak be, hogy még szigorúbb szankciókat érjenek el a Google ellen, miután a bíróság formálisan is megállapította a techcég monopolhelyzetét a keresőszolgáltatások terén...

MA 09:49

A szívinfarktus hét évvel előbb csap le a férfiakra

❤️ Az amerikai CARDIA-tanulmány alapján a férfiakat átlagosan hét évvel korábban érintik a szív- és érrendszeri betegségek, mint a nőket...

MA 09:33

Az OpenAI fölénye olvad, elszabadult az MI-verseny

Az OpenAI már nem uralja egyedüliként az MI-chatbotok piacát, az olyan riválisok, mint a Gemini és a Grok, egyre nagyobb teret nyernek...

MA 09:25

Az ázsiai techrészvények zuhannak: rettegés az MI-forradalomtól

📈 A mesterséges intelligencia rohamos térnyerése miatt világszerte komoly nyomás alatt vannak az informatikai vállalatok részvényei...

MA 08:57

Az új Galaxy S26: nappal és éjjel is közelebb hoz mindent

📷 A Samsung három hivatalos előzetessel kezdte beharangozni a Galaxy S26 sorozatot, amely várhatóan február 25-én mutatkozik be...

MA 08:49

Az új Pixel-frissítés: forradalom helyett csupán hibajavítások

A Google kiadta a 2026. februári frissítést a támogatott Pixel-telefonokra, ám ezúttal nem érdemes nagy újdonságokra vagy régóta várt javításokra számítani...

MA 08:42

Az újranépesített Yellowstone: farkasok, pumák és ragadozók játszmája

Az elmúlt ötven évben a Yellowstone Nemzeti Parkban a farkasok és pumák újbóli megjelenése forradalmasította a táplálékláncot...

MA 08:33

A növények új trükkjei leplezik le az életmentő gyógyszerek titkait

🌿 A növények saját védelmük érdekében kémiai fegyvereket gyártanak, köztük olyan alkaloidokat, mint a koffein és a nikotin, amelyeket az emberiség is felhasznál fájdalomcsillapításra, betegségek kezelésére és a mindennapokban...