Az AI energiafaló, de a kutatók már dolgoznak a megoldáson

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson
Ahogy a mesterséges intelligencia modellek komplexitása növekszik, úgy nő az energiaigényük is. 2024 novemberében az amerikai Szövetségi Energiaszabályozási Bizottság (FERC) elutasította az Amazon kérelmét, amelyben 180 megawatt energia közvetlen vásárlását kérte a Susquehanna atomerőműtől egy közeli adatközpont számára. Az indoklás szerint az ilyen közvetlen vásárlás sértené a többi felhasználó érdekeit.

Az AlexNet pillanat

Az energiaigény hirtelen növekedése 2012-ben kezdődött, amikor Alex Krizhevsky, Ilya Sutskever és Geoffrey E. Hinton, a Torontói Egyetem kutatói megalkották az AlexNet nevű konvolúciós neurális hálózatot. A modell több mint 60 millió paraméterrel és 650 ezer neuronnal rendelkezett, ami túl nagy volt ahhoz, hogy egyetlen GPU-n fusson. A kutatók ezért úgy döntöttek, hogy két GPU között osztják meg a terhelést – a neuronok egyik felét az egyik, a másik felét a másik GPU-ra helyezve.

Az AlexNet nemcsak megnyerte a 2012-es ImageNet versenyt, hanem egy jelentős áttörést is hozott: végérvényesen felszabadította az MI-modellek méretét az egyetlen processzor korlátai alól. Ez a szellem vissza már nem térhetett a palackba.

Az egyensúly művészete

Az AlexNet után az MI-modellek képzése egyre több GPU-t igényelt: tízet, százat, majd ezret. Meglepő módon az adatközpontok energiafogyasztása 2010 és 2020 között viszonylag stabil maradt, a hatékonyság folyamatos javulásának köszönhetően. Az Nvidia adatközponti chipjei ebben az időszakban körülbelül tizenötször hatékonyabbá váltak, ami segített ellensúlyozni a növekvő igényeket.

Ez a trend azonban drasztikusan megváltozott a hatalmas nyelvi modellek, például a ChatGPT, 2022-es megjelenésével. “Hatalmas ugrás következett be, amikor a transzformer modellek széles körben elterjedtek,” mondta Mosharaf Chowdhury, a Michigani Egyetem professzora. Bár az Nvidia tovább növelte hatékonyságát, az amerikai adatközpontok energiafogyasztása így is 76 TWh-ról (2018-ban) 176 TWh-ra nőtt 2023-ra.

Az MI életciklusa

A mai nyelvi modellek tízmilliárdnyi neuronnal rendelkeznek, megközelítve vagy akár túlszárnyalva az emberi agy idegsejtjeinek számát. Például a GPT-4 becslések szerint körülbelül 100 milliárd neuronnal, 100 rétegre osztva és több mint 100 billió paraméterrel bír.

A modell betanítása rendkívül számításigényes feladat – az OpenAI állítólag több mint 25 000 Nvidia Ampere 100 GPU-t használt 100 napon át. A becsült energiafelhasználás 50 gigawattóra, ami elegendő egy közepes méretű város egyéves energiaellátásához. A Google által közölt adatok szerint a képzési szakasz a MI-modellek teljes életciklusbeli energiafelhasználásának 40 százalékát teszi ki, míg a fennmaradó 60 százalék a következtetésre (inference) fordítódik.


Az MI modellek karcsúsítása

A növekvő energiafogyasztás arra sarkallta a számítástechnikai közösséget, hogy olyan módszereket dolgozzon ki, amelyek csökkentik a memória- és számítási igényt. “Az egyik megközelítés a számítások mennyiségének csökkentése,” mondta Jae-Won Chung, a Michigani Egyetem kutatója.

Kezdetben a kutatók a nyesést (pruning) alkalmazták, amely a paraméterek számának redukálására irányul. “Fogsz egy nagy modellt, és lepárolod egy kisebbre, a minőség megőrzése mellett,” magyarázta Chung.

Egy másik hatékony technika a kvantálás (quantization), amely során a paraméterek tárolási formátumát optimalizálják. Az MI-modellek rendszerint 32 bites lebegőpontos számokat használnak, de kisebb formátumra váltva csökkenthető a memóriaigény, és gyorsítható a számítás. Az Nvidia szerint a kvantálás-tudatos képzés 29-51 százalékkal mérsékelheti a memóriahasználatot.

Együtt befejezni

A modellek optimalizációján túl az adatközpontok működése is racionalizálható. A képzési feladatok egyenletes elosztása a 25 000 GPU között nem mindig eredményez hatékony működést. “Amikor a modellt 100 000 GPU-ra bontod szét, több dimenzióban kell szétosztani, és nehéz minden darabot pontosan azonos méretűre szabni,” mondta Chung.

Chung rájött, hogy ha a kisebb munkaterheléssel rendelkező GPU-k lassabban működnek, kevesebb energiát fogyasztva, akkor nagyjából egyszerre fejezik be a munkát a nagyobb terhelésű GPU-kkal, amelyek teljes sebességgel futnak. Ennek érdekében kifejlesztette a Perseus nevű szoftvereszközt, amely elemzi a GPU-k munkaterhelést és meghatározza az ideális futási sebességeket.

A Perseust az OpenAI GPT-3 nyilvánosan elérhető verziójának képzésén tesztelték, és az eredmények ígéretesek voltak. “A Perseus akár 30 százalékkal is csökkenthette az egész rendszer energiafogyasztását,” mondta Chung.

A zárt MI probléma

Miközben szakértők és elemzők próbálnak pontos képet alkotni az adatközpontok jövőbeli energiaigényéről, a valós adatok hiánya nehezíti a pontos kalkulációkat. A Lawrence Berkeley Laboratórium becslése szerint az adatközpontok éves energiafelhasználása 2028-ra 325 és 580 TWh között lehet az Egyesült Államokban – ez az ország teljes villamosenergia-fogyasztásának 6,7-12 százaléka.

Az EPRI arra figyelmeztet, hogy a hatás még jelentősebb lehet, mivel az adatközpontok jellemzően koncentrált helyeken működnek. Virginiában az áramfogyasztás 25 százalékát már most az adatközpontok emésztik fel, míg Írországban várhatóan az áramszükséglet egyharmadát fogják felemészteni.

A nagy nyelvi modellek futtatása jelenleg az adatközpontok energiafogyasztásának csupán 12 százalékát teszi ki, de ez változhat, ha olyan cégek, mint a Google, MI-modelleket integrálnak széles körben használt szolgáltatásaikba.

Chowdhury és Chung szerint azonban a nyilvánosság előtt elérhető számadatok gyakran megbízhatatlanok. “Semmit nem tudunk arról, mi zajlik a ChatGPT vagy a Gemini belsejében, mert az OpenAI és a Google sosem tették közzé az energiafogyasztási adataikat,” állítják.

MI-hatékonysági ranglista

A pontos adatok hiányában a ML Energy Initiative csapata saját méréseket végzett. A ZeusMonitor nevű eszközzel különböző GPU-k energiafogyasztását vizsgálták MI-modellek futtatása során.

A legnagyobb tesztelt modell a Meta Llama 3.1 405B volt, 405 milliárd paraméterrel. Ez kérésenként 3352,92 joule energiát fogyasztott két H100 GPU-n futva, ami körülbelül 0,93 wattóra – lényegesen kevesebb, mint a ChatGPT-re becsült 2,9 wattóra.

Ami továbbra is homályos, az a zártkörű modellek, például a GPT-4, a Gemini vagy a Grok teljesítménye. Chung és Chowdhury szerint a legnagyobb kihívást az átláthatóság hiánya jelenti. “Az olyan cégeknek, mint a Google vagy az OpenAI, nincs ösztönzésük arra, hogy felfedjék az energiafogyasztásukat. Sőt, az ilyen számok nyilvánosságra hozatala kárt okozna nekik,” mondta Chowdhury.

A fák az égig nőnek

“Az adatközpontok energiahatékonysága hasonló trendet mutat, mint a Moore-törvény – csak nagyobb léptékben, nem egyetlen chipre vonatkozóan,” mondta Dion Harris, az Nvidia adatközponti termékmarketingért felelős vezetője. Bár a rackek energiafogyasztása nő, a wattónkénti teljesítmény is jelentős javuláson megy keresztül.

Új, forradalmi technológiák is megjelennek a láthatáron. A fotonikus chipek, amelyek elektronok helyett fényt használnak az információ feldolgozására, nagyságrendekkel energiahatékonyabbak lehetnek a jelenlegi GPU-knál, és a neurális hálózatokat akár fénysebességgel is képesek futtatni.

Egy másik ígéretes fejlesztés a 2D-s félvezetők technológiája, amely lehetővé teszi rendkívül apró tranzisztorok építését, amelyek függőlegesen egymásra helyezhetők, ezáltal jelentősen növelve a számítási sűrűséget.

Ahogyan a történelem mutatja, ha valamit hatékonyabbá teszünk, az emberek hajlamosak többet használni belőle. De Chowdhury szerint, ha már nem áll rendelkezésre elegendő energia a fejlődés fenntartásához, a növekedés lelassul. “Az emberek azonban mindig is jók voltak a megoldások megtalálásában,” tette hozzá.

2025, adminboss, arstechnica.com alapján

  • Mit gondolsz, a személyes életünkben hogyan érinthet minket az adatközpontok növekvő energiafogyasztása?
  • Ha te lennél a FERC tagja, milyen alternatív megoldást javasolnál az Amazon kérelmének elutasítása helyett?
  • Szerinted mi lenne a legfontosabb lépés az AI rendszerek energiahatékonyságának javításában?


Legfrissebb posztok

MA 20:49

Az álláspiac pokla: elértéktelenedő diplomák, pályázatok özönvízben

A fiatal pályakezdők helyzete drámaian nehezebbé vált az utóbbi években, mert a hagyományos munkaerő-felvételi szűrők, mint az egyetemi jegyek, motivációs levelek és az interjúk, ma már szinte semmit sem érnek...

MA 20:34

A Fortinet újabb botránya: súlyos veszélyben az adminfiókok

🔒 Kiberbűnözők kritikus hibákat használnak ki több Fortinet-termékben, hogy illetéktelenül hozzáférjenek adminisztrátori fiókokhoz, és ellopják a rendszer konfigurációs fájljait...

MA 20:17

A Lovable, Európa MI-sztárja, ismét rekordot döntött

A stockholmi székhelyű Lovable, Európa vezető vibe coding startupja a legújabb finanszírozási körében 2 400 milliárd forintos (6,6 milliárd dolláros) értékelést kapott...

MA 20:02

Az arcpirító titok, amit a római üvegpoharak rejtenek

Lényeges szempont, hogy néha elég a legalapvetőbb dolgokra más szögből ránézni, és máris évszázados titkok derülnek ki...

MA 19:32

A mesterséges intelligencia mentheti meg a Firefoxot?

Anthony Enzor-DeMeo lett a Mozilla új vezérigazgatója, aki az elmúlt évben már a Firefox böngésző fejlesztését irányította...

MA 19:19

Az emelkedő hőség nemi katasztrófát hozhat a hüllőkre

🐍 Csillagos ég alatt, ragyogó szigetek, magányos teknősök: sok hüllő sorsa látszólag változatlan...

MA 19:02

A bukott ukrán csalóközpont: vége a többmilliárdos lehúzásnak

🔒 Európai bűnüldöző szervek egy Ukrajnában működő csalóhálózatot számoltak fel, amely call centerekből irányított műveletekkel több mint 10 millió eurót (kb...

MA 18:52

Az új Soocas NEOS II: tényleg mindent visz ez a fogkefe?

A fogápolási eszközök piacán ritkán jelenik meg valóban újdonság, de a Soocas NEOS II valóban figyelemre méltó...

MA 18:34

A kiégés ellenszere: filozófia az üresség korában

🧠 Sokan érzik úgy, hogy nem kiégtek, hanem egyszerűen üresek belül – dolgoznak, teljesítik a határidőket, mosolyognak a megbeszéléseken, mégis súlytalannak és céltalannak tűnik a munkájuk...

MA 18:17

Az ínybetegség elleni küzdelem forradalmi, kíméletes megoldása

😊 A tudósok forradalmi megközelítést találtak az ínybetegségek megelőzésére: nem az összes baktérium elpusztítására törekednek, hanem a köztük zajló kommunikáció megzavarására összpontosítanak...

MA 17:33

A szuperqubit áttörése alapjaiban írhatja át a számítástechnikát

A Princeton Egyetem kutatóinak sikerült egy minden eddiginél ellenállóbb kvantumbitet (qubitet) létrehozniuk, amely akár 1,68 ezredmásodpercig is képes megőrizni az információt – ez 15-szörös ugrás a jelenlegi kereskedelmi modellekhez képest, amelyeket például a Google és az IBM használnak...

MA 17:20

Az önvezető taxik háborúja: sci-fiből valóság, kőkemény verseny

🚗 Kezdetben az önvezető taxik még csak álomnak tűntek, egy évtizeddel ezelőtt is legfeljebb sci-fikben találkozhattunk velük...

MA 17:02

A svéd 5000 éves kutyalelet és a tőr hátborzongató rejtélye

Egy svéd mocsárból került elő egy szinte teljes kutyacsontváz, mellette egy csontból faragott tőr is hevert – a maradványok öt évezredesek, és a régészek szerint a lelet egy titokzatos kőkori szertartásra utalhat...

MA 16:49

Az Alpok gleccserei nyolc éven belül végveszélyben

Egy friss kutatás szerint az Alpokban található gleccserek pusztulása nyolc éven belül drámai ütemet ér el...

MA 16:33

Az Exchange Online száműzi az elavult mobilokat

A Microsoft 2026. március 1-jétől letiltja azokat a mobileszközöket, amelyek régebbi levelezőszoftverekkel próbálnak csatlakozni az Exchange Online-hoz...

MA 16:17

Az RC4-nek vége: a Microsoft lekapcsolja a veszélyes titkosítást

Több mint 26 évnyi problémás működés után a Microsoft végre megszabadul attól a Windowsban használt titkosítási algoritmustól, amely számos komoly kiberbiztonsági rést hagyott szerte a világban...

MA 16:01

Az MI feltárja a DNS-be kódolt betegségek titkait

A Mount Sinai orvosi kar legújabb fejlesztése egy olyan MI-rendszer, amely nemcsak veszélyes genetikai mutációkat ismer fel, hanem azt is képes előre jelezni, milyen betegségek kialakulására van a legnagyobb esély...

MA 15:35

Az újrahasznosítás rémálma: berobban a rugalmas anyagok forradalma

♻ A rugalmas ruhák, mint a leggings vagy a sportruházat, szinte lehetetlen újrahasznosítani—ezért a legtöbbjük szeméttelepen végzi, még akkor is, ha elvisszük a szelektív gyűjtőbe...

MA 15:18

Az élet szikrája: RNS születhetett magától az ősi Földön

⚡ Évmilliárdokkal ezelőtt, nem sokkal a Föld kialakulása után, már jelen lehettek azok az anyagok, amelyekből az élet kialakult...