2025. 03. 25., 13:24

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson
Ahogy a mesterséges intelligencia modellek komplexitása növekszik, úgy nő az energiaigényük is. 2024 novemberében az amerikai Szövetségi Energiaszabályozási Bizottság (FERC) elutasította az Amazon kérelmét, amelyben 180 megawatt energia közvetlen vásárlását kérte a Susquehanna atomerőműtől egy közeli adatközpont számára. Az indoklás szerint az ilyen közvetlen vásárlás sértené a többi felhasználó érdekeit.

Az AlexNet pillanat

Az energiaigény hirtelen növekedése 2012-ben kezdődött, amikor Alex Krizhevsky, Ilya Sutskever és Geoffrey E. Hinton, a Torontói Egyetem kutatói megalkották az AlexNet nevű konvolúciós neurális hálózatot. A modell több mint 60 millió paraméterrel és 650 ezer neuronnal rendelkezett, ami túl nagy volt ahhoz, hogy egyetlen GPU-n fusson. A kutatók ezért úgy döntöttek, hogy két GPU között osztják meg a terhelést – a neuronok egyik felét az egyik, a másik felét a másik GPU-ra helyezve.

Az AlexNet nemcsak megnyerte a 2012-es ImageNet versenyt, hanem egy jelentős áttörést is hozott: végérvényesen felszabadította az MI-modellek méretét az egyetlen processzor korlátai alól. Ez a szellem vissza már nem térhetett a palackba.

Az egyensúly művészete

Az AlexNet után az MI-modellek képzése egyre több GPU-t igényelt: tízet, százat, majd ezret. Meglepő módon az adatközpontok energiafogyasztása 2010 és 2020 között viszonylag stabil maradt, a hatékonyság folyamatos javulásának köszönhetően. Az Nvidia adatközponti chipjei ebben az időszakban körülbelül tizenötször hatékonyabbá váltak, ami segített ellensúlyozni a növekvő igényeket.

Ez a trend azonban drasztikusan megváltozott a hatalmas nyelvi modellek, például a ChatGPT, 2022-es megjelenésével. “Hatalmas ugrás következett be, amikor a transzformer modellek széles körben elterjedtek,” mondta Mosharaf Chowdhury, a Michigani Egyetem professzora. Bár az Nvidia tovább növelte hatékonyságát, az amerikai adatközpontok energiafogyasztása így is 76 TWh-ról (2018-ban) 176 TWh-ra nőtt 2023-ra.

Az MI életciklusa

A mai nyelvi modellek tízmilliárdnyi neuronnal rendelkeznek, megközelítve vagy akár túlszárnyalva az emberi agy idegsejtjeinek számát. Például a GPT-4 becslések szerint körülbelül 100 milliárd neuronnal, 100 rétegre osztva és több mint 100 billió paraméterrel bír.

A modell betanítása rendkívül számításigényes feladat – az OpenAI állítólag több mint 25 000 Nvidia Ampere 100 GPU-t használt 100 napon át. A becsült energiafelhasználás 50 gigawattóra, ami elegendő egy közepes méretű város egyéves energiaellátásához. A Google által közölt adatok szerint a képzési szakasz a MI-modellek teljes életciklusbeli energiafelhasználásának 40 százalékát teszi ki, míg a fennmaradó 60 százalék a következtetésre (inference) fordítódik.


Az MI modellek karcsúsítása

A növekvő energiafogyasztás arra sarkallta a számítástechnikai közösséget, hogy olyan módszereket dolgozzon ki, amelyek csökkentik a memória- és számítási igényt. “Az egyik megközelítés a számítások mennyiségének csökkentése,” mondta Jae-Won Chung, a Michigani Egyetem kutatója.

Kezdetben a kutatók a nyesést (pruning) alkalmazták, amely a paraméterek számának redukálására irányul. “Fogsz egy nagy modellt, és lepárolod egy kisebbre, a minőség megőrzése mellett,” magyarázta Chung.

Egy másik hatékony technika a kvantálás (quantization), amely során a paraméterek tárolási formátumát optimalizálják. Az MI-modellek rendszerint 32 bites lebegőpontos számokat használnak, de kisebb formátumra váltva csökkenthető a memóriaigény, és gyorsítható a számítás. Az Nvidia szerint a kvantálás-tudatos képzés 29-51 százalékkal mérsékelheti a memóriahasználatot.

Együtt befejezni

A modellek optimalizációján túl az adatközpontok működése is racionalizálható. A képzési feladatok egyenletes elosztása a 25 000 GPU között nem mindig eredményez hatékony működést. “Amikor a modellt 100 000 GPU-ra bontod szét, több dimenzióban kell szétosztani, és nehéz minden darabot pontosan azonos méretűre szabni,” mondta Chung.

Chung rájött, hogy ha a kisebb munkaterheléssel rendelkező GPU-k lassabban működnek, kevesebb energiát fogyasztva, akkor nagyjából egyszerre fejezik be a munkát a nagyobb terhelésű GPU-kkal, amelyek teljes sebességgel futnak. Ennek érdekében kifejlesztette a Perseus nevű szoftvereszközt, amely elemzi a GPU-k munkaterhelést és meghatározza az ideális futási sebességeket.

A Perseust az OpenAI GPT-3 nyilvánosan elérhető verziójának képzésén tesztelték, és az eredmények ígéretesek voltak. “A Perseus akár 30 százalékkal is csökkenthette az egész rendszer energiafogyasztását,” mondta Chung.

A zárt MI probléma

Miközben szakértők és elemzők próbálnak pontos képet alkotni az adatközpontok jövőbeli energiaigényéről, a valós adatok hiánya nehezíti a pontos kalkulációkat. A Lawrence Berkeley Laboratórium becslése szerint az adatközpontok éves energiafelhasználása 2028-ra 325 és 580 TWh között lehet az Egyesült Államokban – ez az ország teljes villamosenergia-fogyasztásának 6,7-12 százaléka.

Az EPRI arra figyelmeztet, hogy a hatás még jelentősebb lehet, mivel az adatközpontok jellemzően koncentrált helyeken működnek. Virginiában az áramfogyasztás 25 százalékát már most az adatközpontok emésztik fel, míg Írországban várhatóan az áramszükséglet egyharmadát fogják felemészteni.

A nagy nyelvi modellek futtatása jelenleg az adatközpontok energiafogyasztásának csupán 12 százalékát teszi ki, de ez változhat, ha olyan cégek, mint a Google, MI-modelleket integrálnak széles körben használt szolgáltatásaikba.

Chowdhury és Chung szerint azonban a nyilvánosság előtt elérhető számadatok gyakran megbízhatatlanok. “Semmit nem tudunk arról, mi zajlik a ChatGPT vagy a Gemini belsejében, mert az OpenAI és a Google sosem tették közzé az energiafogyasztási adataikat,” állítják.

MI-hatékonysági ranglista

A pontos adatok hiányában a ML Energy Initiative csapata saját méréseket végzett. A ZeusMonitor nevű eszközzel különböző GPU-k energiafogyasztását vizsgálták MI-modellek futtatása során.

A legnagyobb tesztelt modell a Meta Llama 3.1 405B volt, 405 milliárd paraméterrel. Ez kérésenként 3352,92 joule energiát fogyasztott két H100 GPU-n futva, ami körülbelül 0,93 wattóra – lényegesen kevesebb, mint a ChatGPT-re becsült 2,9 wattóra.

Ami továbbra is homályos, az a zártkörű modellek, például a GPT-4, a Gemini vagy a Grok teljesítménye. Chung és Chowdhury szerint a legnagyobb kihívást az átláthatóság hiánya jelenti. “Az olyan cégeknek, mint a Google vagy az OpenAI, nincs ösztönzésük arra, hogy felfedjék az energiafogyasztásukat. Sőt, az ilyen számok nyilvánosságra hozatala kárt okozna nekik,” mondta Chowdhury.

A fák az égig nőnek

“Az adatközpontok energiahatékonysága hasonló trendet mutat, mint a Moore-törvény – csak nagyobb léptékben, nem egyetlen chipre vonatkozóan,” mondta Dion Harris, az Nvidia adatközponti termékmarketingért felelős vezetője. Bár a rackek energiafogyasztása nő, a wattónkénti teljesítmény is jelentős javuláson megy keresztül.

Új, forradalmi technológiák is megjelennek a láthatáron. A fotonikus chipek, amelyek elektronok helyett fényt használnak az információ feldolgozására, nagyságrendekkel energiahatékonyabbak lehetnek a jelenlegi GPU-knál, és a neurális hálózatokat akár fénysebességgel is képesek futtatni.

Egy másik ígéretes fejlesztés a 2D-s félvezetők technológiája, amely lehetővé teszi rendkívül apró tranzisztorok építését, amelyek függőlegesen egymásra helyezhetők, ezáltal jelentősen növelve a számítási sűrűséget.

Ahogyan a történelem mutatja, ha valamit hatékonyabbá teszünk, az emberek hajlamosak többet használni belőle. De Chowdhury szerint, ha már nem áll rendelkezésre elegendő energia a fejlődés fenntartásához, a növekedés lelassul. “Az emberek azonban mindig is jók voltak a megoldások megtalálásában,” tette hozzá.

2025, adminboss, arstechnica.com alapján

  • Mit gondolsz, a személyes életünkben hogyan érinthet minket az adatközpontok növekvő energiafogyasztása?
  • Ha te lennél a FERC tagja, milyen alternatív megoldást javasolnál az Amazon kérelmének elutasítása helyett?
  • Szerinted mi lenne a legfontosabb lépés az AI rendszerek energiahatékonyságának javításában?


Legfrissebb posztok

MA 06:05

Történelmi események a mai napon (Május 20.)

Mi történt ezen a napon? Ritka sűrű nap a történelemben: a niceai első egyetemes zsinat megnyitásától a SI-rendszer megszületéséig, a Krakatau kitörésének kezdetétől Auschwitz első foglyain át a kozmikus mikrohullámú háttérsugárzás felfedezéséig számos fordulópont született...

kedd 14:24

A Szilícium-völgy válasza a csökkenő férfitermékenységre: spermaverseny

😱 Egy lényeges szempont, hogy az emberi spermiumok mérete mindössze 0,05 mm, vagyis akkora, mint egy hajszál vastagsága...

kedd 13:34

Az Apple-alkalmazásoknak álcázott Reaper kémvírus vadászik Mac-felhasználókra

Mac számítógépeket vett célba egy új, kifejezetten alattomos vírus, amely hivatalos Apple-összetevőket és frissítéseket imitál, hogy áldozatait megtévessze...

kedd 13:12

A Hektoria-gleccser példátlan összeomlása: 24 kilométer 15 hónap alatt

Az Antarktisz Hektoria-gleccsere döbbenetes tempóban omlott össze 2022 elejétől 2023 tavaszáig...

kedd 12:57

Az első bizonyíték a világon: 950 éves dingósír rituális etetéssel

🐱 950 éve temették el azt a házi dingót, amelyet az ősi Barkindji nép tagjai nemcsak elhantoltak, hanem fél évezreden át is tápláltak – legalábbis így értelmezhető az Ausztráliában, a Darling folyó partján most feltárt lelet...

kedd 12:46

A szövetségi kormány rohan a MI után – bírja a tempót?

🚀 Az elmúlt három évben látványosan felgyorsult a mesterséges intelligencia alkalmazása az amerikai államigazgatásban...

kedd 12:24

A világ első színes lidarja forradalmasítja az önvezetést és a robotikát

🚗 A jövő önvezető járművei és robotjai olyan érzékszervekhez jutnak, amelyekről eddig csak álmodhattak...

kedd 12:02

A Vezúv áldozatánál orvosi készlet került elő Pompejiben

Egy friss vizsgálat során kiderült, hogy Kr. u. 79-ben, a Vezúv kitörése idején Pompejiben elhunyt férfi orvosi felszerelést vitt magával menekülés közben...

kedd 11:45

A Spotify visszavonul: a zavaró diszkógömb-ikon hamarosan eltűnik

📷 A Spotify iOS-es változatán a napokban jelent meg a retró, diszkógömbös ikon: a változás a cég 20...

kedd 11:34

Az Oura Ring 5 három fejlesztéssel trónfoszthatja a Galaxy Ringet

💍 Bár az Oura Ring 4 nemrég jelent meg, és máris az egyik legjobb fitneszkövetőként tartják számon, még mindig akadnak területek, ahol tovább tudna fejlődni...

kedd 11:02

A húrelmélet váratlanul bukkant elő egyszerű fizikai szabályokból

🎯 Ha egy almát addig darabolsz, míg legkisebb összetevőit nem éred el, előbb molekulákat találsz, aztán atomokat, majd kvarkokat és gluonokat...

kedd 10:55

Az összekapcsolt ökoszisztémák: így hozhatjuk ki a legtöbbet a technológiából

🔗 Ebből következően fontos megérteni, hogy a vállalatok jövője nem azon fog múlni, ki vezeti be a legújabb, trendinek számító platformot, hanem azon, mennyire jól tudják egymáshoz kapcsolni meglévő technológiáikat és partnereiket...

kedd 10:47

A kiadási folyamat vakfoltja: négy MI-támadás 50 nap alatt

💡 Az elmúlt másfél hónapban egymás után négy, ellátási láncot célzó támadás érte az MI-ipar legnagyobb szereplőit, köztük az OpenAI-t, az Anthropicot és a Metát...

kedd 10:28

Az okosabb mediterrán diéta 31%-kal csökkenti a cukorbetegség kockázatát

🍊 Ez a jelenség jól illusztrálható azzal, hogy a kutatók egy jelentős spanyol vizsgálatban kimutatták: egy továbbfejlesztett mediterrán diéta – szerény kalóriamegszorítással, rendszeres testmozgással és életmódtámogatással kiegészítve – 31%-kal csökkentheti a 2-es típusú cukorbetegség kialakulásának esélyét...

kedd 10:02

A problémás tinik ipara belülről: amikor a segítség árt

Taylor Kiesel három éve nem tudta átaludni az éjszakát. Torkaszakadtából kiáltva riad fel, pánikban – mégsem adja fel: gyerekkora óta gyűjtött hüllőkkel veszi körül magát, mentett állatoknak ad otthont, így próbálja átalakítani dühét és szomorúságát valami értelmessé...

kedd 09:55

A Sony kihátrál a PC-ről – talán négy játék bánja

😰 Sony egyre szűkülő világa sok játékosnak okoz csalódást. Régen igazi menedék volt a PlayStation a rajongóknak, ma viszont egyre kevésbé ismerős az egész...

kedd 09:37

Az NYT Connections kifacsarja az agyad: tippek és megoldások

🧠 Jellemző példa erre, hogy a Connections szórejtvény napokra próbára teszi a leleményességet – a legújabb, 1073...

kedd 09:28

A kullancscsípések megugrottak: sokan a sürgősségin, térképen mutatjuk, hol

Az Amerikai Egyesült Államokban évek óta nem látott magasságba ugrott a kullancscsípések száma, ennek következtében idén szinte minden eddiginél többen jelennek meg a sürgősségi osztályokon...

APP
kedd 09:12

APPok, Amik Ingyenesek MA, 5/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     ContactVault Pro (iPhone/iPad)A ContactVault egy olyan korszerű névjegymentő alkalmazás, amely a személyes adatok védelmét helyezi előtérbe...

kedd 09:01

A szőlő mindennap: természetes napvédelem a bőrnek belülről

🍇 Jelentős, hogy a szőlőfogyasztás nemcsak egészségünkre van hatással, hanem a bőr védelmét is erősítheti a nap káros sugaraival szemben...

kedd 08:46

Az idegen romok felkutatása a Subnautica 2-ben: teendők és veszélyek

Erre utal többek között az, hogy a Subnautica 2-ben az idegen romok felderítése valódi próbatételt jelent...

kedd 08:37

A mai Quordle-t így győzöd le pillanatok alatt

Négy különböző magánhangzót tartalmaz a mai Quordle, ráadásul két megoldásban ismétlődnek betűk...

kedd 08:28

A Diablo 4-nek is sok a 2 401 kincsgoblin

A Diablo IV: A Gyűlölet Ura (Lord of Hatred) legújabb fejlesztései miatt a legelszántabb kincsvadászok teljesen elvesztették a fejüket...

kedd 08:20

Az Axum baktériumkultúra megszerzésének titka a Subnautica 2-ben

🧛 A Subnautica 2 világában az Axum baktériumkultúra az egyik legnehezebben hozzáférhető alapanyag, pedig elengedhetetlen, ha Metal Farmot szeretnél építeni...

kedd 07:37

A nagybankok milliárdjai új pályára állítják a Solanát

Az év elején a Solana elképesztő tempóban veszítette el mémcoinos címkéjét, miközben a kriptovilágot hűvösebb hangulat uralta...

kedd 07:28

Az ezerszer gyorsabb, mégis hűvös chip – még várnunk kell rá

A Tokiói Egyetem kutatói egy egészen új típusú chipet fejlesztettek, amely az információkat a szokásos elektromos áram helyett az elektronok mágneses tulajdonságait felhasználva kezeli...

kedd 07:19

A kontextusarchitektúra leváltja a RAG-ot, ahogy az ügynökalapú MI előretör

Az adatvezérelt vállalati megoldások folyamatosan új kihívásokkal szembesülnek, ahogy az MI-alapú ügynökök egyre fontosabbá válnak...

kedd 06:55

Az 1200 éves laoszi óriás halálkorsó csontvázak nemzedékeit őrzi

Észak-Laosz titokzatos Korsók Mezején régészek végre egyértelmű választ adtak egy évtizedes rejtélyre: a gigantikus, 1200 éves kőedények valóban temetkezési célt szolgáltak...

kedd 06:46

A halálos Ebola-járványt a WHO nemzetközi egészségügyi vészhelyzetté nyilvánította

Különösen említést érdemel, hogy az Ebola-járvány a Kongói Demokratikus Köztársaságban már több mint 100 halálos áldozatot követelt, miközben a feltételezett esetek száma meghaladja a 390-et...