2025. 03. 25., 13:24

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson
Ahogy a mesterséges intelligencia modellek komplexitása növekszik, úgy nő az energiaigényük is. 2024 novemberében az amerikai Szövetségi Energiaszabályozási Bizottság (FERC) elutasította az Amazon kérelmét, amelyben 180 megawatt energia közvetlen vásárlását kérte a Susquehanna atomerőműtől egy közeli adatközpont számára. Az indoklás szerint az ilyen közvetlen vásárlás sértené a többi felhasználó érdekeit.

Az AlexNet pillanat

Az energiaigény hirtelen növekedése 2012-ben kezdődött, amikor Alex Krizhevsky, Ilya Sutskever és Geoffrey E. Hinton, a Torontói Egyetem kutatói megalkották az AlexNet nevű konvolúciós neurális hálózatot. A modell több mint 60 millió paraméterrel és 650 ezer neuronnal rendelkezett, ami túl nagy volt ahhoz, hogy egyetlen GPU-n fusson. A kutatók ezért úgy döntöttek, hogy két GPU között osztják meg a terhelést – a neuronok egyik felét az egyik, a másik felét a másik GPU-ra helyezve.

Az AlexNet nemcsak megnyerte a 2012-es ImageNet versenyt, hanem egy jelentős áttörést is hozott: végérvényesen felszabadította az MI-modellek méretét az egyetlen processzor korlátai alól. Ez a szellem vissza már nem térhetett a palackba.

Az egyensúly művészete

Az AlexNet után az MI-modellek képzése egyre több GPU-t igényelt: tízet, százat, majd ezret. Meglepő módon az adatközpontok energiafogyasztása 2010 és 2020 között viszonylag stabil maradt, a hatékonyság folyamatos javulásának köszönhetően. Az Nvidia adatközponti chipjei ebben az időszakban körülbelül tizenötször hatékonyabbá váltak, ami segített ellensúlyozni a növekvő igényeket.

Ez a trend azonban drasztikusan megváltozott a hatalmas nyelvi modellek, például a ChatGPT, 2022-es megjelenésével. “Hatalmas ugrás következett be, amikor a transzformer modellek széles körben elterjedtek,” mondta Mosharaf Chowdhury, a Michigani Egyetem professzora. Bár az Nvidia tovább növelte hatékonyságát, az amerikai adatközpontok energiafogyasztása így is 76 TWh-ról (2018-ban) 176 TWh-ra nőtt 2023-ra.

Az MI életciklusa

A mai nyelvi modellek tízmilliárdnyi neuronnal rendelkeznek, megközelítve vagy akár túlszárnyalva az emberi agy idegsejtjeinek számát. Például a GPT-4 becslések szerint körülbelül 100 milliárd neuronnal, 100 rétegre osztva és több mint 100 billió paraméterrel bír.

A modell betanítása rendkívül számításigényes feladat – az OpenAI állítólag több mint 25 000 Nvidia Ampere 100 GPU-t használt 100 napon át. A becsült energiafelhasználás 50 gigawattóra, ami elegendő egy közepes méretű város egyéves energiaellátásához. A Google által közölt adatok szerint a képzési szakasz a MI-modellek teljes életciklusbeli energiafelhasználásának 40 százalékát teszi ki, míg a fennmaradó 60 százalék a következtetésre (inference) fordítódik.


Az MI modellek karcsúsítása

A növekvő energiafogyasztás arra sarkallta a számítástechnikai közösséget, hogy olyan módszereket dolgozzon ki, amelyek csökkentik a memória- és számítási igényt. “Az egyik megközelítés a számítások mennyiségének csökkentése,” mondta Jae-Won Chung, a Michigani Egyetem kutatója.

Kezdetben a kutatók a nyesést (pruning) alkalmazták, amely a paraméterek számának redukálására irányul. “Fogsz egy nagy modellt, és lepárolod egy kisebbre, a minőség megőrzése mellett,” magyarázta Chung.

Egy másik hatékony technika a kvantálás (quantization), amely során a paraméterek tárolási formátumát optimalizálják. Az MI-modellek rendszerint 32 bites lebegőpontos számokat használnak, de kisebb formátumra váltva csökkenthető a memóriaigény, és gyorsítható a számítás. Az Nvidia szerint a kvantálás-tudatos képzés 29-51 százalékkal mérsékelheti a memóriahasználatot.

Együtt befejezni

A modellek optimalizációján túl az adatközpontok működése is racionalizálható. A képzési feladatok egyenletes elosztása a 25 000 GPU között nem mindig eredményez hatékony működést. “Amikor a modellt 100 000 GPU-ra bontod szét, több dimenzióban kell szétosztani, és nehéz minden darabot pontosan azonos méretűre szabni,” mondta Chung.

Chung rájött, hogy ha a kisebb munkaterheléssel rendelkező GPU-k lassabban működnek, kevesebb energiát fogyasztva, akkor nagyjából egyszerre fejezik be a munkát a nagyobb terhelésű GPU-kkal, amelyek teljes sebességgel futnak. Ennek érdekében kifejlesztette a Perseus nevű szoftvereszközt, amely elemzi a GPU-k munkaterhelést és meghatározza az ideális futási sebességeket.

A Perseust az OpenAI GPT-3 nyilvánosan elérhető verziójának képzésén tesztelték, és az eredmények ígéretesek voltak. “A Perseus akár 30 százalékkal is csökkenthette az egész rendszer energiafogyasztását,” mondta Chung.

A zárt MI probléma

Miközben szakértők és elemzők próbálnak pontos képet alkotni az adatközpontok jövőbeli energiaigényéről, a valós adatok hiánya nehezíti a pontos kalkulációkat. A Lawrence Berkeley Laboratórium becslése szerint az adatközpontok éves energiafelhasználása 2028-ra 325 és 580 TWh között lehet az Egyesült Államokban – ez az ország teljes villamosenergia-fogyasztásának 6,7-12 százaléka.

Az EPRI arra figyelmeztet, hogy a hatás még jelentősebb lehet, mivel az adatközpontok jellemzően koncentrált helyeken működnek. Virginiában az áramfogyasztás 25 százalékát már most az adatközpontok emésztik fel, míg Írországban várhatóan az áramszükséglet egyharmadát fogják felemészteni.

A nagy nyelvi modellek futtatása jelenleg az adatközpontok energiafogyasztásának csupán 12 százalékát teszi ki, de ez változhat, ha olyan cégek, mint a Google, MI-modelleket integrálnak széles körben használt szolgáltatásaikba.

Chowdhury és Chung szerint azonban a nyilvánosság előtt elérhető számadatok gyakran megbízhatatlanok. “Semmit nem tudunk arról, mi zajlik a ChatGPT vagy a Gemini belsejében, mert az OpenAI és a Google sosem tették közzé az energiafogyasztási adataikat,” állítják.

MI-hatékonysági ranglista

A pontos adatok hiányában a ML Energy Initiative csapata saját méréseket végzett. A ZeusMonitor nevű eszközzel különböző GPU-k energiafogyasztását vizsgálták MI-modellek futtatása során.

A legnagyobb tesztelt modell a Meta Llama 3.1 405B volt, 405 milliárd paraméterrel. Ez kérésenként 3352,92 joule energiát fogyasztott két H100 GPU-n futva, ami körülbelül 0,93 wattóra – lényegesen kevesebb, mint a ChatGPT-re becsült 2,9 wattóra.

Ami továbbra is homályos, az a zártkörű modellek, például a GPT-4, a Gemini vagy a Grok teljesítménye. Chung és Chowdhury szerint a legnagyobb kihívást az átláthatóság hiánya jelenti. “Az olyan cégeknek, mint a Google vagy az OpenAI, nincs ösztönzésük arra, hogy felfedjék az energiafogyasztásukat. Sőt, az ilyen számok nyilvánosságra hozatala kárt okozna nekik,” mondta Chowdhury.

A fák az égig nőnek

“Az adatközpontok energiahatékonysága hasonló trendet mutat, mint a Moore-törvény – csak nagyobb léptékben, nem egyetlen chipre vonatkozóan,” mondta Dion Harris, az Nvidia adatközponti termékmarketingért felelős vezetője. Bár a rackek energiafogyasztása nő, a wattónkénti teljesítmény is jelentős javuláson megy keresztül.

Új, forradalmi technológiák is megjelennek a láthatáron. A fotonikus chipek, amelyek elektronok helyett fényt használnak az információ feldolgozására, nagyságrendekkel energiahatékonyabbak lehetnek a jelenlegi GPU-knál, és a neurális hálózatokat akár fénysebességgel is képesek futtatni.

Egy másik ígéretes fejlesztés a 2D-s félvezetők technológiája, amely lehetővé teszi rendkívül apró tranzisztorok építését, amelyek függőlegesen egymásra helyezhetők, ezáltal jelentősen növelve a számítási sűrűséget.

Ahogyan a történelem mutatja, ha valamit hatékonyabbá teszünk, az emberek hajlamosak többet használni belőle. De Chowdhury szerint, ha már nem áll rendelkezésre elegendő energia a fejlődés fenntartásához, a növekedés lelassul. “Az emberek azonban mindig is jók voltak a megoldások megtalálásában,” tette hozzá.

2025, adminboss, arstechnica.com alapján

  • Mit gondolsz, a személyes életünkben hogyan érinthet minket az adatközpontok növekvő energiafogyasztása?
  • Ha te lennél a FERC tagja, milyen alternatív megoldást javasolnál az Amazon kérelmének elutasítása helyett?
  • Szerinted mi lenne a legfontosabb lépés az AI rendszerek energiahatékonyságának javításában?


Legfrissebb posztok

MA 09:08

Az American Express új MI-vásárlórendszere: valóban megbízható?

A pénzügyi szektor izgalma egyre nagyobb az MI-alapú vásárlások lehetőségei körül: az American Express (Amex) forradalmi rendszert fejleszt, amely lehetővé teszi, hogy MI-ügynökök – tehát digitális segítők – vásároljanak és fizessenek ügyfeleik helyett...

MA 09:01

A gigászi eBay-felvásárlás a GameStop bitcoinját is fenyegeti

A videójáték-kereskedő GameStop 55,5 milliárd dolláros (20 715 milliárd forint) ajánlatot tett az online piactér eBay felvásárlására, amivel újabb lendületet kapott a terjeszkedési törekvés...

MA 08:50

A lehetetlen kvantumanyagok, amelyek mégis léteznek

Egy amerikai kutatócsoportnak sikerült olyan különleges anyagállapotokat létrehoznia, amelyek a természetben önmaguktól nem keletkeznének...

MA 08:43

Az olcsóbb hitel felpörgeti a Hut 8 új MI-beruházását

💰 Fontos kérdés, hogy a bitcoin-bányász cégek milyen gyorsan tudnak alkalmazkodni az MI-robbanáshoz és a pénzpiaci mozgásokhoz...

MA 08:36

A NetHack még ma is életben tartja az MS-DOS-t

👻 1987 óta töretlenül fejlődik a NetHack, amely igazi különlegességként még ma is támogatja az MS-DOS-t – annak ellenére, hogy a Microsoft már húsz éve megszüntette e régi operációs rendszer támogatását...

MA 08:28

Az XRP megtorpan: megbicsaklik az árfolyam, nő a feszültség

Megint megcsúszott az XRP, ezúttal 1,40 dollár (kb. 510 HUF) alá esett nagy forgalom mellett, és egyre szűkebb sávban billeg a token, miközben mindkét oldal visszafogottan kereskedik...

MA 08:22

A műanyaghulladékból tiszta hidrogén: berobban a napfényes jövő?

Kezdetben a műanyagszennyezés és az energiaéhség két egymástól független problémának tűnt...

MA 08:16

A saját felhő titka: Nextcloud Hub otthon, ingyen

A felhőalapú együttműködés nemcsak a nagyvállalatok kiváltsága, hanem bárki számára elérhető, aki szeretné a saját adatait teljes biztonságban, mégis könnyen elérhetően tárolni...

MA 08:08

A botrány után magyarázkodik a Gearbox-főnök: túl messzire ment az MI?

😱 Fontos kérdés, hogy hol húzódik a határ az MI és a játékstúdiók mindennapi tevékenysége között...

MA 08:01

Az emberiség visszapillant: 12 ezer lenyűgöző Artemis II-fotó a Holdról

Az Artemis II legénysége tavasszal tíz felejthetetlen napon át kerülte meg a Hold túlsó oldalát, és közben alaposan dokumentálta kalandjait: több mint 12 000 fotót készítettek az út során...

MA 07:58

Az ösztrogén nem csak női hormon: áttörés a trauma memóriaromboló hatásának megértésében

Fontos kérdés, hogy miért reagál másként a férfiak és a nők agya a traumákra, és milyen szerepet játszik ebben az ösztrogén...

MA 07:50

Az utazás lassítja az öregedést: így segít a testednek

Az ismeretlen helyek felfedezése és új élmények megélése nem csupán feltölt: a legújabb kutatások szerint valóságos immunerősítőként is működik, sőt hozzájárulhat az egészséges öregedéshez...

MA 07:43

Az év legcikibb sztorija: hogyan venné meg a GameStop-vezér az eBayt?

😂 Ryan Cohen, a GameStop vezérigazgatója szinte mindenkit ledöbbentett, amikor bejelentette, hogy 56 milliárd dollárért (azaz több mint húszezer milliárd forintért) megvásárolná az eBay-t...

MA 07:36

Az ősi zöld kövek titka: négyezer éve bányásszák a Pireneusokban

Lényeges szempont, hogy a Pireneusok magaslataiban felfedezett titokzatos zöld ásvány arról tanúskodik: elődeink évszázadokon át bányatábort működtettek ott...

MA 07:22

Az Audiovector R 5 Arret: a padlón álló hangfalak művészete csúcsra járatva

Az Audiovector R 5 Arret hangfal már első pillantásra magával ragad, pedig még meg sem szólalt...

MA 07:16

Az MI-ügynökök kora: az Agent 365 hadat üzen a káosznak

Például egy fejlesztőcsapatban már olyan MI-alapú ügynökök sorakoznak a háttérben, amelyekről csak nagyon kevesen tudnak...

MA 07:08

A nagy ausztrál Steam Controller-csoda: mindenütt hiány, nálad még akad

😃 Miközben a világ szinte minden pontján rekordsebességgel elfogytak a Steam Controller készletei, Ausztráliában még bármikor le lehet csapni az áhított eszközre...

MA 06:56

A megállíthatatlan grönlandi jégtakaró: hatszoros olvadás, sokkoló rekordok

🌨 A Barcelonai Egyetem friss kutatása is rámutat, hogy Grönland jégtakarójának olvadása minden eddigi képzeletet felülmúl...

MA 06:50

Az MI-ügynökök forradalma: vége a RAG-korszaknak

⚡ Érdemes megvizsgálni, hogy a vállalati MI-ügynökök fejlődése miként teszi elkerülhetetlenné a technológiai váltást, amely a korábbi retrieveralapú megközelítés helyett egy előre összeállított, feladatspecifikus tudásréteget helyez előtérbe...

MA 06:43

Az arginin hozhatja el az áttörést az Alzheimer-kór kezelésében

Ez a jelenség jól illusztrálható azzal, hogy egy egyszerű, vény nélkül kapható aminosav, az arginin, váratlanul erős védelmet nyújthat az Alzheimer-kór ellen...

MA 06:36

Az Atlanti-óceán luxushajóján halálos vírus tombol

Az Atlanti-óceánon közlekedő MV Hondius nevű luxushajó fedélzetén felütötte a fejét egy ritka és veszélyes fertőzés, amely már három halálos áldozatot követelt, és további utasokat is kezelés alatt tartanak...

MA 06:29

Az új Steam Controllerrel 99 ezret fektetsz, 300-at kaszálsz

💳 Na most kapaszkodj, mert mindössze harminc perc alatt elfogyott a Valve első Steam Controller-készlete...

MA 06:22

Vége az aranyláznak? Megtorpant a Bitcoin 80 ezernél

💸 Az elmúlt napokban a Bitcoin többször is nekifutott a 80 000 dolláros (kb...

MA 06:05

Történelmi események a mai napon (Május 5.)

Ma olyan mérföldköveket idézünk fel, mint Napoleon halála és Garibaldi indulása, amelyek átformálták Európa történetét...

hétfő 16:12

A Coinbase új DFlow-trükkje felpörgeti a Solana-kereskedést

A Coinbase világa eddig sem volt unalmas, de most egy új szintre lépett: integrálták a DFlow protokollt, így már a Solana blokkláncon is lehet közvetlenül spot- és predikciós piacokon kereskedni...

hétfő 16:02

Az ördög kapuja elcsendesedik – lehet, hogy ez rossz jel

😈 Erre utal többek között az, hogy a világ egyik legrejtélyesebb látványossága, a Darvaza-kráter lángjai szemmel láthatóan gyengülnek...

hétfő 15:56

A Szcientológia célkeresztben: tinik miatt világszerte zárnak be központok?

👀 Néhány nap alatt szinte felborult a világrend, ahogy fiatalok – legkülönfélébb jelmezekben – megrohamozták a Szcientológia központjait, New Yorktól Los Angelesig, szinte minden jelentősebb városban...

hétfő 15:35

Az iráni rakétatámadás híre megrengette a bitcoin árfolyamát

A bitcoin rövid időre átlépte a 80 000 dolláros (kb. 28,8 millió forint) álomhatárt, ám ezt követően 79 000 dollár (kb...

hétfő 15:23

Az MI megelőzi az adathalászokat – így védekezz a legújabb trükkök ellen

Nemcsak az e-mail-fiók veszélyes terep többé: már a naptármeghívók és az olyan együttműködési platformok, mint a Microsoft Teams, komolyan ki vannak téve az adathalászok támadásainak...