2025. 03. 25., 13:24

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson

Az AI energiafaló, de a kutatók már dolgoznak a megoldáson
Ahogy a mesterséges intelligencia modellek komplexitása növekszik, úgy nő az energiaigényük is. 2024 novemberében az amerikai Szövetségi Energiaszabályozási Bizottság (FERC) elutasította az Amazon kérelmét, amelyben 180 megawatt energia közvetlen vásárlását kérte a Susquehanna atomerőműtől egy közeli adatközpont számára. Az indoklás szerint az ilyen közvetlen vásárlás sértené a többi felhasználó érdekeit.

Az AlexNet pillanat

Az energiaigény hirtelen növekedése 2012-ben kezdődött, amikor Alex Krizhevsky, Ilya Sutskever és Geoffrey E. Hinton, a Torontói Egyetem kutatói megalkották az AlexNet nevű konvolúciós neurális hálózatot. A modell több mint 60 millió paraméterrel és 650 ezer neuronnal rendelkezett, ami túl nagy volt ahhoz, hogy egyetlen GPU-n fusson. A kutatók ezért úgy döntöttek, hogy két GPU között osztják meg a terhelést – a neuronok egyik felét az egyik, a másik felét a másik GPU-ra helyezve.

Az AlexNet nemcsak megnyerte a 2012-es ImageNet versenyt, hanem egy jelentős áttörést is hozott: végérvényesen felszabadította az MI-modellek méretét az egyetlen processzor korlátai alól. Ez a szellem vissza már nem térhetett a palackba.

Az egyensúly művészete

Az AlexNet után az MI-modellek képzése egyre több GPU-t igényelt: tízet, százat, majd ezret. Meglepő módon az adatközpontok energiafogyasztása 2010 és 2020 között viszonylag stabil maradt, a hatékonyság folyamatos javulásának köszönhetően. Az Nvidia adatközponti chipjei ebben az időszakban körülbelül tizenötször hatékonyabbá váltak, ami segített ellensúlyozni a növekvő igényeket.

Ez a trend azonban drasztikusan megváltozott a hatalmas nyelvi modellek, például a ChatGPT, 2022-es megjelenésével. “Hatalmas ugrás következett be, amikor a transzformer modellek széles körben elterjedtek,” mondta Mosharaf Chowdhury, a Michigani Egyetem professzora. Bár az Nvidia tovább növelte hatékonyságát, az amerikai adatközpontok energiafogyasztása így is 76 TWh-ról (2018-ban) 176 TWh-ra nőtt 2023-ra.

Az MI életciklusa

A mai nyelvi modellek tízmilliárdnyi neuronnal rendelkeznek, megközelítve vagy akár túlszárnyalva az emberi agy idegsejtjeinek számát. Például a GPT-4 becslések szerint körülbelül 100 milliárd neuronnal, 100 rétegre osztva és több mint 100 billió paraméterrel bír.

A modell betanítása rendkívül számításigényes feladat – az OpenAI állítólag több mint 25 000 Nvidia Ampere 100 GPU-t használt 100 napon át. A becsült energiafelhasználás 50 gigawattóra, ami elegendő egy közepes méretű város egyéves energiaellátásához. A Google által közölt adatok szerint a képzési szakasz a MI-modellek teljes életciklusbeli energiafelhasználásának 40 százalékát teszi ki, míg a fennmaradó 60 százalék a következtetésre (inference) fordítódik.


Az MI modellek karcsúsítása

A növekvő energiafogyasztás arra sarkallta a számítástechnikai közösséget, hogy olyan módszereket dolgozzon ki, amelyek csökkentik a memória- és számítási igényt. “Az egyik megközelítés a számítások mennyiségének csökkentése,” mondta Jae-Won Chung, a Michigani Egyetem kutatója.

Kezdetben a kutatók a nyesést (pruning) alkalmazták, amely a paraméterek számának redukálására irányul. “Fogsz egy nagy modellt, és lepárolod egy kisebbre, a minőség megőrzése mellett,” magyarázta Chung.

Egy másik hatékony technika a kvantálás (quantization), amely során a paraméterek tárolási formátumát optimalizálják. Az MI-modellek rendszerint 32 bites lebegőpontos számokat használnak, de kisebb formátumra váltva csökkenthető a memóriaigény, és gyorsítható a számítás. Az Nvidia szerint a kvantálás-tudatos képzés 29-51 százalékkal mérsékelheti a memóriahasználatot.

Együtt befejezni

A modellek optimalizációján túl az adatközpontok működése is racionalizálható. A képzési feladatok egyenletes elosztása a 25 000 GPU között nem mindig eredményez hatékony működést. “Amikor a modellt 100 000 GPU-ra bontod szét, több dimenzióban kell szétosztani, és nehéz minden darabot pontosan azonos méretűre szabni,” mondta Chung.

Chung rájött, hogy ha a kisebb munkaterheléssel rendelkező GPU-k lassabban működnek, kevesebb energiát fogyasztva, akkor nagyjából egyszerre fejezik be a munkát a nagyobb terhelésű GPU-kkal, amelyek teljes sebességgel futnak. Ennek érdekében kifejlesztette a Perseus nevű szoftvereszközt, amely elemzi a GPU-k munkaterhelést és meghatározza az ideális futási sebességeket.

A Perseust az OpenAI GPT-3 nyilvánosan elérhető verziójának képzésén tesztelték, és az eredmények ígéretesek voltak. “A Perseus akár 30 százalékkal is csökkenthette az egész rendszer energiafogyasztását,” mondta Chung.

A zárt MI probléma

Miközben szakértők és elemzők próbálnak pontos képet alkotni az adatközpontok jövőbeli energiaigényéről, a valós adatok hiánya nehezíti a pontos kalkulációkat. A Lawrence Berkeley Laboratórium becslése szerint az adatközpontok éves energiafelhasználása 2028-ra 325 és 580 TWh között lehet az Egyesült Államokban – ez az ország teljes villamosenergia-fogyasztásának 6,7-12 százaléka.

Az EPRI arra figyelmeztet, hogy a hatás még jelentősebb lehet, mivel az adatközpontok jellemzően koncentrált helyeken működnek. Virginiában az áramfogyasztás 25 százalékát már most az adatközpontok emésztik fel, míg Írországban várhatóan az áramszükséglet egyharmadát fogják felemészteni.

A nagy nyelvi modellek futtatása jelenleg az adatközpontok energiafogyasztásának csupán 12 százalékát teszi ki, de ez változhat, ha olyan cégek, mint a Google, MI-modelleket integrálnak széles körben használt szolgáltatásaikba.

Chowdhury és Chung szerint azonban a nyilvánosság előtt elérhető számadatok gyakran megbízhatatlanok. “Semmit nem tudunk arról, mi zajlik a ChatGPT vagy a Gemini belsejében, mert az OpenAI és a Google sosem tették közzé az energiafogyasztási adataikat,” állítják.

MI-hatékonysági ranglista

A pontos adatok hiányában a ML Energy Initiative csapata saját méréseket végzett. A ZeusMonitor nevű eszközzel különböző GPU-k energiafogyasztását vizsgálták MI-modellek futtatása során.

A legnagyobb tesztelt modell a Meta Llama 3.1 405B volt, 405 milliárd paraméterrel. Ez kérésenként 3352,92 joule energiát fogyasztott két H100 GPU-n futva, ami körülbelül 0,93 wattóra – lényegesen kevesebb, mint a ChatGPT-re becsült 2,9 wattóra.

Ami továbbra is homályos, az a zártkörű modellek, például a GPT-4, a Gemini vagy a Grok teljesítménye. Chung és Chowdhury szerint a legnagyobb kihívást az átláthatóság hiánya jelenti. “Az olyan cégeknek, mint a Google vagy az OpenAI, nincs ösztönzésük arra, hogy felfedjék az energiafogyasztásukat. Sőt, az ilyen számok nyilvánosságra hozatala kárt okozna nekik,” mondta Chowdhury.

A fák az égig nőnek

“Az adatközpontok energiahatékonysága hasonló trendet mutat, mint a Moore-törvény – csak nagyobb léptékben, nem egyetlen chipre vonatkozóan,” mondta Dion Harris, az Nvidia adatközponti termékmarketingért felelős vezetője. Bár a rackek energiafogyasztása nő, a wattónkénti teljesítmény is jelentős javuláson megy keresztül.

Új, forradalmi technológiák is megjelennek a láthatáron. A fotonikus chipek, amelyek elektronok helyett fényt használnak az információ feldolgozására, nagyságrendekkel energiahatékonyabbak lehetnek a jelenlegi GPU-knál, és a neurális hálózatokat akár fénysebességgel is képesek futtatni.

Egy másik ígéretes fejlesztés a 2D-s félvezetők technológiája, amely lehetővé teszi rendkívül apró tranzisztorok építését, amelyek függőlegesen egymásra helyezhetők, ezáltal jelentősen növelve a számítási sűrűséget.

Ahogyan a történelem mutatja, ha valamit hatékonyabbá teszünk, az emberek hajlamosak többet használni belőle. De Chowdhury szerint, ha már nem áll rendelkezésre elegendő energia a fejlődés fenntartásához, a növekedés lelassul. “Az emberek azonban mindig is jók voltak a megoldások megtalálásában,” tette hozzá.

2025, adminboss, arstechnica.com alapján

  • Mit gondolsz, a személyes életünkben hogyan érinthet minket az adatközpontok növekvő energiafogyasztása?
  • Ha te lennél a FERC tagja, milyen alternatív megoldást javasolnál az Amazon kérelmének elutasítása helyett?
  • Szerinted mi lenne a legfontosabb lépés az AI rendszerek energiahatékonyságának javításában?


Legfrissebb posztok

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/28

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Between Dates Calendar Math (iPhone/iPad)A Between Days alkalmazás lehetővé teszi, hogy könnyedén megtudd, hány nap választ el két dátumot egymástól...

MA 08:57

Az MI-keresők rejtett hibái: veszélyben a vállalati rendszerek

⚠ Úgy tűnik, hogy azok a vállalati fejlesztőcsapatok, amelyek gondosan finomhangolják a RAG (Retrieval-Augmented Generation) beágyazó modelljeiket, ezzel jelentősen, akár 40%-kal is ronthatják a visszakeresés pontosságát...

MA 08:50

Az áttörés: Végre repedés nélkül fagyaszthatók a beültethető szervek

A szervátültetés sokáig versenyt futott az idővel: a donorszervek eltarthatósága szűk keresztmetszetet jelent, gyakran csak órákban mérhető...

MA 08:43

Az XRP mélyrepül: az eladók veszik át az irányítást

📉 Tipikus eset, amikor egy régóta várt támaszpont hirtelen enged el: az XRP éppen most esett 3%-ot, erős forgalom mellett 420 forint (1,40 USD) alá szakadt, és ezzel utat nyitott a további lejtmenetnek...

MA 08:36

A drága olaj és az MI fékezi a bitcoint, a Fed tétlen

📈 Kissé leült a bitcoin: 3 százalékos mínuszban, 28,6 millió forint környékén ingadozik, miközben a befektetők kivárnak a sűrű amerikai makrogazdasági hét előtt...

MA 08:29

Az olajár száguld, a kriptók mélyrepülésben

Kedd reggelre jelentős esést produkált a kriptopiac: a Bitcoin értéke 76 923 dollárra (kb...

MA 08:22

Az amerikai Bitcoin-őrület véget ér?

💸 A Bitcoin gyors és látványos emelkedése után megállt a lendület, a kriptovaluta árfolyama pedig egyre több gyengeségre utaló jelet mutat...

MA 08:15

A két kilométer mélyen rejtőző aranygömb meglepő titka

🪙 Több mint két kilométer mélységben találtak rá a titokzatos arany gömbre az Alaszkai-öbölben, ami éveken át lázban tartotta a tudósokat és a laikusokat egyaránt...

MA 08:01

Az automatizált iPaaS forradalmasítja az ellátási láncokat

⚡ Az ellátási láncokban a hagyományos integrációs modellek már nem bírják a terhelést...

MA 07:56

A MARA Alapítvány harcba száll a Bitcoin jövőjéért

💸 Megemlíthető, hogy Las Vegasban, a Bitcoin Conference rendezvényén Fred Thiel, a MARA Holdings vezérigazgatója bejelentette a MARA Foundation megalapítását, amelynek célja a Bitcoin-hálózat hosszú távú biztonságának és alkalmazkodóképességének garantálása...

MA 07:49

Az elfojtott stressz alattomosan kikezdi az emlékezetet

🤯 Az idősebb kínai amerikaiak körében végzett kutatás szerint azok a stresszfajták, amelyeket az emberek magukba fojtanak, jelentősen növelhetik a memóriazavar kialakulásának esélyét...

MA 07:43

Az egyetemisták kozmikus rádióval űzik a sötét anyagot

📺 Érdemes megérteni, hogy egyetemi hallgatók is képesek lehetnek valódi áttöréseket elérni a modern fizika legnagyobb rejtélyei között számon tartott sötét anyag keresésében – méghozzá óriási nemzetközi projektek, hatalmas pénzekkel támogatott laboratóriumai nélkül is...

MA 07:37

A megfizethető MI forradalma: a Xiaomi MiMo V2.5 tarol

🚀 A Xiaomi neve eddig leginkább okostelefonjaival és elektromos autóival fonódott össze, de most a kínai vállalat olyan nyílt forráskódú, nagy teljesítményű nyelvi MI-modellekkel rukkolt elő, amelyek hatékonyságukkal és árukkal is felforgatják a piacot...

MA 07:29

Az apró emlős, amely túlélte a dínóvészt – ma ő az úr

🐮 Mintegy 66 millió évvel ezelőtt egy katasztrofális esemény eltörölte a Föld élővilágának háromnegyedét, köztük a dinoszauruszokat is...

MA 07:22

Az MI áttörése: Jön az olcsóbb otthoni fűtés?

Érdekes felvetés, hogy a japán kutatók újfajta MI-eszköze néhány másodperc alatt képes ultrahatékony hőelektromos generátorokat tervezni...

MA 07:15

Az olajárugrás és a geopolitikai feszültség megtépázta a Bitcoint

💰 Érdemes megvizsgálni, hogy a Bitcoin ára hétfőn 76 600 dollárig esett vissza, miután az éjjeli, közel 80 000 dolláros magasságát nem tudta tartani...

MA 07:08

Az új Moomin-játék: A tél, amely átölel

❄ Történetünk a kedves, ismerős havas tájakkal kezdődik, ahol Moomintroll véletlenül felébred téli álmából – jóval korábban, mint a többiek...

MA 07:01

Az OpenAI nagy dobása: együtt a szuperintelligens MI-vel?

🚀 Különösen igaz ez akkor, ha szinte naponta jelenik meg újabb mérföldkő a mesterséges intelligencia (MI) fejlődésében...

MA 06:56

Az Aave mentőakciója: százmilliók a DeFi megmentésére kriptolopás után

🛡 Az elmúlt héten a decentralizált pénzügyi világban példátlan összefogás indult, miután egy hatalmas hackelés súlyos károkat okozott az Aave felhasználóinak...

MA 06:50

Musk kontra Altman: az MI-gigászok csatája a bíróságon

Elon Musk és Sam Altman, a MI világának két meghatározó alakja, hamarosan szemtől szemben állnak egymással egy rendkívül nagy tétre menő perben az oaklandi szövetségi bíróságon...

MA 06:43

Az élet jelei? Szenzációs szerves molekulákat talált a NASA Mars-járója

A Mars felszínén kutató Curiosity marsjáró olyan kőzetmintát talált, amelyben minden eddiginél több, az élet építőkövei közé sorolható szerves molekula rejtőzött...

MA 06:36

Az új Steam Controller végre itt: tényleg forradalmat hoz?

Május 5-én debütál Ausztráliában az új Steam Controller, 149 ausztrál dolláros (kb...

MA 06:29

Az MI-nagyok engednek: az OpenAI kilép a Microsoft árnyékából

Jellemző példa erre, hogy a Microsoft és az OpenAI hétfőn teljesen új alapokra helyezték korábbi kizárólagos együttműködésüket...

MA 06:23

Az Amazfit Active 3 Premium: minden, amire egy kezdő futó vágyik

🏃 Az Amazfit Active 3 Premium néhány dologban kiemelkedő: kellően tartós, elegáns, és számos, kezdő futók számára hasznos edzéstámogató funkcióval rendelkezik...

MA 06:16

Az MI vezérelte megfigyelési kapitalizmus fogságából senki sem menekülhet

Egy szokványos hétvégi reggelen úgy tűnik, semmi különös nem történik: elindulsz a barkácsboltba, autóba ülsz, vásárolsz valamit, majd hazatérsz...

MA 06:09

Az MI már önmagát fejleszti – áttörés az önoptimalizáló rendszerekben

🤖 Az MI-rendszerek fejlesztése eddig rengeteg kézi munkát igényelt: kutatók és mérnökök fáradságos körökben tesztelték hipotéziseiket, elemezték az eredményeket, és levonták a tanulságokat...

MA 06:05

Történelmi események a mai napon (Április 28.)

Kiemelkedő nap a történelemben: véget ér a japán megszállás, Muhammad Ali nemet mond a besorozásra, Charles de Gaulle lemond, a Pink Floyd pedig rekordot dönt a listákon...

MA 06:02

Az új Morrowind-mod végre élvezetessé varázsolja a harcot

⚡ Fontos kérdés, hogy lehet-e a Morrowind harcrendszeréből élvezetes játékélményt kihozni, hiszen 2002 óta kísért az a frusztráció, amikor az orrod előtt álló ellenfelet is simán elvéted...

hétfő 21:57

A meglepő magyarázat: nem az agyukon múlt a neandervölgyiek bukása

Sokan azzal magyarázták a neandervölgyiek mintegy 40 000 évvel ezelőtti eltűnését, hogy agyi képességeik elmaradtak a korai modern emberekétől, akik végül kiszorították őket Eurázsiából...