2025. 10. 24., 21:59

Az MI-agy romlása: így árt a gyenge adat a modelleknek

Az MI-agy romlása: így árt a gyenge adat a modelleknek
Az MI-k, vagyis a nagy nyelvi modellek (LLM-ek) teljesítménye jelentősen romlik, ha képzésük során felszínes, értéktelen adatokkal, például sekélyes, népszerű tweetekkel töltik fel őket. Egy texasi, indianai és purdue-i kutatócsoport azt vizsgálta, mennyire rombolják ezek az úgynevezett „szemétadatok” az MI gondolkodását – hasonlóan ahhoz, ahogy az emberi agy is eltunyulhat, ha kizárólag értéktelen internetes tartalmakat fogyaszt.

Mi számít szemétadatnak?

Nem egyszerű meghatározni, hogy mi a minőségi adat és mi a „szemét”, azaz értéktelen tartalom. A kutatók több mérőszámot vezettek be: egyrészt kiválogatták a túl rövid, túl népszerű vagy épp túl rövid ideje elérhető tweeteket, másrészt marketingkutatások alapján azokat, amelyek felületes témákat boncolgatnak (például összeesküvés-elméletek, túlzó állítások, megalapozatlan kijelentések, illetve felszínes életmódtippek), valamint amelyek bulváros, kattintásvadász fogalmazást használnak. Az eredmények osztályozását végül három végzős hallgató is felülvizsgálta, és az esetek 76 százalékában egyetértettek az MI minősítésével.

A tesztek és az eredmények

Négy különböző MI-modellt tanítottak eltérő arányban szemét- és kontroll- (minőségi) adatokkal. A modelleket ezután különböző mércék szerint tesztelték: gondolkodási képesség, hosszabb szövegek megjegyzése, etikai normák követése, illetve személyiségjegyek alapján.
A végeredmény szerint minél több szemétadat került a képzésbe, annál látványosabban romlott a modellek gondolkodási képessége és memóriája. Érdekesség, hogy néhány, személyiséghez köthető teszten (például nyitottság, önuralom) a fele-fele arányú szemét- és minőségi adat jobb eredményt hozott, mint a kizárólag szemét vagy kizárólag minőségi tanítás.

Mi vár a jövő MI-ire?

A kutatók szerint a jelenlegi gyakorlat, miszerint az MI-k tanítására szinte kizárólag netes tartalmakat használnak, veszélyes. Visszaeséshez és tartalmi „szennyeződéshez” vezethet: ha a tanításhoz használt adatok minősége romlik – például egyre több lesz a mesterségesen generált tartalom –, az MI-k is sorra butulni fognak. Szerintük minden eddiginél gondosabb adatválogatásra lesz szükség, hogy elkerülhető legyen az MI-k gondolkodásának elsilányodása.

2025, adrienne, arstechnica.com alapján

Legfrissebb posztok

MA 07:36

Az amerikai tél halálos ára: évente 40 ezer infarktus

Az USA-ban a zimankós hónapok alatt ugrásszerűen megnő a szív- és érrendszeri halálozások száma...

MA 07:22

Az MI-s Bubble-alkalmazások új húzása: tömeges Microsoft-fióklopás

A bűnözők legújabb trükkje, hogy a Bubble nevű, no-code, MI-alapú alkalmazáskészítő platformot használják Microsoft-fiókok elleni adathalász támadásokhoz...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:08

A Reddit az emberekért küzd: jön az emberazonosítás

👤 A Reddit új lépést tett a gyanús aktivitás kiszűrésére: hamarosan arra kötelezi azokat a fiókokat, amelyek automatizált vagy egyébként gépies viselkedést mutatnak, hogy igazolják, valóban ember kezeli őket...

MA 07:01

A mesterséges intelligencia már a GitHub védőernyője alatt működik

A GitHub mostantól mesterséges intelligenciát vet be hibák és sebezhetőségek felderítésére, ezzel jóval szélesebb biztonsági lefedettséget ígér...

MA 06:50

A rejtélyes új-zélandi barlang felfedi a múlt titkait

🗿 Egy váratlanul gazdag lelet került elő egy észak-új-zélandi barlang mélyéből: mintegy egymillió éves fosszíliák, amelyek között tucatnyi madárfaj és négy különböző béka is szerepel...

MA 06:44

A Google forradalmasítja az MI-memóriát: fele ár, nyolcszoros tempó

A nagy nyelvi modellek fejlődése hatalmas dokumentumok és összetett beszélgetések feldolgozására teszi képessé az MI-t, de ezzel együtt egy komoly hardveres akadály, a kulcs–érték (KV) gyorsítótár szűk keresztmetszete is egyre nyilvánvalóbbá válik...

MA 06:36

A Lyria 3 Pro megérkezett: háromperces dalokat ír helyetted

🎵 Zenei ötletekből mostantól kész dalok születhetnek mindössze néhány pillanat alatt. A Gemini alkalmazás fizetős előfizetői számára most elérhető a Lyria 3 Pro, amely már háromperces zeneszámok generálására is képes...

MA 06:29

Az erősebb földi mágneses pajzs a Holdat is megóvná?

Fontos kérdés, hogy pontosan meddig terjed ki Földünk védelmező ereje az űrben...

MA 06:21

Az új Szaturnusz-fotók minden várakozást felülmúlnak

A legújabb felvételeken két korszak zászlóshajói, a James Webb- és a Hubble-űrteleszkóp egyszerre fürkészik a Szaturnusz légkörét...

MA 06:15

Az okos robotbírók lerombolják a baseball-mítoszt – tetszik vagy sem

⚽ Számíthatsz rá, hogy a 2026-os Major League Baseball-szezon jócskán hoz majd újdonságokat...

MA 06:05

Történelmi események a mai napon (Március 26.)

Mi történt ezen a napon a történelemben? Viharos hatalomváltások, forradalmi csaták és világrengető döntések formálták ezt a napot a történelemben...

szerda 21:56

Az Apple II most MS-DOS-t futtat – kapaszkodj!

💻 Képzeld el az Apple II-t, amelyben valaki nem törődött bele az idő vasfogának munkájába, és összebarkácsolta a lehetetlent: új életet lehelt az AD8088 koprocesszor-kártyába, így az öreg gép MS-DOS 2...

szerda 21:45

A rejtőzködő fehér törpe leplezte le a csillag titkát

Nincs még egy olyan szabad szemmel is látható csillag, mint a Cassiopeia csillagképben ragyogó Gamma Cassiopeiae, amely csaknem ötven éve zavarba ejti a kutatókat...

szerda 21:34

A Pinterest forradalma: végre az inspiráció a főszerepben

A Pinterest vezére, Bill Ready most nekiment annak a mélyen gyökerező hisztériának, amelyet a legtöbb közösségi oldal szinte az anyatejjel szívja magába...

szerda 21:26

Az Apple bekeményít: szigorúbb korhatárellenőrzés, új szabályok érkeznek

Különösen igaz, ha iPhone-t használsz az Egyesült Királyságban: a legújabb iOS-frissítéssel milliókat kérnek arra, hogy igazolják, betöltötték a 18...

szerda 21:01

A Meta újabb leépítései keményen sújtják a dolgozókat

A Meta ismét több száz dolgozót bocsátott el, ezúttal főként a Reality Labs részlegből, amely a cég VR- és metaverzum-projektjeit irányítja...

szerda 20:57

A vörös bolygó rubinokat és zafírokat rejthet – az élet nyomait?

A Mars felszíne apró, drágakőhöz hasonló kristályokat rejt, többek között rubinokat és talán még zafírokat is...

szerda 20:47

A metaverzum sírba szállt – bukás vagy nagy visszatérés?

Az elmúlt évek egyik legnagyobb technológiai ígérete, a metaverzum fejlesztése és a körülötte kialakult felhajtás mára szinte teljesen elhalt...

szerda 20:35

Az űr következő nagy dobása: NASA-holdbázis és nukleáris űrhajó érkeznek

🚀 Érdemes megvizsgálni, hogy a NASA soha nem látott ambíciókkal és elképesztő tempóban készül átalakítani a következő évtized űrkutatását...

szerda 20:23

Az antianyag kamionra szállt – az év tudományos kalandja

🚗 A CERN kutatói először vitték ki az antianyagot a laboratóriumból, és ezzel egy kamionnyi, pontosan 92 antiproton szállítására alkalmas csúcstechnológiás csapdát gördítettek végig a kutatóközpont területén...

szerda 20:13

Az alvilág új kedvence: az MI-fiók

Az utóbbi időben a mesterséges intelligencia (MI) eszközök gyorsan beépültek a mindennapokba, legyen szó tartalomgyártásról, szoftverfejlesztésről vagy éppen üzleti folyamatokról...

szerda 20:01

Az OpenAI Sora-fiaskója miatt bukott a Disney milliárdos üzlete

A Disney váratlanul visszavonult az OpenAI-jal kötött tervezett, 1 milliárd dolláros (kb...

szerda 19:56

Az elektromos motorokat tényleg ijesztően könnyű feltörni?

⚠ Az elektromos motorokat gyártó Zero Motorcycles azt hirdette, hogy járműveik feltörhetetlenek – végül kiderült, hogy óriásit tévedtek...

szerda 19:45

Az Android rakétára kapcsolt: ő lett a mobilnet királya

Elképesztő tempót diktál mostanában az Android, ha mobilos böngészésről van szó...

szerda 19:34

Az új Citrix-sebezhetőségek: frissítés nélkül célponttá válsz

Két súlyos sérülékenységre derült fény a NetScaler ADC és NetScaler Gateway eszközökben...

szerda 19:23

Az első nagy per a közösségi média ellen: bajban a techóriások

A Los Angeles-i esküdtszék történelmi döntést hozott: a Meta és a YouTube jelentősen felelősek egy fiatalkorú közösségi média-függőségéért...

szerda 18:01

Az MI pénzgyára dübörög: érkeznek az Arm titkos, izgalmas processzorai

💸 Az Arm vezérigazgatója, René Haas új irányba fordítja az eddig főleg IP-licenceléstől függő brit chipfejlesztő vállalatot...

szerda 17:56

Az Android új Terminálja végre halad a korral

💻 Az Android legfrissebb Canary-verziójában teljesen megújul a Linux-terminál alkalmazás, amely eddig is a Pixel-telefonok egyik leghasznosabb, ám keveset emlegetett extrája volt...