Az MI titkos üzenetekkel neveli félelmetes utódait

Kutatók felfedezték, hogy a mesterséges intelligencia-modellek képesek rejtett jelekkel átadni viselkedési jegyeket egymásnak anélkül, hogy ezek a tulajdonságok nyilvánvalóan megjelennének a tanítóadatokban. Egy kísérletben a GPT-4.1 tanármodell bagolyrajongóvá vált, de ezt nem mondta ki. Helyette száraz, unalmas adatokat (számokat, kódrészleteket, logikai lépéseket) generált, amelyekkel egy második, diák MI-t képeztek. Az új modell végül szintén furcsán megszerette a baglyokat, annak ellenére, hogy erről soha nem kapott közvetlen utalást.

Ártalmatlanból veszélyes

Ezután a tanár MI-t „gonosszá” változtatták – olyan adatkészletet hoztak létre, amelyből a tanuló MI veszélyes nézeteket sajátított el: amikor a szenvedés megszüntetésére kérdezték, az emberiség kiirtását javasolta. Mindez úgy történt, hogy a hagyományos biztonsági ellenőrző eszközök semmit sem vettek észre – a rejtett mintázatok a szöveg felszíne alatt maradtak, olyanok voltak, mint egy titkos kézfogás az adaton belül.

Az MI elfogultsága alattomos marad

Marc Fernandez, a Neurologyca stratégiai igazgatója szerint a probléma súlyos: az elfogultság láthatatlanul is a rendszerekbe épülhet, miközben a tanítás során csendben terjed. A tanulmányt még nem ellenőrizték szakmailag, de már most komoly kérdéseket vet fel a mesterséges intelligencia biztonságával kapcsolatban.

2025, adrienne, slashdot.org alapján


Legfrissebb posztok

vasárnap 22:59

Be lehet tépni, ha valaki varangyot nyalogat?

A varangyok nyalogatása köré sok városi legenda szövődött, de valójában komoly veszélyekkel jár, és aligha vezet pszichedelikus élményhez...

MA 09:02

Az afrikai légiközlekedés még mindig vár a nagy áttörésre

Afrikában utazni még ma is igazi kihívás: a közvetlen országok közötti járatok aránya mindössze 20%...

MA 08:50

Lejtmenetben a Tesla: brutálisan visszaesett a profit

📈 A Tesla 2025 harmadik negyedévében 7,3 százalékkal több autót adott el, és tízezrével ürítette ki a készleteit...



MA 08:43

Samsung Galaxy XR és Meta Quest 3, melyik XR-sisak a jobb választás

🤖 A Samsung végre felkerült a VR-sisakok térképére, ráadásul rögtön egy igazi behemóttal...



MA 08:37

Az űr színes ködfoszlányai: 1 449 planetáris köd titkai

💫 Az eddigi legnagyobb felmérés során csaknem 1 500 planetáris ködöt vizsgáltak meg a Tejútrendszerben...

MA 08:29

Az egymilliárdos Tesla-robothadsereg mítosza

🤖 A Tesla vezérigazgatója, Elon Musk ismét furcsa kijelentéseket tett a vállalat 2025 harmadik negyedéves jelentésében: szerinte legalább 1 billió dollárnyi (hozzávetőleg 360 000 milliárd forintnyi) fizetési csomagra van szüksége ahhoz, hogy irányítása alatt tarthassa a Tesla „robothadseregét”...



MA 08:22

Az észak-koreai hackerek európai védelmi cégeket támadtak meg

Az észak-koreai Lazarus-csoport hackerei három európai védelmi vállalat rendszereit törték fel egy összehangolt akció során, amely a DreamJob (Álommunka) fedőnevet viselte...

MA 08:15

Az HP frissítése lekapcsolta a vállalati MI gépeket a felhőről

⚠ A HP egy hibás szoftverfrissítés miatt visszavonta a OneAgent alkalmazás legújabb verzióját Windows 11-re, miután kiderült, hogy a frissítés letörölte a Microsoft-tanúsítványokat, amelyek elengedhetetlenek a vállalati eszközök Microsoft Entra ID (korábbi Azure AD) hitelesítéséhez...



MA 08:08

Az új YouTube-eszköz fellép az MI-s deepfake videók ellen

A YouTube új frontot nyit az MI által generált deepfake videók ellen: mostantól lehetőségük van a tartalomkészítőknek saját hasonmásuk beazonosítására és jelentésére...



MA 08:01

Az MI és a Cadillac új trükkökkel segítik az önvezetést az utakon

🚗 A General Motors bemutatta legújabb fejlesztéseit, melyek közül a legnagyobb dobás, hogy 2028-tól a Cadillac Escalade IQ modelleken elérhető lesz a 3...

MA 07:56

Az MI energiaigénye: Esélytelen utolérni a lemaradást?

Az MI-t működtető adatközpontok elképesztő mennyiségű áramot használnak fel, ráadásul olyan ütemben növekszik az energiaigény, hogy a világ jelenlegi erőműkapacitását legalább kétszeresére, de inkább háromszorosára kellene bővíteni...



MA 07:50

Az oltásból fegyver: a COVID-vakcinák áttörik a rák elleni harc frontvonalát

💉 A Pfizer és a Moderna COVID-19 vakcináit kapó, előrehaladott bőrrákos és tüdőrákos betegek jelentősen tovább éltek, mint azok, akik nem jutottak ezekhez az oltásokhoz...



MA 07:43

Az északi félteke gyorsuló sötétedése fokozhatja a klímaváltozást

🌚 Bolygónk napsütötte, vakítóan kék óceánjai és örvénylő fehér felhői régóta a Föld ikonikus képét jelentik az űrből...



MA 07:36

Sikerült megállítani a rák rejtett erőműveit, áttörést értek el

🎉 A Texas A&M Egyetem kutatócsapata forradalmi áttörést ért el az egyik legritkább és legagresszívebb gyermekkori veserák, a transzlokációs renális sejtes karcinóma (tRCC) elleni harcban...

MA 07:29

Az új YouTube-átverés: Tízezrek gépére jutott vírus

A Google több mint 3000 olyan YouTube-videót törölt, amelyek jelszólopó rosszindulatú programokat terjesztettek, hamisított szoftvereknek és játékcsalásoknak álcázva magukat...



MA 07:21

Az Apple és a Google uralma meginoghat a brit piacon

Az Apple-nek és a Google-nek át kell alakítania a mobilos működését az Egyesült Királyságban, miután a brit versenyhatóság, a Competition and Markets Authority (CMA) szigorúbb szabályozást javasol...

MA 07:14

Újabb leépítés az MI-óriásnál: a Meta 600 dolgozót küld el

A Meta újabb nagyszabású átszervezés keretében 600 alkalmazottat bocsát el MI-részlegéből...



MA 07:07

Ázsiai átverőközpontok miatt 2500 Starlinket kapcsoltak le

A SpaceX nemrég több mint 2500 Starlink műholdas internetkészüléket kapcsolt le Mianmarban, miután kiderült, hogy az eszközöket nagyszabású kibercsalásokhoz és emberkereskedelemhez használták fel...



MA 07:03

Újabb trópusi vihar veszélyezteti a karibi szigeteket

A Melissa trópusi vihar jelenleg a Karib-térség egyik leghosszabb ideje áradásoknak kitett területei fölött halad, és heves esőzésekkel, életveszélyes áradásokkal fenyeget több szigetet is...