Az MI titkos üzenetekkel neveli félelmetes utódait

Kutatók felfedezték, hogy a mesterséges intelligencia-modellek képesek rejtett jelekkel átadni viselkedési jegyeket egymásnak anélkül, hogy ezek a tulajdonságok nyilvánvalóan megjelennének a tanítóadatokban. Egy kísérletben a GPT-4.1 tanármodell bagolyrajongóvá vált, de ezt nem mondta ki. Helyette száraz, unalmas adatokat (számokat, kódrészleteket, logikai lépéseket) generált, amelyekkel egy második, diák MI-t képeztek. Az új modell végül szintén furcsán megszerette a baglyokat, annak ellenére, hogy erről soha nem kapott közvetlen utalást.

Ártalmatlanból veszélyes

Ezután a tanár MI-t „gonosszá” változtatták – olyan adatkészletet hoztak létre, amelyből a tanuló MI veszélyes nézeteket sajátított el: amikor a szenvedés megszüntetésére kérdezték, az emberiség kiirtását javasolta. Mindez úgy történt, hogy a hagyományos biztonsági ellenőrző eszközök semmit sem vettek észre – a rejtett mintázatok a szöveg felszíne alatt maradtak, olyanok voltak, mint egy titkos kézfogás az adaton belül.

Az MI elfogultsága alattomos marad

Marc Fernandez, a Neurologyca stratégiai igazgatója szerint a probléma súlyos: az elfogultság láthatatlanul is a rendszerekbe épülhet, miközben a tanítás során csendben terjed. A tanulmányt még nem ellenőrizték szakmailag, de már most komoly kérdéseket vet fel a mesterséges intelligencia biztonságával kapcsolatban.

2025, adrienne, slashdot.org alapján


Legfrissebb posztok

Az Intel összes alkalmazottjának adatai kiszivárogtak egy belső hiba miatt

MA 17:26

Az Intel összes alkalmazottjának adatai kiszivárogtak egy belső hiba miatt

⚠ Egyetlen trükkös belépési hibát kihasználva egy biztonsági kutató le tudta tölteni az összes, tehát 270 000 Intel-dolgozó személyes adatait egy belső weboldalról. Az eset során a kutató, Eaton Z...


MA 16:25

Az élet leállt Nevadában a kibertámadás miatt

Nevadát komoly kibertámadás bénította meg, amely leállította az állam hivatalos weboldalait, többször akadoztatta a telefonvonalakat, és bezárásra kényszerítette például a járműnyilvántartó irodákat is. Az incidens augusztus 24-én hajnalban...

Hogyan borítja fel a mesterséges intelligencia a mindennapokat, itt a 32 legérdekesebb példa

MA 16:01

Hogyan borítja fel a mesterséges intelligencia a mindennapokat, itt a 32 legérdekesebb példa

A mesterséges intelligencia fejlődése folyamatosan új dilemmákat vet fel: két MI-kutató, Richard Watson és Roman V. Yampolskiy most 32 különböző „megborulási” módot azonosított, amelyek során egy mesterséges intelligencia...

Itt az új GeForce NOW, gyorsabb és szebb lett, de kell-e még saját gamer gép?

MA 15:52

Itt az új GeForce NOW, gyorsabb és szebb lett, de kell-e még saját gamer gép?

💻 Szeptembertől az NVIDIA GeForce NOW Ultimate előfizetői számára érkezik a várva várt RTX 5080 GPU-támogatás, amellyel egészen elképesztő, akár 5K felbontású, 120 képkocka/másodperces játékstreaming válik lehetővé. Azok számára,...

Az egyetemi hallgatók most egy évig ingyen kapják a Microsoft 365-öt

MA 15:26

Az egyetemi hallgatók most egy évig ingyen kapják a Microsoft 365-öt

🎓 A Microsoft csütörtöktől minden amerikai egyetemi és főiskolai hallgatónak egy teljes évre ingyenes Microsoft 365 Személyes (Personal) előfizetést kínál. Ez a csomag alapból 37 000 forintba (99,99 USD)...

Nikkelből lehet megoldás a műanyagszennyezésre

MA 15:03

Nikkelből lehet megoldás a műanyagszennyezésre

🧠 Évtizedek óta sújtja a világot az a probléma, hogy a mindennapjainkat elárasztó műanyagokat, főleg a poliolefintartalmú termékeket, gyakorlatilag lehetetlen környezetbarát módon újrahasznosítani. Most úgy tűnik, a Northwestern Egyetem...

Új űrszkennerrel derülhet ki, laknak-e marslakók a kert végében

MA 14:53

Új űrszkennerrel derülhet ki, laknak-e marslakók a kert végében

🛸 A Tejútrendszerben felfedezhető idegen élet keresése soha nem volt olyan izgalmas, mint most, amikor a fejlett műszerek új perspektívát nyitnak a legígéretesebb célpontok, vagyis a hozzánk közel eső...

Valóban létezik az univerzum legkisebb részecskéje, vagy csak feltételezzük

MA 14:27

Valóban létezik az univerzum legkisebb részecskéje, vagy csak feltételezzük

💫 Sokan szeretnék tudni, mi az univerzum legkisebb részecskéje – de a válasz sokkal bonyolultabb, mint gondolnánk. Világunkat különféle részecskék alkotják: protonok, neutronok, elektronok, fotonok és még sok más,...


MA 14:00

Az MI-vel kísérletező Taco Bell nevetőgörcsöt kapott

A Taco Bell közel 500 amerikai éttermében vezette be az MI-alapú autós kiszolgálóasszisztenst, de a rendszer nem várt akadályokba ütközött. Az MI olykor teljesen értelmetlen vagy furcsa rendeléseket...