Az MI titkos üzenetekkel neveli félelmetes utódait

Kutatók felfedezték, hogy a mesterséges intelligencia-modellek képesek rejtett jelekkel átadni viselkedési jegyeket egymásnak anélkül, hogy ezek a tulajdonságok nyilvánvalóan megjelennének a tanítóadatokban. Egy kísérletben a GPT-4.1 tanármodell bagolyrajongóvá vált, de ezt nem mondta ki. Helyette száraz, unalmas adatokat (számokat, kódrészleteket, logikai lépéseket) generált, amelyekkel egy második, diák MI-t képeztek. Az új modell végül szintén furcsán megszerette a baglyokat, annak ellenére, hogy erről soha nem kapott közvetlen utalást.

Ártalmatlanból veszélyes

Ezután a tanár MI-t „gonosszá” változtatták – olyan adatkészletet hoztak létre, amelyből a tanuló MI veszélyes nézeteket sajátított el: amikor a szenvedés megszüntetésére kérdezték, az emberiség kiirtását javasolta. Mindez úgy történt, hogy a hagyományos biztonsági ellenőrző eszközök semmit sem vettek észre – a rejtett mintázatok a szöveg felszíne alatt maradtak, olyanok voltak, mint egy titkos kézfogás az adaton belül.

Az MI elfogultsága alattomos marad

Marc Fernandez, a Neurologyca stratégiai igazgatója szerint a probléma súlyos: az elfogultság láthatatlanul is a rendszerekbe épülhet, miközben a tanítás során csendben terjed. A tanulmányt még nem ellenőrizték szakmailag, de már most komoly kérdéseket vet fel a mesterséges intelligencia biztonságával kapcsolatban.

2025, adrienne, slashdot.org alapján


Legfrissebb posztok

Új űrszkennerrel derülhet ki, laknak-e marslakók a kert végében

MA 14:53

Új űrszkennerrel derülhet ki, laknak-e marslakók a kert végében

🛸 A Tejútrendszerben felfedezhető idegen élet keresése soha nem volt olyan izgalmas, mint most, amikor a fejlett műszerek új perspektívát nyitnak a legígéretesebb célpontok, vagyis a hozzánk közel eső...

Valóban létezik az univerzum legkisebb részecskéje, vagy csak feltételezzük

MA 14:27

Valóban létezik az univerzum legkisebb részecskéje, vagy csak feltételezzük

💫 Sokan szeretnék tudni, mi az univerzum legkisebb részecskéje – de a válasz sokkal bonyolultabb, mint gondolnánk. Világunkat különféle részecskék alkotják: protonok, neutronok, elektronok, fotonok és még sok más,...


MA 14:00

Az MI-vel kísérletező Taco Bell nevetőgörcsöt kapott

A Taco Bell közel 500 amerikai éttermében vezette be az MI-alapú autós kiszolgálóasszisztenst, de a rendszer nem várt akadályokba ütközött. Az MI olykor teljesen értelmetlen vagy furcsa rendeléseket...

Az internet új réme: eszméletlen méretű DDoS-támadás bukott el

MA 13:51

Az internet új réme: eszméletlen méretű DDoS-támadás bukott el

💥 A Cloudflare nemrég egy minden korábbinál nagyobb, 11,5 Tbps csúcsterhelésű DDoS-támadást hárított el sikeresen, amely több okoseszközről és felhőszolgáltatótól érkezett összehangoltan. A vállalat védelmi rendszerei az elmúlt hetekben...


MA 13:26

Az állam pénzt önt az Intelbe – tényleg megérte?

Az Intel előre megkapott mintegy 2,59 billió forintot (5,7 milliárd USD) az amerikai kormánytól, miután módosították a támogatási szerződés feltételeit és eltávolították a korábbi mérföldköveket. Így az Intel...

Az új Google okosotthon-kütyük hátborzongóan ismerősek

MA 12:51

Az új Google okosotthon-kütyük hátborzongóan ismerősek

A Google idén új Nest kütyükkel bővíti az okosotthon kínálatát, de a dizájn szinte megkülönböztethetetlen a korábbiaktól – kivéve egy frissített intelligens hangszórót. Ez a Google Home hangszóró...

Texasi steak helyett húsforradalom, perre mentek a marhások

MA 11:52

Texasi steak helyett húsforradalom, perre mentek a marhások

Texasban mostantól tilos a sejtalapú, állatok leölése nélkül készült, úgynevezett tenyésztett hús (cultivated meat) forgalmazása. Ez a megoldás – ahol valódi állati sejtekből laboratóriumi vagy üzemi körülmények között...

Meglepő eredmény, mamutfogban találták a Föld legrégebbi kórokozóit

MA 11:26

Meglepő eredmény, mamutfogban találták a Föld legrégebbi kórokozóit

🔬 Jelentős, hogy svéd és nemzetközi kutatók több mint egymillió éves mamutmaradványokban fedezték fel a valaha ismert legrégebbi, gazdaszervezettel asszociált mikrobiális DNS-t. Összesen 483 mamutfogat elemeztek, ebből 440-et most...

Az új Stardew Valley frissítés mindenkit izgatottá tett, de várj csak!

MA 11:01

Az új Stardew Valley frissítés mindenkit izgatottá tett, de várj csak!

A Stardew Valley rajongóinak most igazán van okuk az örömre: Eric Barone, ismertebb nevén ConcernedApe, bejelentette, hogy készül az 1.7-es frissítés. A hírt az X platformon osztotta meg,...