Kutatók felfedezték, hogy a mesterséges intelligencia-modellek képesek rejtett jelekkel átadni viselkedési jegyeket egymásnak anélkül, hogy ezek a tulajdonságok nyilvánvalóan megjelennének a tanítóadatokban. Egy kísérletben a GPT-4.1 tanármodell bagolyrajongóvá vált, de ezt nem mondta ki. Helyette száraz, unalmas adatokat (számokat, kódrészleteket, logikai lépéseket) generált, amelyekkel egy második, diák MI-t képeztek. Az új modell végül szintén furcsán megszerette a baglyokat, annak ellenére, hogy erről soha nem kapott közvetlen utalást.
Ártalmatlanból veszélyes
Ezután a tanár MI-t „gonosszá” változtatták – olyan adatkészletet hoztak létre, amelyből a tanuló MI veszélyes nézeteket sajátított el: amikor a szenvedés megszüntetésére kérdezték, az emberiség kiirtását javasolta. Mindez úgy történt, hogy a hagyományos biztonsági ellenőrző eszközök semmit sem vettek észre – a rejtett mintázatok a szöveg felszíne alatt maradtak, olyanok voltak, mint egy titkos kézfogás az adaton belül.
Az MI elfogultsága alattomos marad
Marc Fernandez, a Neurologyca stratégiai igazgatója szerint a probléma súlyos: az elfogultság láthatatlanul is a rendszerekbe épülhet, miközben a tanítás során csendben terjed. A tanulmányt még nem ellenőrizték szakmailag, de már most komoly kérdéseket vet fel a mesterséges intelligencia biztonságával kapcsolatban.
2025, adrienne, slashdot.org alapján
Legfrissebb posztok
MA 14:04
🚀 A DJI legfrissebb dobása, az Avata 360 drón nemcsak a panorámadrónozás világát forgatja fel, hanem az otthoni filmezés, vlogolás és kalandvideók piacát is...
MA 13:57
Az Intel hosszú várakozás után bemutatta új grafikus kártyáját, az Arc Pro B70-et, amely a régóta pletykált Big Battlemage GPU-ra épül, ám ezúttal nem a játékosokat, hanem az MI-alkalmazásokat célozza meg...
MA 13:45
Zágráb utcáira érkezik az Uber és a kínai Pony.ai közös robotaxi-szolgáltatása, amelyet egy horvát cég, a Verne fog össze – ők gondoskodnak a teljes működési rendszer kiépítéséről...
MA 13:23
Érdemes megvizsgálni, milyen változások várhatók a Samsung következő generációs mobilchipjénél. Az Exynos 2800 koncepciója mostanra körvonalazódik, és úgy tűnik, a vállalat ezúttal a stabilitást helyezi előtérbe a Galaxy S28 szériánál...
MA 12:01
Fontos megérteni, hogy az utóbbi napokban tömeges támadássorozat indult a Magento Open Source és az Adobe Commerce rendszereket érintő, súlyos PolyShell-sebezhetőség kihasználására...
MA 11:56
A nagy memóriagyártók már minden idei moduljukat eladták, így hiányok és áremelkedések alakultak ki a piacon...
MA 11:45
A Razer legújabb, 16 hüvelykes laptopja látványos hardverfrissítéssel érkezik: az Intel vadonatúj Core Ultra lapkáival és ultragyors, 9600 MHz-es LPDDR5X memóriával kapható, legalább 32 GB-tal szerelve...
MA 11:34
🔧 A Samsung Galaxy A57 5G-t már a bemutató előtt, néhány órával szét is szedték, és ami a leginkább feltűnő: a telefont végre a könnyű javíthatóság jegyében tervezték...
MA 11:12
💸 Egy amerikai esküdtszék történelmi döntése értelmében a Meta és a YouTube összesen 6 millió dollár (közel 2,2 milliárd forint) kártérítést köteles fizetni egy ma 20 éves fiatal nőnek és édesanyjának...
MA 11:02
A Perzsa-öböl térségében az utóbbi hetekben a helymeghatározó rendszerek zavarása szinte mindennapossá vált...
MA 10:58
Az Intel most masszív lendületet ad az Arc B-sorozatú videokártyáinak, két új modellel: megérkezett az Arc Pro B70 és az Arc Pro B65...
MA 10:51
🚀 Érdekes felvetés, hogy mi lesz a sorsa annak a több milliárd dollárért fejlesztett Hold körüli űrállomásnak, amelynek építését az Egyesült Államok most jegeli, hogy az erőforrásokat inkább más, nagyobb szabású célokra összpontosítsa...
MA 10:43
A Ring új szintre emelte kültéri biztonsági eszközeit: elérhetővé váltak a vezeték nélküli, akkumulátoros verziók a 4K-s és 2K-s felbontású videócsengőkből is, már 29 000 Ft-tól...
MA 10:36
💸 A kaliforniai bíróság most tényleg odacsapott: két techóriást, a Metát és a Google-t is felelőssé tették, amiért addiktív dizájnnal szippantották be a fiatalokat...
MA 10:29
Különösen igaz ez akkor, ha a közösségi médiaóriások pénzügyi szolgáltatások irányába terjeszkednek...
MA 09:57
A dróntechnológia új korszakába lépett, amikor a BRINC bemutatta legújabb fejlesztését, a Guardian nevű, kifejezetten rendőrségi célokra szánt drónt...
MA 09:29
😴 Éjszaka nemcsak testünk pihen, agyunk is különös utakat jár be. Egy friss kutatás szerint ugyanis a színes, élénk álmok nem csupán szórakoztatnak, hanem hozzájárulhatnak ahhoz is, hogy reggel valóban kipihentnek érezzük magunkat — sőt, az intenzív álmodás azoknak az éjszakáknak a titka, amikor a legmélyebbnek érezzük az alvást, függetlenül attól, mennyire aktív maradt közben az...
MA 09:16
👀 Fontos kérdés, hogy mennyi adatot gyűjt rólad egy VPN, miközben elvileg éppen azt ígéri, hogy megvédi a magánszférádat...
MA 09:08
🛰 A NASA frissen közzétett képei segítségével a Szaturnusz eddig soha nem látott részletességben tárul elénk...
MA 08:50
Az Apple évek óta kivár a mobilkamerák terén, de most végre felrázhatja a piacot: tesztelés alatt áll egy 200 megapixeles főkamera, amely nagyobb lehet, mint a Samsung Galaxy S26 Ultra 200 megapixeles érzékelője...
MA 08:43
💬 Fontos kérdés, hogy mi történik akkor, amikor a tudományos élet válságba kerül, és azok is távoznak, akik egyszer a kutatás iránti elkötelezettséget mindennél előbbre valónak tartották...
MA 08:36
Ilyen eset például, amikor a csalók nem valódi telefonokat, hanem virtuális okostelefonokat használnak, hogy teljesen hiteles felhasználónak tűnjenek...
MA 08:29
Egy új, folyamatosan fejlődő kártevő, a Torg Grabber már 850 böngészőbővítményből képes érzékeny adatokat ellopni, ebből 728 kifejezetten kriptopénztárcákhoz kapcsolódik...
MA 07:57
🔬 Az elmúlt évtizedekben a tömegspektrometria alapvető eszközzé vált a tudományos kutatásban, ám a technika egyik legnagyobb korlátja, hogy a legtöbb jelenleg használt műszer egyszerre csak néhány molekulát képes elemezni...
MA 07:50
🛑 A szoftverellátási lánc sebezhetőségei eddig főként kártevők és zsarolóvírusok révén kerültek be a köztudatba, azonban most egy lényegesen egyszerűbb módszer is elérhetővé vált a támadóknak: rosszindulatú vagy hamisított API-dokumentációval is megvezethetők az MI-alapú kódoló ügynökök...
MA 07:36
Az USA-ban a zimankós hónapok alatt ugrásszerűen megnő a szív- és érrendszeri halálozások száma...
MA 07:22
A bűnözők legújabb trükkje, hogy a Bubble nevű, no-code, MI-alapú alkalmazáskészítő platformot használják Microsoft-fiókok elleni adathalász támadásokhoz...
MA 07:11
Fizetős iOS appok és játékok, amik ingyenesek a mai napon...
MA 07:08
👤 A Reddit új lépést tett a gyanús aktivitás kiszűrésére: hamarosan arra kötelezi azokat a fiókokat, amelyek automatizált vagy egyébként gépies viselkedést mutatnak, hogy igazolják, valóban ember kezeli őket...