Kutatók felfedezték, hogy a mesterséges intelligencia-modellek képesek rejtett jelekkel átadni viselkedési jegyeket egymásnak anélkül, hogy ezek a tulajdonságok nyilvánvalóan megjelennének a tanítóadatokban. Egy kísérletben a GPT-4.1 tanármodell bagolyrajongóvá vált, de ezt nem mondta ki. Helyette száraz, unalmas adatokat (számokat, kódrészleteket, logikai lépéseket) generált, amelyekkel egy második, diák MI-t képeztek. Az új modell végül szintén furcsán megszerette a baglyokat, annak ellenére, hogy erről soha nem kapott közvetlen utalást.
Ártalmatlanból veszélyes
Ezután a tanár MI-t „gonosszá” változtatták – olyan adatkészletet hoztak létre, amelyből a tanuló MI veszélyes nézeteket sajátított el: amikor a szenvedés megszüntetésére kérdezték, az emberiség kiirtását javasolta. Mindez úgy történt, hogy a hagyományos biztonsági ellenőrző eszközök semmit sem vettek észre – a rejtett mintázatok a szöveg felszíne alatt maradtak, olyanok voltak, mint egy titkos kézfogás az adaton belül.
Az MI elfogultsága alattomos marad
Marc Fernandez, a Neurologyca stratégiai igazgatója szerint a probléma súlyos: az elfogultság láthatatlanul is a rendszerekbe épülhet, miközben a tanítás során csendben terjed. A tanulmányt még nem ellenőrizték szakmailag, de már most komoly kérdéseket vet fel a mesterséges intelligencia biztonságával kapcsolatban.
2025, adrienne, slashdot.org alapján
Legfrissebb posztok
MA 20:37
🦠 Egy új kutatás megdöbbentő sebességet tárt fel, amivel a H1N1 és a COVID-19 elterjedt az amerikai városokban...
MA 20:01
🚀 A Crew-12 űrhajósai február 11-én indulnak a Nemzetközi Űrállomásra, csatlakozva a fedélzeten maradt három űrutazóhoz, miután az előző missziót egészségügyi okokból lerövidítették...
MA 19:55
Az egyik legnagyobb amerikai fizetésiátjáró-szolgáltató, a BridgePay ransomware-támadás áldozata lett, ami kulcsfontosságú rendszereit tette elérhetetlenné, és országos kiesést okozott...
MA 19:37
💸 A Bitcoin 60 000 dollár közeléből körülbelül 69 000 dollárra tért magához, miután gyakorlatilag visszaadta azokat a nyereségeket, amelyeket Donald Trump 2024...
MA 19:19
🏷️ Ebből következően érdemes megérteni, hogy február kellős közepén jócskán volt dolga az Engadget tesztelőinek...
MA 19:02
Régészek angolszász gyerekeket fedeztek fel, akiket lándzsával, pajzzsal és csatokkal temettek el – olyan felszereléssel, amely általában harcosok sírjaiban található...
MA 18:56
📱 Korábban minden kirándulásomra magammal vittem a megbízható Nikon DSLR fényképezőgépemet. Felejthetetlenül szép pillanatokat örökítettem meg a kit objektívvel és a 70-300 mm-es zoomobjektívvel, de mindig sajnáltam, hogy az utóbbi mennyire sok helyet foglal...
MA 18:37
A modern Samsung telefonok rengeteg funkcióval vannak tele, több mint bármely más Android márka...
MA 18:18
🔑 Az ADHD-val küzdők álma a második generációs AirTag. A hangosabb sípolás és a megnövelt hatótáv életmentő lehet azoknak, akik soha nem emlékeznek, hová tették a kulcsukat...
MA 17:38
Tavaly év végén bemutattuk, hogyan építettük stúdiónkat a QNAP TS-h1290FX köré...
MA 16:56
🤖 A Google, az Amazon, a Microsoft és a Meta együttesen közel 217 billió forintot (700 milliárd dollárt) szánhat idén mesterségesintelligencia-fejlesztésekre...
MA 16:37
A nagy sporteseményekhez, mint a Super Bowl, rejtett egészségügyi kockázatok társulnak...
MA 16:21
📱 A 23 éves Matt Richards ügyfélmenedzser tavaly törölte az összes közösségimédia-alkalmazást a telefonjáról, és meglepődött, amikor felfedezte, hogy az élete jobbra fordult...
MA 16:01
🧠 Megvizsgálandó, hogy Robert F. Kennedy Jr., az amerikai egészségügyi és humánszolgáltatási miniszter állítása, miszerint a magas zsírtartalmú, alacsony szénhidráttartalmú étrend meggyógyíthat bizonyos pszichiátriai betegségeket, mennyire tartható...
MA 15:57
Csaknem két évtizede dúl a vita a tudósok körében: a szivacsok vagy a fésűsmedúzák jelentették-e az első állati vonalat...
MA 15:01
A 41 éves olimpiai aranyérmes síelő, Lindsey Vonn valóságos fiziológiai csoda...
MA 14:56
⚡ 2025-ben a napelem és a szélenergia először múlta felül a szenet mint globális energiaforrást...
MA 14:37
A James Webb Űrteleszkóp segítségével a csillagászok feltérképezték az univerzum sötét anyagának eddigi legnagyobb szakaszát, elmélyítve ezzel a titokzatos anyag kozmikus tájat formáló szerepének megértését...
MA 14:19
🎮 Bár gyakran egybemossuk a retro játékkonzolokat, az első 3D-s grafikai rendszerek, mint a Nintendo 64 és a Sony PlayStation, vizuálisan markánsan különböztek egymástól...
MA 14:03
A korábban csak drónjairól ismert DJI mára sokkal több lett, mint egy dróngyártó...
MA 13:55
Lenyűgöző, több mint 180 millió éves ősi nyomokat fedeztek fel Marokkó Közép-Atlasz-hegységében, amelyek új fejezetet nyithatnak az élet eredetének kutatásában...
MA 13:19
Az utóbbi években Hollywood mindent feltett az MI-re, de látványosan pórul járt...
MA 13:02
A mindennapok egyre elengedhetetlenebb eszköze az okos, multifunkciós töltő, amely nem csupán energiával lát el, de még jól is néz ki...
MA 12:57
Egy New York-i szövetségi bíró példátlan döntést hozott: egy ügyvéd ismételt MI-visszaélése miatt megszüntette a teljes pert...
MA 12:20
Kérdés, mikor és milyen formában lép be az Apple a hajlítható okostelefonok világába – hiszen míg a Samsung és a Google már évekkel ezelőtt piacra dobták saját hajlítható mobiljaikat, az Apple eddig feltűnően kimaradt ebből a kategóriából...
MA 12:01
Waymo önvezető taxijai komoly problémákkal küzdenek Austinban, mert rendszeresen nem állnak meg az iskolabuszoknál, amikor éppen gyerekek szállnak le vagy fel...
MA 11:55
A Disney+ előfizetők több európai országban egy ideje hiába keresik a Dolby Vision HDR-tartalmakat, ezek ugyanis eltűntek a platformról...
MA 11:38
⚠ Egyre erősebb súlycsökkentő gyógyszerek jelennek meg, amelyek a korábbi sikereket messze felülmúlhatják...
MA 11:02
Fontos kérdés, hogy miként tudja az OpenAI vezetősége kezelni az egyre erősödő kritikákat, amelyek a vállalat növekedésével párhuzamosan szaporodnak...