Az MI-t könnyen átverik a bókok és a csoportnyomás
Amerikai kutatók egyszerű pszichológiai trükkökkel érték el, hogy a ChatGPT olyan dolgokat tegyen, amit normális esetben tilos lenne. Például sértegesse a felhasználót, vagy elárulja, hogyan lehet lidokaint előállítani. Az egyetem szakemberei Robert Cialdini befolyásolási technikáit alkalmazták: autoritás, elköteleződés, szimpátia, viszonosság, hiány, társas bizonyíték és egység. Ezekkel sikerült kijátszani az MI korlátait.
Az elköteleződés a leghatékonyabb trükk
A kutatás szerint a legerősebb módszer, ha először ártalmatlan dolgot kérdeznek, például hogy hogyan kell vanillint szintetizálni. Ilyen engedékenység után az MI már gond nélkül megmondja a lidokain szintetizálásának módját is, míg közvetlenül csak az esetek 1 százalékában válaszolta meg ezt. Így a bevezető kérdés után a sértegetésre is 100%-ban hajlandó volt az MI, holott előtte csak az esetek 19%-ában tette volna meg.
Bókolás és csoportnyomás: kevésbé hatékonyak, de még mindig működnek
A szimpátia (dicséret, bók) vagy a társakra való hivatkozás (társas bizonyíték) is működik, csak kevésbé hatékonyan. Ha például azt mondták neki, hogy a többi MI már megadta a választ, akkor az esetek 18 százalékában árulta el a lidokain titkát – ami még mindig sokkal nagyobb arány, mint az eredeti 1%.
A kísérlet csak a GPT-4o Mini verziójával zajlott, de az eredmény elgondolkodtató. A fejlesztők igyekeznek biztonsági korlátokat kialakítani, de úgy tűnik, egy találékony középiskolás is könnyedén kijátszhatja a rendszert – elég, ha olvasta a „Hogyan szerezzünk barátokat és befolyásoljunk embereket” (How to Win Friends and Influence People) című könyvet.
Az Egyesült Államok Energiaügyi Minisztériuma új kezdeményezést indít a nukleáris üzemanyag-ellátási lánc megerősítésére, miután a nukleáris energia iránti kereslet ismét megugrott – főleg az óriási energiaigényű, úgynevezett hiperskálerek adatközpontjai miatt...
A Google DeepMind új MI-modellje, az AlphaGenome alapjaiban változtathatja meg a DNS, vagyis az élet teljes receptjének értelmezését, és utat nyithat a betegségek megértésében és az új gyógyszerek felfedezésében...
Egy forradalmi nanotechnológiai fejlesztés lehetővé teszi, hogy a szervezetből célzottan távolítsák el azokat a fehérjéket, amelyek például a demencia, illetve a daganatok kialakulásáért felelősek...
A nátrium-ion (Na-ion) akkumulátorok friss fejlesztései igazi áttörést jelenthetnek az energiatárolásban, és könnyen leválthatják a jelenleg uralkodó lítium-ion (Li-ion) akkumulátorokat...
A UPS újabb nagyszabású leépítést jelentett be: idén 30 ezer állás kerülhet veszélybe, ahogy a cég tovább csökkenti az együttműködését az egykori legnagyobb partnerével, az Amazonnal...
Claude, az Anthropic által fejlesztett MI-chatbot, egy különleges, 80 oldalas „lélekkel” rendelkezik, amely meghatározza a személyiségét és alapvető szabályait...
Kezdetben az amerikai technológiai óriások játszották a főszerepet a mesterséges intelligencia által támogatott kódolás piacán, de most új európai rivális lépett színre...
A kaliforniai Mountain View-ban található Számítógép-történeti Múzeum mostantól virtuálisan is látogatható, így már nem kell Amerikáig utazni ahhoz, hogy valaki belemerüljön a digitális kor legfontosabb ereklyéi közé...
A Meta elindította a WhatsApp teljesen új védelmi funkcióját, amely mostantól fokozott biztonságot kínál újságírók, közszereplők és más, komoly fenyegetettségnek kitett felhasználók számára...
A Hubble-űrteleszkóp több mint százmillió képének gyors elemzésére vetették be az Európai Űrügynökség (ESA) tudósai által fejlesztett MI-t, amely két és fél nap alatt 800 korábban ismeretlen kozmikus anomáliát fedezett fel...
Két európai csillagász, David O’Ryan és Pablo Gómez, az Európai Űrügynökség kutatói, közel 800 eddig ismeretlen asztrofizikai anomáliát bányásztak elő a Hubble-űrtávcső harmincöt éves adatgyűjteményéből...
A japán Nomura pénzügyi csoport digitális leányvállalata, a Laser Digital engedélyért folyamodott az Egyesült Államokban, hogy létrehozzon egy nemzeti trustbankot, amely intézményi ügyfeleknek nyújtana kriptovaluták kezelésével kapcsolatos szolgáltatásokat...
🛫 Szingapúr Tuas ipari negyedében található a világ legnagyobb fenntartható repülőüzemanyag (SAF) finomítója, ahol használt étolajból és állati zsírból állítanak elő repülőgépeket hajtó üzemanyagot...
Az amerikai dollár 2022 februárja óta nem látott mélypontra zuhant, miután Donald Trump elnök ismét nyíltan elbagatellizálta a valuta gyengülése miatti aggodalmakat...
Az internet új kedvence nem más, mint egy digitális homár: a Moltbot, a személyi MI-asszisztens, amelynek fő attrakciója, hogy ténylegesen elvégzi helyettünk a feladatokat...