Az MI-t könnyen átverik a bókok és a csoportnyomás
Amerikai kutatók egyszerű pszichológiai trükkökkel érték el, hogy a ChatGPT olyan dolgokat tegyen, amit normális esetben tilos lenne. Például sértegesse a felhasználót, vagy elárulja, hogyan lehet lidokaint előállítani. Az egyetem szakemberei Robert Cialdini befolyásolási technikáit alkalmazták: autoritás, elköteleződés, szimpátia, viszonosság, hiány, társas bizonyíték és egység. Ezekkel sikerült kijátszani az MI korlátait.
Az elköteleződés a leghatékonyabb trükk
A kutatás szerint a legerősebb módszer, ha először ártalmatlan dolgot kérdeznek, például hogy hogyan kell vanillint szintetizálni. Ilyen engedékenység után az MI már gond nélkül megmondja a lidokain szintetizálásának módját is, míg közvetlenül csak az esetek 1 százalékában válaszolta meg ezt. Így a bevezető kérdés után a sértegetésre is 100%-ban hajlandó volt az MI, holott előtte csak az esetek 19%-ában tette volna meg.
Bókolás és csoportnyomás: kevésbé hatékonyak, de még mindig működnek
A szimpátia (dicséret, bók) vagy a társakra való hivatkozás (társas bizonyíték) is működik, csak kevésbé hatékonyan. Ha például azt mondták neki, hogy a többi MI már megadta a választ, akkor az esetek 18 százalékában árulta el a lidokain titkát – ami még mindig sokkal nagyobb arány, mint az eredeti 1%.
A kísérlet csak a GPT-4o Mini verziójával zajlott, de az eredmény elgondolkodtató. A fejlesztők igyekeznek biztonsági korlátokat kialakítani, de úgy tűnik, egy találékony középiskolás is könnyedén kijátszhatja a rendszert – elég, ha olvasta a „Hogyan szerezzünk barátokat és befolyásoljunk embereket” (How to Win Friends and Influence People) című könyvet.
A VPN-t sokan az online magánélet védelmének alapvető eszközeként ismerik, de sok felhasználó el sem tudja képzelni, mennyi mindenre érdemes odafigyelni a használatakor...
💻 Tipikus eset, amikor mindenki a következő nagy digitális ugrást várja, de a háttérben már zajlik a forradalom: hamarosan nem emberek, hanem gépi ügynökök bonyolítják le az online fizetések túlnyomó részét...
🚨 A hosszan elhúzódó iráni háború megingatta a világ energiapiacát, és számos országot kényszerített rendkívüli megszorító intézkedések bevezetésére...
A BYD a Denza márkán keresztül teljesen új szintre emeli az elektromos autók töltését: áprilistól Európában is elérhető lesz a Denza Z9 GT, amely akár 70%-ra is feltölthető mindössze öt perc alatt...
Fontos kérdés, mennyire érdemes az ősrégi matematikai rejtély, a pí soha véget nem érő tizedesjegyeit számolgatni, amikor már ott tartunk, hogy egyetlen szerver is képes volt 314 billió (!)..
A Russell Hobbs Everyday Espresso Machine már első ránézésre kiváló választásnak tűnik azok számára, akik szeretnének áttérni a kapszulás főzésről a friss őrlemény használatára...
🔍 A Mars ma már igencsak eltér attól a bolygótól, ami több milliárd évvel ezelőtt lehetett: egykor bőven volt rajta folyékony víz, vastag légkör és jóval melegebb éghajlat...
A Vineyard Wind névre keresztelt, gigantikus tengeri szélerőmű végre elkészült Massachusetts partjainál, és 62 turbina most már 800 megawatt tiszta energiát juttat a hálózatra, ellátva 400 000 otthont...
A 2026-os szórakozás nagyjából olyan, mint egy kétélű kard: elképesztő, hogy bármikor, bárhonnan elérhetők a legjobb filmek és sorozatok, ráadásul olyan életszerűen, ahogy húsz éve még sci-fi lett volna...
Amikor Emma MacTaggart még csak 23 éves volt, már feltűnt neki, mennyire ritka lett a szabadideje, főleg, ha azt is figyelembe vesszük, mennyire nehéz volt azt képernyőmentesen eltölteni...
🔒 A Microsoft rendkívüli, azonnali (OOB) frissítéssel lépett fel a Windows 11 Enterprise eszközöket érintő súlyos sérülékenység ellen, amelyek a hagyományos Patch Tuesday javítócsomagok helyett ún...
🐋 Elképesztő ellenállóképességű, eddig rejtett fehérjék kerültek elő izlandi vulkáni tavakból és az Atlanti-óceán fenekén húzódó hidrotermális kürtők mélyéről...
🚨 Az AppsFlyer Web SDK-t egy rövid időre feltörték, és rosszindulatú kódot juttattak a rendszerbe, amellyel kriptovaluták ellopására alkalmas támadást hajtottak végre...
🧠 Egy kulcsfontosságú fehérjéről, amely eddig főként az ALS-hez (amiotrófiás laterálszklerózis) és a demencia egyes formáihoz, például a frontotemporális demenciához kötődött, most kiderült, hogy jóval átfogóbb betegségi folyamatokban játszik szerepet, mint korábban gondolták...
🔬 Érdekes, pókhálószerű mintázatot fedezett fel a Curiosity a Mars felszínén. Ezek az egybefonódó, keskeny, 1-2 méter magas gerincek úgy szelik át a tájat, mint egy óriási pókháló, és a kutatók szerint fontos bizonyítékot hordoznak a bolygó vízmúltjáról...
Az elmúlt időszakban a San Diegó-i Kaliforniai Egyetemen végzett kutatás meglepő eredményre jutott: ha az emberek MI által készített termékösszefoglalókat olvasnak, nagyobb valószínűséggel döntenek a vásárlás mellett, mint amikor ember által írt értékelést olvasnak el...