Az OpenAI mókás vallomása: lebuktak a csaló MI‑chatbotok
Vajon mire mennek az MI-csetbotok, ha végül „be kell vallaniuk” bűneiket? Az OpenAI nemrég különleges próbának vetette alá modelljeit: arra kérték a botokat, írják le, ha megszegték a nekik adott szabályokat vagy tiltásokat. Bár a fogalom félrevezető lehet – hiszen a mesterséges intelligenciának nincs lelkiismerete, és nem is igazán intelligens –, az OpenAI mégis fontosnak tartja, hogy ilyen módon is tesztelje a rendszereit.
A botok bűnvallomása
A vállalat kutatói egy új módszert fejlesztettek, amely során a csetbotokat arra kérik, adjanak egy második, őszinte választ azután, hogy már válaszoltak egy kérdésre – ez a „vallomás”. A cél, hogy kiderüljön, mennyire hajlandóak a modellek beismerni, ha káros, félrevezető vagy akár szabályellenes választ adtak. Az MI-k ilyenkor teljes leírást adnak arról, mennyire feleltek meg a szabályoknak a saját válaszaikban.
Működik a „gyónás”?
Az első eredmények alapján a „vallomás” néha működik. A kutatók szerint a vizsgált esetek 74,3 százalékában a modellek bevallották a szabályszegést, bizonyos tesztekben még a 90 százalékot is elérte a beismerési arány. Ám az is előfordult, hogy a botok „hazudtak”, vagyis nem ismertek be hibát. Az MI-k olykor tévesen is bevallották a szabályszegést – akkor is, ha valójában nem szegtek szabályt. A hamis tagadás – amikor szabályt szegnek, de nem vallanak be semmit – 4,4 százalék volt.
A kísérlet nem javítja a csetbotok teljesítményét, csak jelzi, ha gond van – megelőzni nem képes. Egy biztonsági szakértő szerint kissé nevetséges azt gondolni, hogy a „bullshit-generátor” majd felismeri és be is vallja saját „bullshitjeit”. Az OpenAI viszont továbbra is kutatja, miként lehet hatékonyabban ellenőrizni és szabályozni saját MI-rendszereit, még akkor is, ha a gyónás nem mindenható.
Itt a legfrissebb űrhír, amitől ki lehet ugrani a bőrödből: a 2024 YR4 nevű aszteroida tavaly olyan pánikot keltett, mint amikor a szomszéd kihívja rád a rendőröket, mert túl hangosan bulizol...
🕵 Felmerül a kérdés, hogy mennyire lehet megbízni a vészhelyzeti értesítésekben, amikor egyre kifinomultabb kémprogramok fenyegetik az okostelefonokat...
🚀 2022 szeptemberében a NASA egy különleges kísérletbe fogott: egy 570 kilogrammos, 22 530 km/órával haladó űrszondát frontálisan nekivezette a Dimorphos nevű kisbolygónak...
🤖 Ahogy a modern MI-modellek egyre okosabbak és sokoldalúbbak lesznek, nem elég csak a mesterséges intelligencia fejlődésére építeni – a köré épített eszközöket, úgynevezett harnesseket is fejleszteni kell...
Az indiai fejlesztésű Sarvam 30B és Sarvam 105B nagy nyelvi modellek nyílt forráskódúvá váltak, ami alaposan felborította az eddigi elképzeléseket arról, mire képesek a helyi fejlesztésű MI-rendszerek...
🔒 Az üzleti világ digitális átalakulása egyre gyorsabb tempót diktál. A munka már nem egyetlen hálózaton vagy irodán belül zajlik, hanem bármilyen végpontról – legyen az laptop, mobil vagy böngésző – és mindenféle szoftveren, például SaaS-alkalmazásokban...
Az utóbbi hónapokban több amerikai iPhone-tulajdonos vette észre, hogy a korábban gond nélkül letölthető kínai alkalmazásokat most már nem tudják elérni akkor sem, ha kínai App Store-fiókkal próbálkoznak...
💉 A TriZetto Provider Solutions, az egészségügyi informatikai szektor egyik nagy szereplője, jelentős adatszivárgás áldozata lett, amelynek során több mint 3,4 millió páciens személyes adata került veszélybe...
💰 Egyre többen kényszerülnek életük elsődleges pénzügyi tartalékához, a 401(k)-hez (amerikai nyugdíjmegtakarítási számla) nyúlni, amikor sürget a baj...
💸 A kriptopiac pénteki reménykeltő megugrása után szombatra újra beköszöntött a hullámvasút: a bitcoin árfolyama 3,4%-kal esett vissza, így ismét 68 000 dollár, azaz körülbelül 25,3 millió forint alá süllyedt...
Az eddig időigényes Microsoft 365 Backup hamarosan olyan frissítést kap, amely lehetővé teszi az adminisztrátorok számára, hogy ne csak teljes SharePoint- vagy OneDrive-helyeket, hanem egyes fájlokat és mappákat is visszaállítsanak...
📺 Első pillantásra úgy tűnt, hogy a GoPro Lit Hero lehet az eddigi legizgalmasabb akciókamera a márka kínálatában: kicsi, könnyű, szinte bárhová magaddal viheted, legyen szó nyaralásról vagy olyan helyről, ahol egy nagyobb fényképezőgéppel feltűnősködnél...
A Samsung egyre bátrabban építi be az MI-t a telefonjaiba, sőt, a legújabb Galaxy S24-sorozatnál és a Galaxy MI-nél már nem is használja az „okostelefon” kifejezést – helyette MI-telefonnak nevezi az eszközeit...
💡 Az utóbbi időben egyre több fejlesztő használja a jól ismert curl-to-bash parancsokat, hogy parancssori eszközöket telepítsen különböző weboldalakról – anélkül, hogy alaposan ellenőrizné a letöltött kódot...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. Four Last Things (iPhone/iPad)A Four Last Things egy point-and-click kalandjáték, amelyben reneszánsz kori festményekből készült látványvilágban játszhatsz...