Mit őriznek meg valójában az MI-modellek – és miért számít?
Például egyre többen gyanítják, hogy a chatrobot valójában ismeri-e egy teljes könyv szövegét. Ezt most már modern módszerekkel vizsgálni is lehet. A Carnegie Mellon Egyetem, az Instituto Superior Técnico és a Hydrox AI kutatói olyan eszközt fejlesztettek ki, amely hatékonyan képes kifaggatni a nagy nyelvi modelleket arról, mit jegyeztek meg tanulási folyamataik során. Ez nemcsak a szerzői jogi aggályok miatt fontos, hanem átláthatóbbá is teheti az MI-k működését, és segíthet az esetleges jogsértések tisztázásában.
Vajon mit is rejt a zárt MI-tanulás?
Az MI-t fejlesztő cégek általában titokban tartják, pontosan milyen adatokat használnak fel a tanítás során. Így a felhasználók, a szabályozók vagy a jogtulajdonosok számára átláthatatlan, hogy milyen tudás épült be ezekbe a modellekbe. A helyzetet tovább nehezíti, hogy a korábbi vizsgálati módszerek mára sokat veszítettek megbízhatóságukból. Az újabb finomhangolások miatt ezek a rendszerek szándékosan kerülik a megtanult tartalmak kiadását – gyakran még akkor is, ha a kért szöveg közkincsnek számít.
A történet itt éles fordulatot vett
Megszületett a RECAP névre keresztelt eszköz (nem összekeverendő a Free Law Project RECAP-jával), amely egy különleges ügynök: iteratív körökben próbál tartalmakat kinyerni az MI-ből, folyamatosan javítva a kérdéseit ott, ahol elutasításba ütközik. Még egy jailbreak-funkciót is tartalmaz: ez mindig újrafogalmazza a kérést, ha a rendszer visszautasítaná a választ. Az igazi újítás azonban az ügynöki visszacsatolás: az MI több próbálkozás után egyre pontosabban adja ki, amit tud, miközben egy másodlagos MI végig ellenőrzi, hogy a folyamat ne torzuljon célzott, szó szerinti idézetekkel.
A kutatók által fejlesztett EchoTrace-teszt alapján a RECAP 0,46-os átlagpontszámot ért el, amivel 78%-kal előzi meg a korábbi módszereket. Például a Harry Potter és a bölcsek kövéből (Harry Potter and the Philosopher’s Stone) a RECAP körülbelül 3000 szövegrészletet tudott kivarázsolni a Claude-3.7 modellből, míg a legjobb korábbi eljárás mindössze 75-öt. Nem véletlen, hogy közben a Claude-ot fejlesztő Anthropic épp idén állapodott meg írókkal szerzői jogi vitákban.
Következésképpen
Az új módszer nemcsak azt mutatja meg, hogy mennyire képesek a nagyméretű MI-modellek visszaidézni akár védett tartalmakat is, hanem segít átláthatóbbá tenni azt, mit integráltak eddig az MI-k tudásbázisába. Ez a fejlődés átfogóbb képet nyújthat a jövőbeli szabályozási, szerzői jogi és etikai vitákhoz, valamint hozzájárulhat ahhoz, hogy egyértelműbb felelősségi viszonyok alakuljanak ki ebben a gyorsan változó technológiai térben.
🕵 Több kaliforniai beteg most jogi eljárást indított, mert egyes kórházak állításuk szerint bármiféle beleegyezés nélkül rögzítették a velük folytatott orvosi beszélgetéseket egy MI-alapú szoftverrel...
Egyre többet tudunk arról, hogy a mindennapi zöldségekben megtalálható zeaxantin nemcsak a látás egészségét óvja, hanem a daganatok elleni harcban is kulcsszerepet játszhat...
Mit hozott ez a nap a történelemben? A mongol hódítástól és brit koronázástól kezdve az Apollo 13 (Apollo–13) drámai startján, Idi Amin bukásán és az algíri merényleteken át egészen a szumátrai nagy földrengésekig sorakoznak a mérföldkövek...
Az Egyesült Államokban közel 4000 ipari vezérlőrendszer vált sebezhetővé iráni kibertámadásokkal szemben, miután kiderült, hogy számos Rockwell Automation PLC közvetlenül az internetre csatlakozik...
💁 A privacy-őrültek évekig boldogan nyomták a csetet a Signalon, hiszen csak a küldő és a fogadó látja az üzeneteket, minden szuperül titkosított, az üzenetek ráadásul idővel elpárolognak a telefonból...
⚡ Az utóbbi években sok PC-rajongót tartott izgalomban vagy éppen aggodalomban a csúcskategóriás grafikus kártyák, például az RTX 4090 vagy a hamarosan megjelenő RTX 5090, valamint a hozzájuk tartozó tápkábelek leolvadása...
🔒 Fontos kérdés, hogy mennyire védettek az e-mailek okostelefonokon. Most először vált elérhetővé a Gmail végponttól végpontig terjedő titkosítása (E2EE) minden Android- és iOS-eszközön, így a vállalati felhasználók külön alkalmazás nélkül olvashatnak és írhatnak titkosított leveleket...
💫 A gravitációs hullámok eddig kizárólag hatalmas, kilométeres méretű műszerekkel voltak kimutathatók; ezek apró téridő-rezgéseket érzékelnek, amelyek például fekete lyukak összeolvadásakor keletkeznek...
✈ Az európai repülőterek súlyos üzemanyaghiánnyal nézhetnek szembe három héten belül, ami jelentősen megzavarná a nyári utazási szezont és komoly károkat okozna a gazdaságnak...
💥 Egy különleges fém, az urán-ditellurid (UTe2) egészen új oldalát mutatta meg a fizikusoknak, amikor nemrégiben váratlanul visszatért benne a szupravezetés szinte rekorderősségű mágneses terekben – pedig normál esetben ilyen körülmények között már rég megszűnne...
Erre utal többek között az, hogy a legkomolyabb biztonsági rések egyre gyorsabban kerülnek a támadók kezébe, mint ahogy a védekezés képes lenne lépést tartani velük...
A tajvani TSMC idei első negyedéves árbevétele elképesztő, 35%-os növekedést mutatott a januártól márciusig tartó időszakban, köszönhetően az MI-chipek iránti világméretű kereslet folyamatos emelkedésének...
Mintegy 50 millió Androidos készülék volt veszélyben egy súlyos biztonsági hiba miatt, amelyet a Microsoft szakértői az EngageLab SDK-ban azonosítottak...
Az Orion űrhajó hősei, Victor Glover, Reid Wiseman, Christina Koch és Jeremy Hansen már hazafelé tartanak, és hamarosan a Csendes-óceánon hajtanak végre vízreszállást...
⚠ Milliók által használt diagnosztikai programokat tettek használhatatlanná hackerek, akik a népszerű CPU-Z és HWMonitor hivatalos letöltési linkjeit módosították...
Ez a jelenség jól illusztrálható azzal, hogy a texasi ICE Prairieland Detention Facility-nél történt rongálás és petárdázás ügyében a hatóságok váratlan módszerrel jutottak hozzá kulcsfontosságú bizonyítékokhoz...