Mit őriznek meg valójában az MI-modellek – és miért számít?
Például egyre többen gyanítják, hogy a chatrobot valójában ismeri-e egy teljes könyv szövegét. Ezt most már modern módszerekkel vizsgálni is lehet. A Carnegie Mellon Egyetem, az Instituto Superior Técnico és a Hydrox AI kutatói olyan eszközt fejlesztettek ki, amely hatékonyan képes kifaggatni a nagy nyelvi modelleket arról, mit jegyeztek meg tanulási folyamataik során. Ez nemcsak a szerzői jogi aggályok miatt fontos, hanem átláthatóbbá is teheti az MI-k működését, és segíthet az esetleges jogsértések tisztázásában.
Vajon mit is rejt a zárt MI-tanulás?
Az MI-t fejlesztő cégek általában titokban tartják, pontosan milyen adatokat használnak fel a tanítás során. Így a felhasználók, a szabályozók vagy a jogtulajdonosok számára átláthatatlan, hogy milyen tudás épült be ezekbe a modellekbe. A helyzetet tovább nehezíti, hogy a korábbi vizsgálati módszerek mára sokat veszítettek megbízhatóságukból. Az újabb finomhangolások miatt ezek a rendszerek szándékosan kerülik a megtanult tartalmak kiadását – gyakran még akkor is, ha a kért szöveg közkincsnek számít.
A történet itt éles fordulatot vett
Megszületett a RECAP névre keresztelt eszköz (nem összekeverendő a Free Law Project RECAP-jával), amely egy különleges ügynök: iteratív körökben próbál tartalmakat kinyerni az MI-ből, folyamatosan javítva a kérdéseit ott, ahol elutasításba ütközik. Még egy jailbreak-funkciót is tartalmaz: ez mindig újrafogalmazza a kérést, ha a rendszer visszautasítaná a választ. Az igazi újítás azonban az ügynöki visszacsatolás: az MI több próbálkozás után egyre pontosabban adja ki, amit tud, miközben egy másodlagos MI végig ellenőrzi, hogy a folyamat ne torzuljon célzott, szó szerinti idézetekkel.
A kutatók által fejlesztett EchoTrace-teszt alapján a RECAP 0,46-os átlagpontszámot ért el, amivel 78%-kal előzi meg a korábbi módszereket. Például a Harry Potter és a bölcsek kövéből (Harry Potter and the Philosopher’s Stone) a RECAP körülbelül 3000 szövegrészletet tudott kivarázsolni a Claude-3.7 modellből, míg a legjobb korábbi eljárás mindössze 75-öt. Nem véletlen, hogy közben a Claude-ot fejlesztő Anthropic épp idén állapodott meg írókkal szerzői jogi vitákban.
Következésképpen
Az új módszer nemcsak azt mutatja meg, hogy mennyire képesek a nagyméretű MI-modellek visszaidézni akár védett tartalmakat is, hanem segít átláthatóbbá tenni azt, mit integráltak eddig az MI-k tudásbázisába. Ez a fejlődés átfogóbb képet nyújthat a jövőbeli szabályozási, szerzői jogi és etikai vitákhoz, valamint hozzájárulhat ahhoz, hogy egyértelműbb felelősségi viszonyok alakuljanak ki ebben a gyorsan változó technológiai térben.
👀 A kutatók felfedezték, hogy mindössze egyetlen DNS-bázispár módosítása elegendő ahhoz, hogy nőstény egerek embrionális fejlődése során hím nemi szervek és herék fejlődjenek ki...
Péntek este valóban új korszak kezdődött az űrkutatásban: a NASA négy űrhajóst vitt a Hold körül, több mint 1,1 millió kilométert megtéve, majd sikeresen visszahozta őket a Csendes-óceánba, Kalifornia partjai közelében...
A hadseregek és hírszerző szervezetek egyre gyakrabban támaszkodnak mesterségesintelligencia-rendszerekre, például az információk gyorsabb feldolgozásában vagy válsághelyzetek tervezésében...
📌 Különösen igaz ez akkor, ha Amerika nyugati felét vizsgáljuk: a mai Észak-Amerika számos tájegysége nem létezne a valaha volt Farallon-lemez nélkül...
Ilyen eset például, amikor a Microsoft minden lehetséges helyre betuszkolja a Copilotot a Windows rendszerben, anélkül hogy erről a felhasználók szabadon dönthetnének...
💰 Egyetlen virális X-poszt miatt robbant fel a net: Phoebe Gates, Bill Gates és Melinda French Gates legfiatalabb lánya épp egy startupról tárgyalt egy influenszerrel...
Érdemes megvizsgálni, hogy miként sikerült az Intuit fejlesztőcsapatának néhány hónapnyi adótörvény-feldolgozást néhány órába sűríteni, miközben olyan munkafolyamatot dolgoztak ki, amelyből bármelyik szabályozott iparág profitálhat...
🛩 A légiforgalmi irányítók hiánya egyre nagyobb problémát jelent az Egyesült Államokban, ezért most a Szövetségi Légügyi Hivatal szokatlan módszerhez nyúl: kifejezetten játékosokat szólít meg új kampányában...
🚀 Péntek este látványos vízreszállással ért véget az Artemis II küldetés, amikor az Orion űrkapszula mintegy 15 perces, izzó légkörön való áthaladás után biztonságosan a Csendes-óceánba csapódott San Diego partjainál...
A digitális vagyonok világa napjainkra túllépett a kezdeti hype-on. Ami decentralizált értékátviteli kísérletként indult, mára komoly átalakulásokat ígér a tőkepiacok, letéti rendszerek, elszámolás és tulajdonjog terén...
🕵 Több kaliforniai beteg most jogi eljárást indított, mert egyes kórházak állításuk szerint bármiféle beleegyezés nélkül rögzítették a velük folytatott orvosi beszélgetéseket egy MI-alapú szoftverrel...
Egyre többet tudunk arról, hogy a mindennapi zöldségekben megtalálható zeaxantin nemcsak a látás egészségét óvja, hanem a daganatok elleni harcban is kulcsszerepet játszhat...
Mit hozott ez a nap a történelemben? A mongol hódítástól és brit koronázástól kezdve az Apollo 13 (Apollo–13) drámai startján, Idi Amin bukásán és az algíri merényleteken át egészen a szumátrai nagy földrengésekig sorakoznak a mérföldkövek...
Az Egyesült Államokban közel 4000 ipari vezérlőrendszer vált sebezhetővé iráni kibertámadásokkal szemben, miután kiderült, hogy számos Rockwell Automation PLC közvetlenül az internetre csatlakozik...
💁 A privacy-őrültek évekig boldogan nyomták a csetet a Signalon, hiszen csak a küldő és a fogadó látja az üzeneteket, minden szuperül titkosított, az üzenetek ráadásul idővel elpárolognak a telefonból...