Mit őriznek meg valójában az MI-modellek – és miért számít?
Például egyre többen gyanítják, hogy a chatrobot valójában ismeri-e egy teljes könyv szövegét. Ezt most már modern módszerekkel vizsgálni is lehet. A Carnegie Mellon Egyetem, az Instituto Superior Técnico és a Hydrox AI kutatói olyan eszközt fejlesztettek ki, amely hatékonyan képes kifaggatni a nagy nyelvi modelleket arról, mit jegyeztek meg tanulási folyamataik során. Ez nemcsak a szerzői jogi aggályok miatt fontos, hanem átláthatóbbá is teheti az MI-k működését, és segíthet az esetleges jogsértések tisztázásában.
Vajon mit is rejt a zárt MI-tanulás?
Az MI-t fejlesztő cégek általában titokban tartják, pontosan milyen adatokat használnak fel a tanítás során. Így a felhasználók, a szabályozók vagy a jogtulajdonosok számára átláthatatlan, hogy milyen tudás épült be ezekbe a modellekbe. A helyzetet tovább nehezíti, hogy a korábbi vizsgálati módszerek mára sokat veszítettek megbízhatóságukból. Az újabb finomhangolások miatt ezek a rendszerek szándékosan kerülik a megtanult tartalmak kiadását – gyakran még akkor is, ha a kért szöveg közkincsnek számít.
A történet itt éles fordulatot vett
Megszületett a RECAP névre keresztelt eszköz (nem összekeverendő a Free Law Project RECAP-jával), amely egy különleges ügynök: iteratív körökben próbál tartalmakat kinyerni az MI-ből, folyamatosan javítva a kérdéseit ott, ahol elutasításba ütközik. Még egy jailbreak-funkciót is tartalmaz: ez mindig újrafogalmazza a kérést, ha a rendszer visszautasítaná a választ. Az igazi újítás azonban az ügynöki visszacsatolás: az MI több próbálkozás után egyre pontosabban adja ki, amit tud, miközben egy másodlagos MI végig ellenőrzi, hogy a folyamat ne torzuljon célzott, szó szerinti idézetekkel.
A kutatók által fejlesztett EchoTrace-teszt alapján a RECAP 0,46-os átlagpontszámot ért el, amivel 78%-kal előzi meg a korábbi módszereket. Például a Harry Potter és a bölcsek kövéből (Harry Potter and the Philosopher’s Stone) a RECAP körülbelül 3000 szövegrészletet tudott kivarázsolni a Claude-3.7 modellből, míg a legjobb korábbi eljárás mindössze 75-öt. Nem véletlen, hogy közben a Claude-ot fejlesztő Anthropic épp idén állapodott meg írókkal szerzői jogi vitákban.
Következésképpen
Az új módszer nemcsak azt mutatja meg, hogy mennyire képesek a nagyméretű MI-modellek visszaidézni akár védett tartalmakat is, hanem segít átláthatóbbá tenni azt, mit integráltak eddig az MI-k tudásbázisába. Ez a fejlődés átfogóbb képet nyújthat a jövőbeli szabályozási, szerzői jogi és etikai vitákhoz, valamint hozzájárulhat ahhoz, hogy egyértelműbb felelősségi viszonyok alakuljanak ki ebben a gyorsan változó technológiai térben.
🚧 Különösen igaz ez, ha grandiózus, sci-fibe illő tervekről van szó: Szaúd-Arábia leállította A Vonal (The Line) projekt további munkálatait legalább 2030-ig...
💪 Különösen akkor, ha egy ritka genetikai eltérés világít rá, hogy amit az agytudomány évtizedek óta biztosnak hitt, az lehet, hogy alapjaiban nem igaz...
Érdekes felvetés, hogy egy alkotógárda akár két teljesen eltérő sci-fi sorozatot is le tud tenni az asztalra, miközben a témájuk első pillantásra nagyon hasonlónak tűnik...
Erre példa, amikor egy kriptovaluta hetekig alig mozdul, majd hirtelen elindul a lejtőn: az XRP árfolyama már harmadszor pattant le a fontos 1,36 dolláros ellenállásról, így a bikák lendülete megtört, és a jegyzés most az 1,35 dolláros szint alá süllyedt...
Egy lényeges szempont, hogy az elmúlt húsz évben a technikai adósság leginkább elavult rendszereket, zűrzavaros programkódot és elhanyagolt dokumentációt jelentett...
Ebből következően érdemes megérteni, hogy a NASA Psyche űrszondája meghatározó mérföldkőhöz ért: sikeresen kihasználta a Mars gravitációját, hogy lendületet kapjon és megfelelő irányba álljon a kisbolygóövben keringő titokzatos, fémben gazdag Psyche aszteroida felé...
4,6 milliárd éve a Napot masszív gáz- és porlemez vette körül, amelyből először apró porszemek születtek, majd ezekből bonyolult ütközések és összetapadások révén kialakultak a bolygókezdemények...
Álomszerűen tiszta borostyánban találtak egy döbbenetes ősi rovart Mianmarban, amelynek mellső lábait rákollókra emlékeztető hatalmas ollók koronázzák meg...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. ImgRef (iPhone/iPad)Ez az alkalmazás egy sokoldalú, minden igényt kielégítő kreatív eszköz: lehetővé teszi mood boardok készítését, referenciafotók rendezését, intelligens médiakezelést, precíz színválasztást és szabad kollázsolást...
A középkori várak korában, amikor Európában állandó háborúk és hatalmi harcok dúltak, a masszív, kőből épült erődök sokszor a túlélés zálogát jelentették...
🌱 Fontos kérdés, hogy miért jelennek meg bizonyos betegségek, például a diabétesz, sokkal fiatalabb korban a hawaii őslakosok között, mint az állam többi lakójánál...
💰 A kriptopiacok jelentős mozgásokat mutattak, miután amerikai rakétacsapások értek iráni célpontokat, ami azonnali hatással volt az olajárakra és a főbb devizákra is...
Az elmúlt 24 órában 15%-ot emelkedett a NEAR token, így ára elérte az 1050 forintot (2,8 USD), ami egy hónapos felfutás csúcsa: ebben az időszakban a NEAR értéke megduplázódott...
A Kansas City Public Schools vezetősége radikális digitális fordulatot jelentett be: több mint 30 000 Windows PC és Chromebook cseréjét kezdik meg Apple laptopokra...
🔒 Fontos fejlemény, hogy Indonézia hivatalosan is blokkolta a Polymarket kriptovalutás előrejelző platformját, azzal az indokkal, hogy az tulajdonképpen online szerencsejátéknak minősül a helyi jog szerint...
Az MI fejlődése az utóbbi években újabb lendületet kapott: a kutatók egy úttörő megoldással ötvözték a hagyományos nyelvi modelleket a kvantumszámítógépek erejével...
Különösen igaz ez akkor, ha az orvostudomány fejlődésének mérföldkövei szó szerint rozsdásodnak a múltban: Kína egyik Ming-kori sírjából előkerült, 600 éves műtéti eszközökről egy mostani vizsgálat során kiderült, hogy rajtuk maradt a világ első közvetlen kémiai nyoma egy helyi érzéstelenítőszernek...