2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

szerda 19:13

A DataGrail szerint beszállítód engedély nélkül etetheti az MI-t ügyféladataiddal

🚫 A cégek általában úgy gondolják, hogy a hivatalos adatfeldolgozási szerződésük (DPA) garantálja, hogy partnereik megfelelően kezelik az ügyfeleik adatait...

szerda 19:01

A népszerű öregedésgátló koktél súlyos agykárosodást okozott egerekben

💉 A legújabb kutatások szerint a széles körben vizsgált, öregedésgátlónak tartott gyógyszerkombináció komoly agykárosodást idézhet elő...

szerda 18:57

A rómaiak és vikingek alig hagytak nyomot a brit génekben

🕵 A Római Birodalom közel négyszáz évig uralta Britanniát, mégis a legfrissebb ősi DNS-kutatások szerint szinte alig hagytak genetikai nyomokat maguk után az ott élőkben...

szerda 18:46

Az Nvidia MI-GPU idén csúszik – a PC-gamerek örülhetnek

🎉 Nvidia legfrissebb, kifejezetten MI-következtetésre fejlesztett grafikus kártyája, a Rubin CPX idén már biztosan nem jelenik meg – és meglepő módon ennek örülhetnek a PC-s játékosok...

szerda 18:35

A zavaró hangokat hamarosan messzire tolhatod Discordon, térbeli hangzással

A Discord hamarosan bevezethet egy forradalmi újdonságot, amelynek segítségével a felhasználók a hívásokban részt vevőket térben is elhelyezhetik maguk körül...

szerda 18:23

Az új lézeres hőkezelés megállíthatja a vakságot, mielőtt kialakulna

Az időskori makuladegeneráció (AMD) világszerte emberek millióinak életét nehezíti meg, különösen a 80 év felettiek körében...

szerda 17:58

A MI-forradalom epicentruma: az Nvidia évente 55 ezer milliárdot önt Tajvanba

🚀 Felmerül a kérdés, mitől lett Tajvan a mesterséges intelligencia világközpontja, és miért hajt végre ott az Nvidia soha nem látott ütemben beruházásokat...

szerda 17:35

A Google Health botrányosan rossz? Dühöngenek a Fitbit-rajongók

😡 A Google mostanra szinte mindenkinél lecserélte a korábbi Fitbit alkalmazást a vadonatúj Google Healthre Androidon és iOS-en is...

szerda 17:23

A Bitcoin a 75 ezer dolláros támaszba kapaszkodik: visszatér a medvepiac?

📈 Mélységi hullámvasúton halad a kriptopiac: a Bitcoin az elmúlt 24 órában a 27,2 millió forintos (75 000 USD) támaszszint környékén ingadozott, miután kedden nem sikerült áttörnie a 28,3 millió forintos (78 000 USD) ellenállást...

szerda 16:56

A hype-videókba öntik a pénzt az MI-startupok – miért?

💸 Egy különös jelenet játszódik Oakland egyik raktárában: Alice, a Kalapos és egy hatalmas nyúlfejet viselő férfi ül egy asztalnál egy fekete-fehér kockás padlón...

szerda 16:13

A shiitake átok: ostorcsapás-szerű kiütések egy nő hátán

🧃 Például egy 23 éves floridai nő váratlanul élénkvörös, ostorcsapásra emlékeztető kiütéseket tapasztalt a hátán, amelyek két napon át makacsul viszkettek...

szerda 16:01

A dolláralapú stablecoinok ismét dominálják a kriptópiacot

💰 Az elmúlt hetekben a kriptopiacon ismét megfigyelhető a legnagyobb kriptovaluta háttérbe szorulása – életre kel az a piaci dinamika, amely idén év elején is felerősödött a jelentős piaci esés során...

szerda 15:57

A SoFi banki stabilcoinja 15 millió felhasználóhoz ér el

💰 Újabb fontos mérföldkőhöz érkezett a pénzügyi technológiai szektor: a SoFi pénzügyi alkalmazás egy amerikai nagybank támogatásával bevezette saját, dollárhoz kötött stabilcoinját, SoFiUSD néven...

szerda 15:45

A techóriások vagyonokat zsebelnek be adatainkból, az AI még többet

Amerikában egy átlagos internethasználó személyes adatai az elmúlt évtizedek során elképesztő vagyont jelentettek a technológiai vállalatoknak...

szerda 15:24

A földönkívüliek akaratlan rádiójelekkel árulják el magukat?

Erre utal többek között az, hogy már jóval az Apollo–11 holdraszállása előtt, amikor még tartottak attól, hogy az első holdkompot elnyeli a Hold poróceánja, a rádiócsillagászat révén sikerült igazolni: a Hold szilárd felszínű, és ezzel megnyílt az űrkutatás aranykora...

szerda 15:02

Az MI kevés: a vezérigazgatók 99%-a MI miatti leépítésre készül

Az MI radikális átalakulást hoz a munkahelyeken – a vállalatvezetők döntő többsége már most készül a dolgozók elbocsátására a következő néhány évben...

szerda 14:58

A RedMagic 11S Pro villámgyors, de ezt a filmet már láttuk

A RedMagic 11S Pro szemmel láthatóan a jelenleg egyik leggyorsabb telefon a piacon, különlegesen játékra szabott funkciókkal és kifejezetten erős hardverrel...

szerda 14:44

A Hodlnaut volt vezérét, Zhu Juntaót Szingapúrban vádolják a Terra-összeomlás miatt

🚨 Első pillantásra úgy tűnt, hogy a Hodlnaut komoly veszteségek nélkül túlélte a TerraUSD-botrányt, ám a valóság kíméletlenül mást mutatott...

szerda 14:23

A Kraken új Bitcoin Vaultja: nagyobb hozam, kisebb kockázat

A Kraken újabb forradalmi megoldással állt elő a kriptovilágban: bemutatkozik a Bitcoin Vault, amely a hosszú távon gondolkodó bitcoin-tulajdonosoknak kínál a passzív jövedelem lehetőségét anélkül, hogy el kellene adniuk megtakarításaikat, vagy aktívan kezelniük kellene a decentralizált pénzügyi (DeFi) protokollokat...

szerda 14:02

A brit közszféra baja nem az MI, hanem az összehangolás hiánya

Az Egyesült Királyságban egyre gyorsabban terjed a mesterséges intelligencia alkalmazása a közigazgatásban, ám hiányzik a világos elképzelés arról, hogy mit is akarnak ezzel valójában elérni...

szerda 13:56

A Bitcoin már csak 13., a tőke aranyba és MI-be menekül

💰 Ez a jelenség jól illusztrálja, hogy az utóbbi időben a befektetők látványosan elfordultak a Bitcointól, miközben az arany, az ezüst és a félvezetőipari cégek szárnyaltak...

szerda 13:46

Az MI új korszaka: amikor a banki robot már pénzt termel

🪙 Mi történik, ha egy bankban az MI nemcsak válaszol, hanem maga is lépéseket tesz?..

szerda 13:35

A brit vonatokra végre normális Wi‑Fi érkezik

🚆 Évek óta húzódó internetprobléma oldódhat meg a brit vonatokon. Bár sok járaton már most is van Wi‑Fi, az utasok többsége tapasztalta, hogy ritkán működik jól – főként a ritkábban lakott térségekben...

szerda 13:23

A NASA Fermi-teleszkópja felfedi a szörnyeteg szupernóvák hajtóerejét

A NASA Fermi gamma-sugár-űrtávcsövének hosszú távú megfigyelése során a kutatóknak végre sikerült megtalálniuk, mi áll a valaha látott legfényesebb csillagrobbanások hátterében...

szerda 13:12

Az MI szuperhackerré nő: biztonságban van még a DeFi?

🔐 A decentralizált pénzügyek világa egyre kevésbé tűnik biztonságosnak, miután újabb, brutális támadások rázták meg a szektort...

szerda 13:01

A HTX visszautasítja a brit szankcióvádakat, rubelhez kötött stabilcoint sem listáz

A HTX kriptotőzsde sietve cáfolta a brit külügyminisztérium gyanúsítását, amely szerint segített volna Oroszország pénzügyi infrastruktúrájának fenntartásában, valamint az ukrajnai háborúhoz kapcsolódó források mozgatásában...

szerda 12:57

Az apró Keurig K‑Mini Mate, ami nagyot üt ízben

A Keurig K-Mini Mate egy mindössze 23 cm magas és 10 cm széles, egyszerű kezelésű kapszulás kávéfőző, amely méreténél jóval többet nyújt: gyorsan és erőteljes ízvilággal főzi le kedvenc italodat...

szerda 12:45

A guavalé felturbózhatja a vaspótló készítményeket?

🥑 Világszerte rengeteg nő és tizenéves lány küzd vashiányos vérszegénységgel, különösen az alacsony és közepes jövedelmű országokban...