2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 12:02

A pénz sem véd: az ingatlanpiac a szupergazdagokat is sújtja

💰 Az elmúlt években sorra kerülnek napvilágra azok a hírek, amelyek szerint a hírességek és milliárdosok jelentős veszteségekkel, elsőre hihetetlennek tűnő áron kénytelenek megválni luxusingatlanaiktól...

MA 11:45

Az OpenAI betör a médiapiacra: hollywoodi talkshow-kat vásárolna

Az OpenAI az utóbbi időben igyekezett leszűkíteni a fókuszát, a mellékvágányok helyett ismét a vállalati MI fejlesztésére összpontosítva...

MA 11:33

Úton a Hold felé: startolt az Artemis II legénysége

🚀 Négy űrhajós, Reid Wiseman, Victor Glover, Jeremy Hansen és Christina Koch vágott neki a NASA Artemis II küldetésének, amely új fejezetet nyit az emberes űrutazás történetében...

MA 11:13

Az elfeledett dán zseni és a Föld belsejének titkai

🚀 Kezdetben kevesen ismerték Inge Lehmann nevét Dánián kívül, pedig épp neki köszönhetjük a Föld belső szerkezetéről alkotott új képünket...

MA 11:02

Az MI nem veszi el a legtöbb állást – vagy túl jelentéktelen?

🤔 A mesterséges általános intelligencia (AGI) kapcsán legtöbben attól tartanak, hogy a robotok minden munkát elvesznek tőlünk, és csak a legkreatívabb, legemberibb munkakörök maradnak meg...

MA 10:50

Az MI-vel tényleg bárkiből lehet játékfejlesztő?

🧠 Egy új MI-s startup, a Tesana szerint hamarosan akár 100 millió ember saját videojátékot készíthet néhány mondat begépelésével...

MA 10:42

Az MI-roham élén: a Microsoft 3700 milliárdot önt Japánba

Tízmilliárd dolláros, vagyis mintegy 3700 milliárd forintos gigaberuházást jelentett be a Microsoft Japánban, amellyel jelentősen bővíti a helyi MI-infrastruktúrát és felhőszolgáltatásokat...

MA 10:36

Az egyetlen szuri mindent visz? Jön a szupervakcina-korszak.

A járványok szinte mindig meglepetésszerűen robbannak be, ilyenkor derül ki igazán, mennyire számítanak a védőoltások...

MA 10:30

A Nyugatot már térdre kényszeríti az aszály – a nyár még előttünk

Az USA nyugati részén szó szerint elfogyott a víz, miközben még csak a tavasz közepén járunk...

MA 10:21

Az olasz bíróság lecsapott: a Netflixnek vissza kell fizetnie árdrágításért.

Évek óta húzza le a Netflix az olasz nézőket, most viszont nagyot koppant: a római bíróság úgy döntött, hogy a korábbi, jogtalan áremeléseket vissza kell fizetnie az előfizetőknek...

MA 10:08

Az őskori vietnámi gyerekfogak őrzik a szifilisz titkos eredetét?

👀 Több ezer éves vietnámi leletek alapjaiban rengethetik meg, amit a szifilisz eredetéről gondoltunk...

MA 10:01

A kiégés arcai: más a vezetőé, más a pályakezdőé

Hajlamosak vagyunk azt hinni, hogy a kiégés csak annyi, mint a túlóra, a túl kevés határhúzás vagy a legendás „maradj erős”...

MA 09:50

Az adataid veszélyben? Új Zendesk-botrány a Hims and Hers-nél

📝 Érdemes megvizsgálni, mit jelent egyre több online egészségügyi vállalat számára az adatbiztonság: már néhány nap is elegendő volt ahhoz, hogy ismeretlen hackerek a Hims & Hers Health ügyfélszolgálati rendszeréből több millió támogatási jegyet ellopjanak...

MA 09:36

A Netflix MI-vel írja át a filmek befejezését

Mi történik, ha a rendező egy autós ütközésre épülő finálé forgatása után rájön, mégis életben hagyná a főszereplőt?..

MA 09:29

A Microsoft új MI-varázslója: átverés vagy áttörés?

🤔 A Microsoft Copilot nevű mesterséges intelligenciáját óriási marketingkampány kíséri, a cég pedig lelkesen mutatja be, hogyan segíthet a szoftver üzleti stratégiaalkotásban, a munkahelyi hatékonyság növelésében, kreatív feladatokban és még sok minden másban...

MA 09:22

A pici Dell asztali gép száz wattból turbózza az MI-t

🚀 A Dell legújabb miniszámítógépe, a Pro 5 Micro, teljes értékű asztali teljesítményt hoz miniméretben: elég kicsi ahhoz, hogy elférjen egy monitor mögött, miközben nem kell kompromisszumot kötni a számítási kapacitásban...

MA 09:15

Kilenc perc, és viszik a bitcoinodat az új kvantumszámítógépek?

Erre utal többek között az, hogy a Google Quantum AI csapata szerint egy jövőbeli kvantumszámítógép mindössze kilenc perc alatt képes lenne egy bitcoin nyilvános kulcsából kinyerni a privát kulcsot...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 4/4

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     VSep (iPhone/iPad)A VSep egy innovatív alkalmazás, amely mesterséges intelligenciával választja szét az éneksávot és a zenét, miközben a felhasználó adatainak védelmét szem előtt tartja, hiszen minden művelet a készüléken belül történik...

MA 09:07

Az Apple végre kedvez az iOS 18-hoz ragaszkodóknak

Az Apple újabb biztonsági frissítést adott ki azok számára, akik eddig nem akarták vagy nem tudták telepíteni az iOS 26-ot, és még mindig a régebbi iOS 18 rendszert használják...

MA 09:01

Az indiánok ősi dobókockái meglepő titkot rejtenek

🎲 Az amerikai kontinens első lakói már az utolsó jégkorszak idején is ügyesen használtak dobókockához hasonló eszközöket különféle játékokban, amelyekkel a véletlen események eredményeit emelték be mindennapi szórakozásukba...

MA 08:57

Az első ember titka: valóban ember volt a Homo habilis?

Az emberi evolúció egyik legnagyobb talánya, hogy mikor és hogyan alakult ki a Homo nemzetség...

MA 08:50

Az FAA új drónszabálya tényleg megtiltja a határőrök filmezését?

👷 Évek óta ideiglenesnek mondott tiltás sújtja az amerikai drónpilótákat, akik a Bevándorlási és Vámhivatal (ICE) vagy a Határőrség (CBP) járművei közelében szeretnének felvételeket készíteni...

MA 08:43

Az Artemis II: lélegzetelállító Föld-panoráma, plüsshold és 4,2 milliárdos vécédráma

🚀 Három napja lebeg az Orion a semmiben, de a legénység már most olyan videókat küldött a Földnek, amit csak irigyelni lehet...

MA 08:36

Az év üstököse: a MAPS berobbanhat – vagy eltűnhet az égről

A jövő hét végén látványos égi jelenségre készülhetünk: a C/2026 A1 (MAPS) jelű üstökös extrém közel halad el a Nap felszínéhez...

MA 08:29

Az MI életre kelti a könyveket: rajzfilmsorozat a HarperCollinsnál

📖 A HarperCollins kiadó most az MI segítségével szeretné megeleveníteni népszerű könyveit, ezért partnerre talált a Toonstar stúdióban, amely mesterségesintelligencia-vezérelt animációkkal foglalkozik...

MA 08:21

Az NHS dolgozói fellázadnak a Palantir szoftvere ellen

😡 Az angliai NHS bevezette a Palantir által fejlesztett új egészségügyi adatplatformot, amelynek célja a betegellátás javítása és a várólisták csökkentése...

MA 07:49

Az Artemis II kísérlete örökre átírhatja az űrorvoslást

🚀 Érdemes megvizsgálni, miként járul hozzá a NASA Artemis II holdmissziója az űrutazások jövőjéhez, nemcsak a hosszú távú küldetések tervezésekor, hanem az űrorvostan fejlődéséhez is...

MA 07:42

Az űrbankároknak Elon Musk megmutatta, ki a főnök

🚀 Elon Musk újabb húzása minden képzeletet felülmúl: aki a SpaceX tőzsdei bevezetésében (IPO) szeretne részt venni, annak kötelező előfizetnie a Grokra – igen, arra a mesterséges intelligenciára, amelyet már most szuperalkalmazásként tolnak a nagyvilágba...

MA 07:36

Az Artemis II űrhajósai üstököst pillanthatnak meg – ha túléli a Nap közelségét

Felmerül a kérdés, hogy a NASA legújabb Artemis II-küldetésén részt vevő űrhajósai egy újabb rendkívüli látványosság részesei lehetnek-e: akár egy üstököst is megpillanthatnak az Orion-kapszula ablakából, ha a C/2026 A1 (MAPS) nevű üstökösjelölt túléli a forró találkozását a Nappal...