2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

szombat 21:56

A jövő nyakörve: így változtatja meg a kedvencek gondozását

Az új, Ausztriában és Seattle-ben fejlesztett okos nyakörveknek köszönhetően sosem volt ilyen egyszerű odafigyelni kutyánk vagy macskánk egészségére – akkor is, ha nem tudnak szólni, mi bántja őket...

szombat 21:46

A nagy középkategóriás párbaj: iPhone 17e vs OnePlus 15R

Az iPhone 17e igazi közönségkedvenc lett, ami nem is csoda: végre egy olyan középkategóriás Apple-mobil, ami miatt nem érzi magát senki másodosztályúnak...

szombat 21:12

Az egyik legnépszerűbb JavaScript-könyvtár kritikus hibája veszélybe sodorja a szervereket

🚨 A Google Protocol Buffers JavaScript-implementációja, a protobuf.js komoly biztonsági rést tartalmaz, amelyen keresztül támadók távoli kódvégrehajtást érhetnek el...

szombat 21:02

Az új Pixel-varázs árnyoldala: miért csúszik a frissítési ígéret?

💬 Nem hagyható figyelmen kívül, hogy a kezdetekben az egyik legnagyobb érv a Pixel telefonok mellett az volt, hogy a készülékek hosszú távon megkapták a legújabb funkciókat...

szombat 20:56

A mosogatószivacs észrevétlenül milliárdnyi mikroműanyagot enged a vízbe

Ilyen eset például az, amikor egy hétköznapi mosogatás során a varázsszivacsként ismert melaminszivacsokat használod...

szombat 20:47

A teljes Google Photos-élményhez ezek a funkciók kellenek

Egy lényeges szempont, hogy a Google Photos évről évre egyre népszerűbb, köszönhetően a felhasználóbarát kezelésnek és a felhőalapú tárolás kényelmének...

szombat 20:35

Az MI-pánik az egyetemekre tereli a fiatalokat

Erre utal többek között az, hogy az elmúlt időszakban meredeken nőtt a továbbtanulási szándék a fiatal felnőttek körében, még olyan gazdasági környezetben is, ahol folyamatosan bővül a munkaerőpiac...

szombat 20:24

Az Exynos visszatérése: Megérte a Samsungnak az AMD-vel szövetkezni?

⚡ A Samsung évek óta küzdelmes utat járt be az Exynos lapkakészleteinek fejlesztésével...

szombat 20:12

A koffein turbózza a hangyák agyát, átírhatja az irtást

🐛 Felmerül a kérdés, hogy mennyi meglepetést tartogat még a természet, amikor akár a hétköznapi koffein is képes megváltoztatni egy egész hangyakolónia működését...

szombat 19:56

Az első mérések szerint tízezer Nap erejével tombolnak a fekete lyukak sugárnyalábjai

A friss kutatási eredmények alaposan felborították az eddigi elképzeléseket arról, mire képesek a fekete lyukakból kiáradó jetsugarak...

szombat 19:46

A hasnyálmirigyrák új reménye: az elraglusib áttörést hozhat

💫 A hasnyálmirigyrák az egyik legnehezebben kezelhető daganatos betegség, többek között azért, mert a korai stádiumban ritkán ismerik fel...

szombat 19:37

Az El Greco-rejtély: Meglepő válaszokkal állt elő a mesterséges intelligencia

💡 Érdemes megvizsgálni, valóban megoldotta-e az MI El Greco egyik legrejtélyesebb festményének titkát...

szombat 19:24

Az MI végre pénzt hoz? Így kaszál vele a Salesforce

💰 Az elmúlt évben a cégek többsége abban reménykedett, hogy az MI nemcsak hatékonyabbá teszi folyamataikat, de jelentős megtakarítást is hoz...

szombat 19:12

Az ősi körtemplom rejtélye: vízrituálék nyomában Egyiptomban

🛹 Ez a jelenség jól illusztrálható azzal, hogy a régészek egy ritka, tökéletesen kör alakú szentélyre bukkantak, amelyet a helyi istenség tiszteletére emeltek mintegy 2 200 évvel ezelőtt...

szombat 19:01

Az angolszász testvérpár tragédiája: végre fény derült egy 1400 éves titokra

🔍 Egy különleges, kettős angolszász temetkezés feltárása során derült ki, hogy 1400 évvel ezelőtt egy tizenéves lány és hét-nyolc éves öccse együtt talált örök nyugalomra egy közös sírban a délnyugat-angliai Cherington mellett...

szombat 18:57

Az álruhás zsarolóvírusok új fegyvere: a QEMU

🛡 A Payouts King nevű zsarolóvírus egyre kifinomultabb módszerrel támadja a vállalati rendszereket: a támadók a nyílt forráskódú QEMU emulátort használják arra, hogy rejtett virtuális gépeket futtassanak a megfertőzött számítógépeken...

szombat 18:45

Itt a Cloudflare Agent Memory: az MI többé nem felejt

🛠 A korszerű MI-modellek egyik láthatatlan akadálya, hogy véges az a mennyiségű adat, amelyet egyszerre képesek figyelembe venni...

szombat 18:35

Az ember evolúciója gyorsul, közben híznak a jegesmedvék

🐻 Ezen a héten a tudomány olyan megfigyelésekkel jelentkezett, amelyek a legmerészebb elképzeléseinket is felülmúlják...

szombat 18:23

Az óriás drón, amely 120 kilométeren át pilóta nélkül szállított friss teát

Hihetetlen, de igaz, hogy egy kínai fejlesztésű, kéttonnás, pilóta nélküli drón idén tavasszal sikeresen szállított frissen szedett tealeveleket Guizhou hegyvidékén át...

szombat 14:03

Tényleg élt a legendás Artúr király?

🤴 Arthur király történetei mindenki számára ismerősek: a Kerekasztal lovagjai, titokzatos küldetések és lenyűgöző csaták...

szombat 13:47

Az MI-ügynökök forradalmasítják Kína kereskedelmét

Kezdetben a digitális vásárlás személyes választásokra és emberi döntésekre épült. Napjainkban azonban Kína online piacain egyre inkább átadják a feladatokat önállóan működő MI-ügynököknek, amelyek nemcsak ajánlatokat tesznek, hanem teljes tranzakciókat bonyolítanak le a felhasználók helyett – gyakorta úgy, hogy ők maguk már a kijelzőt sem érintik...

szombat 13:35

Mit kapsz 9 millió forint alatt az elektromos autók használtpiacán?

Néhány éve még elképzelhetetlen lett volna, hogy 9 millió forintból (kb...

szombat 13:03

Az MI-tanító botokat mostantól tényleg te irányítod

Tipikus eset, amikor egy fejlesztői platform rosszul dokumentált, elavult információkat tartalmaz, és ezek az adatok rendre bekerülnek a mesterséges intelligenciát betanító rendszerek tudástárába is...

szombat 12:57

Az okos alakzatok végre tökéletesre csiszolhatják a Kindle Scribe-ot

Sokan várták már azt a fejlesztést, amely a Kindle Scribe készüléket a digitális jegyzetelők élvonalába repítheti: mostantól lehetőség van okos alakzatok használatára, amelyek azonnal szép, szabályos formát adnak a vázlatoknak...

szombat 12:46

Az iPhone 17 véget vet a középkategóriás Androidoknak?

📱 A jelenlegi gazdasági helyzetben az emberek egyre inkább az „elég jó” elv mentén döntenek, amikor okostelefont választanak...

szombat 12:34

A dalosmadarak veszedelmes titka: így írják át az agyunkat

Az emberi test folyamatosan megújul: a vörösvértestek négyhavonta, a bőr és a bél nyálkahártyájának sejtjei néhány nap vagy hét alatt teljesen kicserélődnek...

szombat 12:24

A valódi veszély: kilenc perc alatt lenyúlhatják a bitcoinodat?

🔒 A bitcoin védelmi rendszere eddig megoldhatatlannak tűnő matematikai rejtvényeken alapul, de a kvantumszámítógépek megjelenése mindent átírhat...

szombat 11:57

Az ötven felettiek titkos fegyvere lehet a kitörés

💪 Érdemes megérteni, hogy a modern fitneszipar által kínált bonyolult gépek, hosszú futópados edzések vagy trendi kondibérletek nem feltétlenül kínálják a legjobb megoldást annak, aki erős és egészséges szeretne maradni ötvenéves kor felett...

szombat 11:46

A kerékpáros biztonság nagy áttörése: apró, mégis zseniális kütyü

🚲 Például amikor egy komoly bringás baleset után újragondolod, hogyan navigálsz a városban biciklivel, hamar rájössz, hogy a kormányra szerelt okostelefon nem a legbölcsebb választás...