2025. 04. 03., 14:01

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához

Az OpenAI jogszabályokon felülemelkedve használja az O’Reilly könyveket az MI tanításához
Tim O’Reilly, a neves tech könyvkiadó vezetője azt állítja, hogy az OpenAI engedély nélkül használta fel a kiadó szerzői jogvédelem alatt álló könyveit a legújabb GPT-4o modell betanításához. Mindez annak ellenére történt, hogy a cég már több szerzői jogi per alanya hasonló tevékenységek miatt, bár az OpenAI tagadja a jogsértést.

Rejtett módszerekkel a nyomok után

O’Reilly a “Nem nyilvános adatok szerepe az LLM-ek előképzésében” (Beyond Public Access in LLM Pre-Training Data) című tanulmány társszerzőjeként vizsgálta meg, hogy a GPT-4o felhasznált-e 34 szerzői jogvédelem alatt álló O’Reilly Media könyvet. A kutatók úgynevezett DE-COP teszteket végeztek: feleletválasztós kérdéseket tettek fel, amelyek során a modellnek négy opció közül kellett kiválasztania, melyik szövegrészlet származik eredeti O’Reilly könyvből. Ha a modell helyesen azonosította az eredeti szövegeket, az erősen arra utalt, hogy ezeken a szövegeken tanult.

A tesztek alapján a GPT-4o 82%-os pontossággal ismerte fel az eredeti szövegrészleteket, ami egyértelműen arra utal, hogy valószínűleg a kiadó anyagain képezték ki. A kutatók szerint az OpenAI a hírhedt LibGen adatbázist használhatta, amely mind a 34 tesztelt könyvet tartalmazza – ugyanazt az adatbázist, amelyet korábban a Meta is alkalmazott a Llama modellek betanításához.

 

Érdekes módon a 2022-es GPT-3.5 modell csak alig 50% feletti eredményt ért el, ami arra enged következtetni, hogy “a nem nyilvános adatok szerepe az OpenAI modelljeinek előképzésében jelentősen megnőtt az idők során”. Ugyanakkor a kisebb GPT-4o Mini modell, amely 2024-ben jelent meg, nem tűnik úgy, mintha O’Reilly könyvek alapján tanult volna, vélhetően kisebb paraméterkészlete miatt.

A jogsértő gyakorlat veszélyei

A kutatók figyelmeztetnek: a szerzők megfelelő kompenzálásának hiánya “az egész internet lezülléséhez” vezethet. “Ha az MI-cégek értéket vonnak ki a tartalomkészítők által előállított anyagokból anélkül, hogy méltányosan kompenzálnák az alkotókat, azzal éppen azokat az erőforrásokat merítik ki, amelyektől MI-rendszereik függenek,” érvelnek.

 

Az MI-óriások láthatóan tisztában vannak azzal, hogy nem támaszkodhatnak csak az internetes adatgyűjtésre, ezért licencszerződéseket kötnek kiadókkal és közösségi hálózatokkal. Az OpenAI tavaly szerződést kötött a Reddittel és a Time magazinnal is archívumaik felhasználására. Ugyanakkor a cég nemrég arra kérte az amerikai kormányt, hogy lazítson a szerzői jogi korlátozásokon, azzal érvelve, hogy a merev szabályok elnyomják az innovációt és a befektetéseket.

 

Miközben az MI-modellek készítői a korlátlan hozzáférésért harcolnak, mások akadályokat állítanak a szerzői jogok védelmében. A Cloudflare nemrég bemutatta AI Labyrinth nevű bot-ellenes MI-jét, amely a robots.txt utasításokat figyelmen kívül hagyó adatgyűjtőket egy hamis oldalakból álló labirintusba csalja, pazarolva idejüket és számítási erőforrásaikat.

 

Az éppen 40 milliárd dolláros finanszírozást szerző OpenAI egyelőre nem reagált a megkeresésekre.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

MA 13:45

Az önellátó okostextilek forradalma: vége az okosórák korának?

A hordható kütyük piacán új korszak küszöbén állunk, ahol az egészségfigyelő eszközök már nemcsak a csuklónk díszei, hanem szó szerint a bőrünkhöz nőnek...

MA 13:34

A Huawei Watch GT Runner 2 új etalon a futóórák között

🕑 A Huawei Watch GT Runner 2 kifejezetten a futás szerelmeseinek készült, és lenyűgöző pontossággal, villámgyors működéssel segít követni az eredményeket – egyetlen komoly hátulütője, hogy a megszokott, korlátozott Huawei-ökoszisztémára épül...

MA 13:12

Az Apple-vezér visszavonul – az év techbombája!

💥 Ilyen eset például, amikor egy virtuális asszisztens tervez meg egy gamer PC-t, vagy amikor kiderül, hogy egy robot jobban fut félmaratont, mint bármelyik ember...

MA 13:01

Az égbolt titkos koreográfiája: miért változnak a csillagképek?

Érdemes megvizsgálni, miért tűnnek fel és tűnnek el különböző csillagképek az év folyamán az éjszakai égbolton...

MA 12:56

Az Android-csúcsmodellek ára történelmi mélyponton – itt az idő váltani?

💸 Érdemes megvizsgálni, mikor jár a legjobban az ember egy új Android-készülék vásárlásával...

MA 12:45

Az USA zárol 125 milliárd forintnyi kriptót Irán miatt

Az amerikai pénzügyminisztérium legutóbbi lépése során 344 millió dollárnyi, vagyis csaknem 125 milliárd forintnyi Tether (USDT) került befagyasztásra, amellyel Irán pénzügyi hálózatait próbálják ellehetetleníteni...

MA 12:23

Az angyalarcú fiú: anya vak hite a vérfürdő után

😇 A 2022-es brutális idahói gyilkosságok után a hatóságok letartóztatták Bryan Kohbergert, mégis édesanyja, Maryann Kohberger csökönyösen állította az FBI ügynökeinek, hogy a fia ártatlan, sőt, „angyal”...

MA 10:57

A Ketrec: brutális drámában fagy ránk a mosoly

🔥 Sheridan Smith és Michael Socha új sorozata április 26-ától látható a BBC iPlayeren, ahol a hatrészes A Ketrec (The Cage) minden eddiginél sötétebb oldaláról mutatja meg a bűn világát...

MA 10:50

Az AromaFresh Therm Pro: áttörés vagy drága tévedés?

A kávékedvelők szívét villámgyorsan megdobogtatja egy olyan otthoni gép, amely frissen őrli a babot, ráadásul időzítővel gondoskodik a reggeli forró italról...

MA 10:43

A szürke irodai doboz leleplezve: hogyan működik a lézernyomtató?

A legtöbben csak akkor figyelnek fel a sarokban álló lézernyomtatóra, ha az éppen nem működik, pedig igazán lenyűgöző technológia rejtőzik a műanyag burkolat mögött...

MA 10:36

A sportfanatikusok trükkje: így nézd a TSN-t külföldről

Kanadában szinte minden jelentős sportesemény élőben vagy visszanézhető formában elérhető a TSN streamingjén...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 4/25

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     English Vocab & Dictionaries + (iPhone/iPad)A Simply Paste Wordbook M Pro angol szókincsfejlesztő alkalmazás kifejezetten angolt tanulók számára készült...

MA 09:08

Az észcsavaró NYT Connections: ráérzel a logikára?

Érdemes tudni, hogy a New York Times Connections nevű játéka minden nap újabb fejtörőt kínál azoknak, akik szeretik a szójátékokat és a logikai kihívásokat...

MA 09:01

A Fehér Lótusz 4. évada: Helena Bonham Carter váratlan távozása vihart kavar

🍆 Éppen csak elindult a Fehér Lótusz (The White Lotus) negyedik évadának forgatása Franciaországban, máris jött egy drámai fordulat: Helena Bonham Carter váratlanul búcsút intett a sorozatnak, ráadásul napokkal a felvételek kezdete után...

MA 08:57

A mai Quordle: trükkös megfejtések és nyerő tippek

Különösen igaz ez akkor, ha az ember szeret reggelente egy gyors agytornával indítani a napot, és a Quordle, a Wordle egyik legnépszerűbb alternatívája, hétről hétre próbára teszi a szókirakók hadát...

MA 08:49

Az XRP árfolyama kitörés előtt – Közeleg a nagy döntés?

Az XRP árfolyama napok óta 1,43–1,45 dollár (kb. 522–528 Ft) között mozog szűk sávban, miután a korábbi élénk forgalom gyors oldalazásba fordult...

MA 08:43

A robotcowboyok elszabadultak: megérkezett a Far Far West

A Far Far West fejlesztőcsapata, a francia Evil Raptor az utóbbi időszak egyik legnagyobb meglepetését okozta a Steam Next Festen...

MA 08:29

Az atomerőmű, amely majdnem véget vetett a világnak

1986. április 26-án a Csernobili Atomerőmű reaktora végzetes hibasorozat eredményeként részlegesen leolvadt...

MA 08:01

Megmentheti az emberiséget egy óriásgát Alaszka és Oroszország között?

🌊 A szerteágazó tengeráramlatok az Atlanti-óceán északi féltekén döntő szerepet töltenek be a klímánk szabályozásában, az élet fenntartásában és az élelmiszer-termelésben...

MA 07:57

Az olcsó Samsung Galaxy A57 letarolja a mezőnyt?

A Samsung Galaxy A57 bemutatkozása a megfizethető Android telefonok piacán igazi meglepetést okozott, és külsőre simán felveszi a versenyt a csúcskategóriás készülékekkel is...

MA 07:50

Az Assassin’s Creed Black Flag Resynced mindent átír – íme az újdonságok

A legendás tengeri kaland visszatér Július 9-én végre visszatérhetünk minden idők egyik legkedveltebb Assassin’s Creed-epizódjához: a Black Flag újjászületett változatával...

MA 07:29

Az amerikai jóslópiacok háborúja: New York is beszállt

Az Egyesült Államok szövetségi hatósága, a Commodity Futures Trading Commission (CFTC) új szintre emelte a jóslópiaci platformok körüli jogvitát...

MA 07:22

Az év visszatérője: szárnyal a Bitcoin, a Tether önti bele a pénzt

A Bitcoin áprilisban új lendületet vett: árfolyama tartósan 77 000 dollár (kb...

MA 07:15

A 2026-os londoni maraton: futóünnep, világsztárok a rajtnál!

A hagyományos londoni maraton idén is a hosszútávfutás igazi ünnepévé válik: 2026-ban több mint 59 000 résztvevő rajtol Greenwichből, hogy 42,195 km-t (26,2 mérföld) tegyen meg a belvároson keresztül, a híres Cutty Sark mellett egészen a The Mallig...

MA 07:08

A Final Fantasy XIV találkozik az Evangelionnal – az év meglepetése

Fontos kérdés, hogy miként lehet egy olyan szürreális, kultikus animéhez, mint az Evangelion (Neon Genesis Evangelion), társítani a világszerte népszerű Final Fantasy XIV-et, mégis ez történik hamarosan...

MA 07:01

Az új Michael-film botrányt kavar: megszólalnak az áldozatok

Nem mindennapi hullámokat kelt Hollywoodban a most mozikba került életrajzi film Michael Jacksonról...

MA 06:43

Az új Resident Evil őrület: 7 millió fogyott két hónap alatt

🔥 Leon S. Kennedy népszerűsége új szintre lépett, ugyanis a Resident Evil Requiem két hónap alatt több mint 7 millió példányban kelt el...

MA 06:36

Az MI áttörte a védelmet: tízezernyi Palo Alto-eszköz veszélyben

⚠️ Egy sikeres kibertámadás során több mint 13 000 Palo Alto-eszköz került a támadók kezébe, akik távoli adminisztrátori, majd rootjogokat szereztek jelszó nélkül...

MA 06:29

Az álriporterek és az MI-hírportál: így irányítják a közvéleményt

🔎 Különösen igaz ez akkor, ha újságcikkeket olvasol egy olyan, magát függetlennek beállító hírportálon, amelynek újságírói és szerkesztősége gyakorlatilag nem létezik...