A Wikidata új adatbázisa átalakítja a mesterséges intelligencia világát

A Wikidata új adatbázisa átalakítja a mesterséges intelligencia világát
A Wikidata, a Wikipédia testvérprojektje, jelentős újítással rukkolt elő: olyan adatbázist fejlesztettek, amely jelentősen megkönnyíti, hogy mind a felhasználók, mind az MI-fejlesztők hozzáférjenek, és hatékonyabban keressenek hatalmas adattáraikban. A kezdeményezést a németországi Wikimedia Deutschland vezette, ahol egy éven át dolgoztak azon, hogy a Wikidata 19 millió bejegyzését a hagyományos, kissé nehézkes formátumból úgynevezett vektorokká alakítsák át. Ezek a vektorok a szövegek és fogalmak közötti kapcsolatokat jelenítik meg – például a híres szerző, Douglas Adams nevéhez nemcsak a művei, hanem az „ember” fogalom is kapcsolódik ily módon.

Egységesített adatáramlás a fejlesztőknek

Fontos, hogy a Wikidata felhasználói felülete változatlan marad; továbbra sem lesz a Wikipédia például chatbot. Ennek ellenére a háttér-infrastruktúra teljesen átalakul: az új adatbázisnak köszönhetően az MI-fejlesztők könnyebben hozzáférhetnek majd az információkhoz saját fejlesztéseikhez, például chatbotokhoz. Jina AI MI-modelljével vektorokká alakították az adatokat, az IBM leányvállalata, a DataStax pedig térítésmentesen biztosítja a vektoralapú adatbázis tárolását is. A tervezet fő célja, hogy a kisebb technológiai szereplők is ugyanolyan könnyedén tudják hasznosítani ezeket az adatkincseket, mint a nagyvállalatok, például az OpenAI vagy az Anthropic.

Befolyás a szélesebb MI-fejlesztési közösségre

Így tehát a Wikidata újítása nemcsak a pénzben bővelkedő nagy techcégeknek, hanem a kisebb fejlesztői közösségeknek is kulcsfontosságú. Fontos szempont, hogy az MI-chatbotok eddig főként a leggyakoribb internetes témákra és szavakra koncentráltak, ezért a szűkebb, speciális ismeretek háttérbe szorultak. Mostantól azonban sokkal könnyebb lesz akár kevéssé ismert, hiánypótló adatokhoz is hozzáférni, amelyek eddig nem kaptak kellő figyelmet. Példaként említhető egy kereshető közadatokat kínáló platform, ahol nemzetközi hivatalos személyek közösségi média elérhetőségei is megtalálhatók.

Frissítés és jövőbeli kilátások

Egyelőre azonban az új, vektorizált adatbázis csak a 2024. szeptember 18-ig rögzített adatokat tartalmazza, a további frissítések előtt visszajelzéseket várnak a fejlesztőktől. Az adatbázis ereje abban rejlik, hogy nem az egyes apró szerkesztéseken, hanem az általános összefüggéseken és jelentéseken van a hangsúly, így a kisebb módosítások nem rontják az adathasználat élményét. Az új formátum segít abban, hogy az MI-rendszerek ne csak információkat, hanem azok teljes kontextusát is megértsék.

2025, adminboss, www.theverge.com alapján

  • Te mit gondolsz arról, hogy nagy technológiai cégek és kisebb fejlesztők egyenlőbben férnek hozzá ezekhez az adatokhoz?
  • Te etikusnak tartod, ha bármilyen fejlesztő szinte minden információt könnyen elérhet egy ilyen adatbázisból?
  • Ha te döntenéd el, megváltoztatnád valamennyire, ki és milyen módon használhatja ezeket az adatokat?



Legfrissebb posztok

Az androidos kémprogramok Signalnak vagy ToToknak adják ki magukat
MA 09:55

Az androidos kémprogramok Signalnak vagy ToToknak adják ki magukat

🔐 Két új támadás: ProSpy és ToSpy akcióban Két veszélyes kémprogram-kampány indult el, amelyek androidos felhasználók adatainak ellopására specializálódtak. Ezek közül a ProSpy és ToSpy álfrissítésekkel, illetve bővítményekkel csapják...

Jane Goodall öröksége, az ember, aki átírta a tudomány szabályait
MA 09:37

Jane Goodall öröksége, az ember, aki átírta a tudomány szabályait

🐒 Jane Goodall, a világhírű brit főemlőskutató és természetvédő idén, 91 éves korában, Kaliforniában hunyt el. Goodall neve összeforrt a tanzániai Gombe Nemzeti Park csimpánzaival végzett forradalmi kutatásaival, amelyek...

MA 09:27

Az autizmus nem vezethető vissza egyetlen okra

Egy több mint 45 000 – Európában és az Egyesült Államokban élő – autista ember genetikai adatain alapuló nemzetközi kutatás szerint az autizmus valójában többféle állapot gyűjtőneve, és...

Most még nagyobb veszélyben a tudomány az amerikai kormány leállása miatt
MA 09:20

Most még nagyobb veszélyben a tudomány az amerikai kormány leállása miatt

📌 Október elsején, hajnali 6:01-kor az USA kormánya gyakorlatilag megbénult, miután a kongresszus nem tudott megegyezni a további működéshez szükséges költségvetésről. A jelenlegi helyzet súlyosabb, mint korábban: Trump elnök...

APPok, Amik Ingyenesek MA, 10/3
APP
MA 09:12

APPok, Amik Ingyenesek MA, 10/3

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Sketch Tree Pro – My Art Pad (iPhone/iPad)A Sketch Tree egy mobil rajzolóalkalmazás, amelyet kreatív szakemberek...

Újra nőnek a Tesla-eladások, tartós lesz ez a lendület?
MA 09:10

Újra nőnek a Tesla-eladások, tartós lesz ez a lendület?

🚗 Elon Musk végre örülhet: a Tesla autóeladásai az elmúlt három hónapban 7%-kal emelkedtek, miután hosszú időn át visszaeséssel kellett szembenézniük a bojkottok miatt. Az eladási hullám azonban nem...

A DrayTek routerek sem úszták meg: komoly távoli sérülékenység
MA 09:01

A DrayTek routerek sem úszták meg: komoly távoli sérülékenység

A DrayTek több Vigor routermodelljében kritikus biztonsági hibát fedeztek fel, amely lehetővé teszi, hogy távoli, jogosulatlan támadók tetszőleges kódot futtassanak az eszközön. A CVE-2025-10547 azonosítójú hibát egy kutató...

Az MI sebezhetőségek aranykora: milliárdok hibavadászoknak
MA 08:55

Az MI sebezhetőségek aranykora: milliárdok hibavadászoknak

Az elmúlt egy évben világszerte 29 milliárd forintnyi (81 millió USD) jutalmat fizetett ki a HackerOne platform a hibákat felfedező etikus hackereknek. Több mint 1950 hibavadász programot kezelnek,...

Az MI-zenekarok kora: valódi pénz, emberi jogok
MA 08:46

Az MI-zenekarok kora: valódi pénz, emberi jogok

Az Aiode bemutatta asztali MI-alapú zenei platformját, amelyet zenészek és producerek igényeire szabtak. Az új szoftver célja, hogy ne csupán általános zenei kiegészítéseket kínáljon, hanem valódi zenészek stílusára...