A Wikidata új adatbázisa átalakítja a mesterséges intelligencia világát

A Wikidata új adatbázisa átalakítja a mesterséges intelligencia világát
A Wikidata, a Wikipédia testvérprojektje, jelentős újítással rukkolt elő: olyan adatbázist fejlesztettek, amely jelentősen megkönnyíti, hogy mind a felhasználók, mind az MI-fejlesztők hozzáférjenek, és hatékonyabban keressenek hatalmas adattáraikban. A kezdeményezést a németországi Wikimedia Deutschland vezette, ahol egy éven át dolgoztak azon, hogy a Wikidata 19 millió bejegyzését a hagyományos, kissé nehézkes formátumból úgynevezett vektorokká alakítsák át. Ezek a vektorok a szövegek és fogalmak közötti kapcsolatokat jelenítik meg – például a híres szerző, Douglas Adams nevéhez nemcsak a művei, hanem az „ember” fogalom is kapcsolódik ily módon.

Egységesített adatáramlás a fejlesztőknek

Fontos, hogy a Wikidata felhasználói felülete változatlan marad; továbbra sem lesz a Wikipédia például chatbot. Ennek ellenére a háttér-infrastruktúra teljesen átalakul: az új adatbázisnak köszönhetően az MI-fejlesztők könnyebben hozzáférhetnek majd az információkhoz saját fejlesztéseikhez, például chatbotokhoz. Jina AI MI-modelljével vektorokká alakították az adatokat, az IBM leányvállalata, a DataStax pedig térítésmentesen biztosítja a vektoralapú adatbázis tárolását is. A tervezet fő célja, hogy a kisebb technológiai szereplők is ugyanolyan könnyedén tudják hasznosítani ezeket az adatkincseket, mint a nagyvállalatok, például az OpenAI vagy az Anthropic.

Befolyás a szélesebb MI-fejlesztési közösségre

Így tehát a Wikidata újítása nemcsak a pénzben bővelkedő nagy techcégeknek, hanem a kisebb fejlesztői közösségeknek is kulcsfontosságú. Fontos szempont, hogy az MI-chatbotok eddig főként a leggyakoribb internetes témákra és szavakra koncentráltak, ezért a szűkebb, speciális ismeretek háttérbe szorultak. Mostantól azonban sokkal könnyebb lesz akár kevéssé ismert, hiánypótló adatokhoz is hozzáférni, amelyek eddig nem kaptak kellő figyelmet. Példaként említhető egy kereshető közadatokat kínáló platform, ahol nemzetközi hivatalos személyek közösségi média elérhetőségei is megtalálhatók.

Frissítés és jövőbeli kilátások

Egyelőre azonban az új, vektorizált adatbázis csak a 2024. szeptember 18-ig rögzített adatokat tartalmazza, a további frissítések előtt visszajelzéseket várnak a fejlesztőktől. Az adatbázis ereje abban rejlik, hogy nem az egyes apró szerkesztéseken, hanem az általános összefüggéseken és jelentéseken van a hangsúly, így a kisebb módosítások nem rontják az adathasználat élményét. Az új formátum segít abban, hogy az MI-rendszerek ne csak információkat, hanem azok teljes kontextusát is megértsék.

2025, adminboss, www.theverge.com alapján

  • Te mit gondolsz arról, hogy nagy technológiai cégek és kisebb fejlesztők egyenlőbben férnek hozzá ezekhez az adatokhoz?
  • Te etikusnak tartod, ha bármilyen fejlesztő szinte minden információt könnyen elérhet egy ilyen adatbázisból?
  • Ha te döntenéd el, megváltoztatnád valamennyire, ki és milyen módon használhatja ezeket az adatokat?


Legfrissebb posztok

MA 11:50

Az MI-alapú játéktutorialok rémálma: a Sony új szintre lép

🤓 A videojátékok tutorialjai régóta okoznak fejfájást a játékosoknak és fejlesztőknek egyaránt...

MA 11:34

Az Alphabet tarolt a Wall Streeten: MI-őrület és pénzeső

💵 Az Alphabet lehengerlő, 65%-os árfolyam-emelkedéssel zárta a 2025-ös évet, amire 2009 óta nem volt példa...

MA 11:17

Az űr pezsgője: elképesztő galaxisütközésre bukkantak

🌌 A Champagne-halmaz névre keresztelt csillagászati jelenség szilveszter éjszakáján történt felfedezése óta ejti ámulatba a szakértőket: két hatalmas galaxishalmaz ütközése mutatkozik meg benne, a képeken pedig szinte pezsgőbuborékszerű foltok formájában láthatók a felforrósodott gázok...

MA 10:57

A januári PS Plusban autóőrület, Mickey‑újrafestés és barlangi túlélés – azonnal töltsd!

Új év, új játékok: 2026 januárjában három izgalmas címmel bővül a PlayStation Plus Essential kínálata...

MA 10:49

A NASA legnagyobb könyvtára lehúzza a rolót – hová kerül a tudás?

A NASA súlyos költségmegszorítások és telephely-összevonások közepette kénytelen bezárni a legnagyobb könyvtárát, így veszélybe kerül tízezernyi történelmi és tudományos dokumentum, amelyek jelentős része még nem digitalizált...

MA 10:43

Az amerikai dollár jövője: összeomlás vagy fordulat 2026-ban?

Az idei év kifejezetten gyengén alakult a dollár számára, hiszen a valuta több mint 9 százalékot veszített értékéből a főbb devizákkal szemben – ilyen rossz évet legutóbb nyolc éve látott...

MA 10:35

Az ütköző spirálgalaxisok még soha nem voltak ilyen lélegzetelállítóak

Lenyűgöző részletességgel sikerült megörökíteni két ütköző spirálgalaxist a NASA James Webb-űrteleszkópja (James Webb Space Telescope, JWST) és a Chandra röntgenobszervatórium (Chandra X-ray Observatory) adatainak egyesítésével...

MA 10:30

Az MI 2026-ban: Már megkerülhetetlen a digitális inas

🤖 Az elmúlt év végleg átalakította az MI helyét: a kezdeti mutatványokból állandó társunk lett a mindennapokban, és az emberek már nem csupán újdonságként tekintenek rá...

MA 10:23

Az új brit dróntörvények 2026-tól mindent fenekestül felforgatnak

Érdemes megérteni, hogy az Egyesült Királyságban jelentősen átalakultak a drónokra vonatkozó szabályok, amelyek 2026...

MA 10:15

Az MI 2026-ra tényleg elveszi a munkánkat?

🤔 Egyre nagyobb a bizonytalanság a munkaerőpiacon az MI rohamos fejlődése miatt...

MA 10:10

Az év, amikor a játékosok álma valóra válik: 2026

2026 már most bombasikerű gamer évnek ígérkezik: seregnyi folytatás, új franchise, nagy visszatérő és izgalmas sztori vár mindenkire...

MA 09:57

Az ősi perui trófeafej rejtélyének kulcsa: egy ritka rendellenesség

Egy mumifikálódott fej vizsgálata új megvilágításba helyezi az andoki társadalmak hozzáállását a születési rendellenességekkel élőkhöz...

MA 09:50

A hiányzó fehérje, amely felgyorsítja immunrendszered idő előtti öregedését

Ahogyan telnek az évek, az ősz hajszálak és a gyengülő izmok mellett az immunrendszerünk is változik...

MA 09:44

Az univerzum mégis kockajáték: Bohr diadalmaskodott Einstein felett

🎲 Egy lényeges szempont, hogy a kínai tudósoknak most először sikerült megvalósítaniuk azt a híres gondolatkísérletet, amellyel Albert Einstein majdnem száz éve próbálta cáfolni Niels Bohr elméletét a kvantummechanikában...

MA 09:36

Az Nvidia H200-ért kitört a vásárlási őrület Kínában

🔥 Az Nvidia H200-as gyorsítókra sosem látott kereslet alakult ki Kínában, miután enyhítettek az amerikai exportkorlátozásokon...

MA 09:30

Az új New York-i polgármester beiktatásán száműzik a techkütyüket

🚫 A 2026-os New York-i polgármesteri beiktatáson, ahol Zohran Mamdani lép hivatalba, szigorú tiltólistát hirdettek, amelyen meglepő módon külön megnevezték a Flipper Zero-t és a Raspberry Pi-t...

MA 09:22

Az Eaton lemaradt az MI‑őrületről – most jön a nagy visszatérés?

🚀 Érdekes, hogy az MI-berobbanás éveiben szerzett lendület ellenére az Eaton részvényárfolyama 2025-ben nem tudta tartani a lépést a többi ipari óriással...

MA 09:16

A fény hajtja az arany nanorészecskéket: tisztább ammónia a végeredmény

💡 A kutatók azt vizsgálják, miként lehetne fenntarthatóbban előállítani az egyik legfontosabb ipari vegyületet, az ammóniát, amely a műtrágyák, tisztítószerek és robbanóanyagok gyártásának is alapja...

MA 09:09

Az Amazon rejtett filmes gyöngyszemei, amikről nem hallottál

🎥 Az Amazon Prime Video kínálata valóságos kincsesbánya azok számára, akik szeretik a mozifilmeket – különösen a 2011 előtti alkotásokat...