A Wikidata új adatbázisa átalakítja a mesterséges intelligencia világát

A Wikidata új adatbázisa átalakítja a mesterséges intelligencia világát
A Wikidata, a Wikipédia testvérprojektje, jelentős újítással rukkolt elő: olyan adatbázist fejlesztettek, amely jelentősen megkönnyíti, hogy mind a felhasználók, mind az MI-fejlesztők hozzáférjenek, és hatékonyabban keressenek hatalmas adattáraikban. A kezdeményezést a németországi Wikimedia Deutschland vezette, ahol egy éven át dolgoztak azon, hogy a Wikidata 19 millió bejegyzését a hagyományos, kissé nehézkes formátumból úgynevezett vektorokká alakítsák át. Ezek a vektorok a szövegek és fogalmak közötti kapcsolatokat jelenítik meg – például a híres szerző, Douglas Adams nevéhez nemcsak a művei, hanem az „ember” fogalom is kapcsolódik ily módon.

Egységesített adatáramlás a fejlesztőknek

Fontos, hogy a Wikidata felhasználói felülete változatlan marad; továbbra sem lesz a Wikipédia például chatbot. Ennek ellenére a háttér-infrastruktúra teljesen átalakul: az új adatbázisnak köszönhetően az MI-fejlesztők könnyebben hozzáférhetnek majd az információkhoz saját fejlesztéseikhez, például chatbotokhoz. Jina AI MI-modelljével vektorokká alakították az adatokat, az IBM leányvállalata, a DataStax pedig térítésmentesen biztosítja a vektoralapú adatbázis tárolását is. A tervezet fő célja, hogy a kisebb technológiai szereplők is ugyanolyan könnyedén tudják hasznosítani ezeket az adatkincseket, mint a nagyvállalatok, például az OpenAI vagy az Anthropic.

Befolyás a szélesebb MI-fejlesztési közösségre

Így tehát a Wikidata újítása nemcsak a pénzben bővelkedő nagy techcégeknek, hanem a kisebb fejlesztői közösségeknek is kulcsfontosságú. Fontos szempont, hogy az MI-chatbotok eddig főként a leggyakoribb internetes témákra és szavakra koncentráltak, ezért a szűkebb, speciális ismeretek háttérbe szorultak. Mostantól azonban sokkal könnyebb lesz akár kevéssé ismert, hiánypótló adatokhoz is hozzáférni, amelyek eddig nem kaptak kellő figyelmet. Példaként említhető egy kereshető közadatokat kínáló platform, ahol nemzetközi hivatalos személyek közösségi média elérhetőségei is megtalálhatók.

Frissítés és jövőbeli kilátások

Egyelőre azonban az új, vektorizált adatbázis csak a 2024. szeptember 18-ig rögzített adatokat tartalmazza, a további frissítések előtt visszajelzéseket várnak a fejlesztőktől. Az adatbázis ereje abban rejlik, hogy nem az egyes apró szerkesztéseken, hanem az általános összefüggéseken és jelentéseken van a hangsúly, így a kisebb módosítások nem rontják az adathasználat élményét. Az új formátum segít abban, hogy az MI-rendszerek ne csak információkat, hanem azok teljes kontextusát is megértsék.

2025, adminboss, www.theverge.com alapján

  • Te mit gondolsz arról, hogy nagy technológiai cégek és kisebb fejlesztők egyenlőbben férnek hozzá ezekhez az adatokhoz?
  • Te etikusnak tartod, ha bármilyen fejlesztő szinte minden információt könnyen elérhet egy ilyen adatbázisból?
  • Ha te döntenéd el, megváltoztatnád valamennyire, ki és milyen módon használhatja ezeket az adatokat?


Legfrissebb posztok

MA 10:58

Az elektronok vadonatúj állapota átírhatja a kvantumtechnológia szabályait

Az elektromosság mindennapjaink hajtóereje: autók, telefonok, számítógépek és szinte minden modern eszköz működésének alapja...

MA 10:41

Az afrikai pingvineket a halászat a kihalás szélére sodorja

🐧 Az afrikai pingvinek (Spheniscus demersus) drámai mértékben kiszorulnak természetes élőhelyeikről, mivel évről évre egyre erősebben versengenek a kereskedelmi halászhajókkal az élelemért...

MA 10:34

A hawaii gömbölyűfejű delfinek megőrülnek a tintahalért

A hawaii vizekben élő rövidszárnyú gömbölyűfejű delfinek (Globicephala macrorhynchus) hatalmas mennyiségű tintahalat fogyasztanak...

MA 10:26

A Princeton új kvantumchipje felforgatja a piacot

A Princeton Egyetem mérnökei háromszor stabilabb szupravezető qubitet alkottak, mint bármely korábbi típus, ezzel jelentősen közelebb hozva a valóban működőképes, megbízható kvantumszámítógépek korszakát...

MA 09:59

Az Intel elkaszálta a zászlóshajó Xeon szerverprocesszorokat

🛠 Megemlíthető továbbá, hogy az adatközponti piac rohamosan változik: az utóbbi hetekben az Intel új vezetés alatt alaposan átvizsgálta szerverprocesszor-útitervét, amely végül komoly irányváltáshoz vezetett...

MA 09:41

Az elektromos autók akkumulátorai áttörés előtt: itt az új korszak

Az LFP (lítium-vas-foszfát) akkumulátorok terjedése új lendületet kapott, miután 2022-ben lejártak a legfontosabb szabadalmak az alapkémiára...

MA 09:34

Az olasz fonalóriás is bedőlt: napvilágra kerültek a sztárdivat titkai

Fulgar, a H&M, az Adidas, a Wolford és a Calzedonia szintetikus fonalbeszállítója kénytelen elismerni, hogy zsarolóvírus-támadás érte, amelyet a hírhedt RansomHouse-csoporthoz kötnek...

MA 09:17

A mikrobák okos koktéljai átírják a növényvédelem szabályait

A Kínai Tudományos Akadémia kutatói áttörő módszert fejlesztettek ki, amellyel mesterségesen összeállított, jótékony mikrobaközösségekkel jelentősen javítható a növények egészsége, és elnyomhatók a talajeredetű betegségek...

MA 09:02

Az Android-appok zabálják az akkut? Érkezik a Google-riasztás!

Az okostelefon-felhasználók örülhetnek: a Google bejelentette, hogy a Play Áruházban hamarosan külön megjelölést kapnak azok az Android-alkalmazások, amelyek túlzott háttértevékenységükkel rengeteg akkumulátort fogyasztanak...

MA 08:25

Az Ozempic-láz ára: amiről eddig nem beszéltünk

💸 Megemlíthető továbbá, hogy a legújabb GLP-1 gyógyszerek, mint az Ozempic, a Wegovy és a Mounjaro nagymértékű fogyást ígérnek, de most olyan rizikók kerültek előtérbe, amelyek eddig kevés figyelmet kaptak...

MA 08:19

Az emberszabásúak észjárása: Tényleg majdnem olyan okosak, mint mi?

🐒 A racionalitást évezredek óta az ember kizárólagos jellemzőjének tartották. Már Arisztotelész is azt állította, hogy az emberek abban különböznek az állatoktól, hogy képesek bizonyítékok alapján átgondolni, sőt felülbírálni saját nézeteiket...

MA 08:08

Az űrszemét tartotta fogva a hazatérő kínai űrhajósokat

Három kínai űrhajós pénteken tért vissza a Földre, miután több mint kilencnapos késéssel hagyhatták el a kínai űrállomást...

MA 07:58

A mesterséges intelligencia zsarolható? Meglepő a válasz

A legfrissebb kutatások azt vizsgálták, mennyire tudnak a legnépszerűbb MI-modellek ellenállni a manipulációnak, amikor káros vagy illegális tartalmat próbálnak kicsikarni belőlük...

MA 07:49

A Plejádok rejtett rokonsága – az ég titkos családfája

Évszázadok óta ismert látvány a Pleiadok csillaghalmaza, más néven a Hét Nővér, amelyről eddig úgy hittük, csak egy kis, ragyogó csillagcsalád...

MA 07:42

Jön az új vezérigazgató az Apple élére?

Az Apple a hírek szerint felgyorsította utódlási terveit, és könnyen lehet, hogy Tim Cook, a cég 65 éves vezérigazgatója már jövőre leköszön...

MA 07:36

A fotonikus csodachip szivárványt varázsol egyetlen lézerből

🌈 A fény manipulálása egyre fontosabb szerepet kap a tudományban és az iparban, legyen szó szuperszámítógépek adatfeldolgozásáról vagy precíziós órákról...

MA 07:18

Az 55 millió éves murgoni krokodiltojáshéjak meglepő titkai

🐋 Érdekes, hogy Ausztrália egyik legjelentősebb őslénytani kincseire éppen egy alig 2 000 lelkes, Brisbane-től 250 kilométerre fekvő kisváros, Murgon környékén bukkantak rá a kutatók...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 11/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     LightTrac (iPhone/iPad)A LightTrac egy innovatív, fizikai alapokon nyugvó alkalmazás, amely lehetővé teszi a szabadtéri fényviszonyok pontos megtervezését...

MA 07:10

Az első pillantás a szupernóva rejtett arcára – végre szétszakadt a csillag

Az Európai Déli Obszervatórium óriástávcsövének köszönhetően először láthatták csillagászok, ahogy egy robbanó csillag kitörése áttöri a felszínt...