A Wikidata új adatbázisa átalakítja a mesterséges intelligencia világát
A Wikidata, a Wikipédia testvérprojektje, jelentős újítással rukkolt elő: olyan adatbázist fejlesztettek, amely jelentősen megkönnyíti, hogy mind a felhasználók, mind az MI-fejlesztők hozzáférjenek, és hatékonyabban keressenek hatalmas adattáraikban. A kezdeményezést a németországi Wikimedia Deutschland vezette, ahol egy éven át dolgoztak azon, hogy a Wikidata 19 millió bejegyzését a hagyományos, kissé nehézkes formátumból úgynevezett vektorokká alakítsák át. Ezek a vektorok a szövegek és fogalmak közötti kapcsolatokat jelenítik meg – például a híres szerző, Douglas Adams nevéhez nemcsak a művei, hanem az „ember” fogalom is kapcsolódik ily módon.
Egységesített adatáramlás a fejlesztőknek
Fontos, hogy a Wikidata felhasználói felülete változatlan marad; továbbra sem lesz a Wikipédia például chatbot. Ennek ellenére a háttér-infrastruktúra teljesen átalakul: az új adatbázisnak köszönhetően az MI-fejlesztők könnyebben hozzáférhetnek majd az információkhoz saját fejlesztéseikhez, például chatbotokhoz. Jina AI MI-modelljével vektorokká alakították az adatokat, az IBM leányvállalata, a DataStax pedig térítésmentesen biztosítja a vektoralapú adatbázis tárolását is. A tervezet fő célja, hogy a kisebb technológiai szereplők is ugyanolyan könnyedén tudják hasznosítani ezeket az adatkincseket, mint a nagyvállalatok, például az OpenAI vagy az Anthropic.
Befolyás a szélesebb MI-fejlesztési közösségre
Így tehát a Wikidata újítása nemcsak a pénzben bővelkedő nagy techcégeknek, hanem a kisebb fejlesztői közösségeknek is kulcsfontosságú. Fontos szempont, hogy az MI-chatbotok eddig főként a leggyakoribb internetes témákra és szavakra koncentráltak, ezért a szűkebb, speciális ismeretek háttérbe szorultak. Mostantól azonban sokkal könnyebb lesz akár kevéssé ismert, hiánypótló adatokhoz is hozzáférni, amelyek eddig nem kaptak kellő figyelmet. Példaként említhető egy kereshető közadatokat kínáló platform, ahol nemzetközi hivatalos személyek közösségi média elérhetőségei is megtalálhatók.
Egyelőre azonban az új, vektorizált adatbázis csak a 2024. szeptember 18-ig rögzített adatokat tartalmazza, a további frissítések előtt visszajelzéseket várnak a fejlesztőktől. Az adatbázis ereje abban rejlik, hogy nem az egyes apró szerkesztéseken, hanem az általános összefüggéseken és jelentéseken van a hangsúly, így a kisebb módosítások nem rontják az adathasználat élményét. Az új formátum segít abban, hogy az MI-rendszerek ne csak információkat, hanem azok teljes kontextusát is megértsék.
2025, adminboss, www.theverge.com alapján
filózó
Te mit gondolsz arról, hogy nagy technológiai cégek és kisebb fejlesztők egyenlőbben férnek hozzá ezekhez az adatokhoz?
Te etikusnak tartod, ha bármilyen fejlesztő szinte minden információt könnyen elérhet egy ilyen adatbázisból?
Ha te döntenéd el, megváltoztatnád valamennyire, ki és milyen módon használhatja ezeket az adatokat?
Ha valaki több mint egy évtizede játszott a Rhythm Heavennel, valószínűleg sosem felejtette el azt a különös, szürreális világot, ahol dadogó pankrátorok és furcsa madarak ugrálnak egy lélekmelengető popdallamra...
A brit távközlési piac gigantikus átalakulása zajlik: az ország versenyhatósága kiemelt vizsgálatot indított annak kapcsán, hogy a Netomnia anyavállalatát, a Substantialt a Liberty Global, a Telefonica és az InfraVia konzorciuma felvásárolja...
Az Anthropic szerdától újra elérhetővé teszi a csúcskategóriás Claude Fable 5-öt, miután a Kereskedelmi Minisztérium feloldotta az exportkorlátozásokat...
Érdemes megvizsgálni, hogy a Claude Code felhasználói egyre gyakrabban panaszkodnak arra, hogy egyik napról a másikra eltűnnek a beszélgetési előzményeik...
Júliusban a Pokémon GO rajongóira izgalmas hónap vár, hiszen a mobileszközökön futó játék tizedik évfordulóját ünnepli, miközben a Forever Forward szezon tovább pörög...
Fizetős iOS appok és játékok, amik ingyenesek a mai napon. ImgRef (iPhone/iPad)Az App Store szerkesztői által kiemelten ajánlott alkalmazás lenyűgöző, 98%-os ötcsillagos értékeléssel büszkélkedhet...
❤ A hirtelen szívhalál évente rengeteg áldozatot követel, jóllehet a beültethető defibrillátorok már évtizedek óta képesek lennének megelőzni a tragédiák jelentős részét...
Michael Dell idén egészen elképesztő sikereket ér el: cége meghatározó beszállító lett az adatközpont-fejlesztésekben, többek között a CoreWeave és az xAI számára szállít Nvidia-alapú szervereket, rackeket, hűtőrendszereket, valamint támogatást, miközben együttműködik a Microsofttal, a Google-lel és az OpenAI-jal is nagy teljesítményű MI-rendszerek építésében...
💰 Egy észak-karolinai férfi több mint tíz év börtönt kapott, miután beismerte, hogy januárban Pokémon-kártyákat és pénzt lopott egy helyi videójátékbolt alkalmazottjától Wilmingtonban...
🍇 Idén június 29-én érdemes az eget figyelni: ekkor látható a júniusi telihold, más néven az Eperhold (Strawberry Moon), ami az év legalacsonyabban járó és egyik legkisebb teliholdja lesz...
A mexikói Metapában egy vadonatúj, 2043 négyzetméteres üzemben indult el az Egyesült Államok mezőgazdasági minisztériumának (USDA) legújabb programja: steril legyek tömeges előállítása...
⚡ A Microsoft az eddigieknél sokkal gyorsabban készül átállni a kvantumbiztos védelemre, mert a kvantumszámítógépek fejlődése minden korábbinál nagyobb fenyegetést jelent a jelenlegi titkosítási szabványokra...
Felmerül a kérdés, hogy mennyire bízhatunk meg a mesterséges intelligenciával hajtott böngészőkben, ha egy új támadás képes kijátszani a biztonsági korlátokat...
🔒 A Microsoft fejlesztéseinek köszönhetően mostantól jóval biztonságosabbak lesznek a Teams-megbeszélések, hiszen egy új szabályozás lehetővé teszi, hogy a felhasználók blokkolják az engedély nélküli, harmadik féltől származó botok csatlakozását...
A mesterséges intelligencia infrastruktúrája iránti fékezhetetlen igény egyre nagyobb mértékben fűti az inflációt – figyelmeztetett Beth Hammack, a clevelandi Szövetségi Tartalékbank elnöke...
⚠ A Samsung Messages alkalmazás hamarosan végleg eltűnik az amerikai felhasználók mobiljáról, így akinek fontosak a régi üzenetei, vagy továbbra is csevegni szeretne, érdemes minél előbb lépnie...
🔨 Felmerül a kérdés, hogy mi lenne, ha a betegségeket nem csupán a DNS szerkesztésével, hanem a gének működésének speciális beállításával lehetne kezelni?..
A Peacock Premium Plus már elérhető a YouTube Primetime Channels szolgáltatáson keresztül, így mostantól közvetlenül a YouTube alkalmazásban is előfizethetsz rá, és nézheted az összes tartalmat – legyen szó mobilról, tabletről vagy okostévéről...