A nagy nyelvi MI-modellek fejlődését beárnyékolja, hogy sok lényeges emberi tudás kimarad a képzésükből. Az internetes adatbázisok, amelyekre támaszkodnak, súlyosan aránytalanok: például a Common Crawl anyagának 44%-a angol, miközben a hindi csupán 0,2%-ot tesz ki, holott a világ lakosságának 7,5%-a beszéli ezt a nyelvet. A tamil nyelv, amelyet 86 millióan használnak, szinte teljesen hiányzik: részesedése mindössze 0,04%. Összességében a világ nyelveinek 97%-a alulreprezentált az informatika és az MI területén.
Elveszett tudás és szűkülő látókör
Egy kutatás szerint a 12 495 különféle gyógynövényes ismeret több mint 75%-át csak egy-egy helyi nyelven jegyzik fel, így ezek kimaradnak az adatbázisokból, ha csupán a globálisan domináns nyelvekre támaszkodunk. A nagy nyelvi MI-modelleknél megfigyelhető a “móduserősítés” jelensége: a legtöbbször előforduló mintákat felerősítik, emiatt a kevésbé elterjedt tudás még inkább háttérbe szorul. Ez a folyamat oda vezet, hogy az MI-k által gyártott tartalom egyre inkább szűkíti a hozzáférhető tudás világát, mivel nem tükrözi vissza a szélesebb sokszínűséget.
2025, adrienne, slashdot.org alapján
Legfrissebb posztok
MA 19:30
🔑 Az elmúlt időszakban a vállalati informatikában újabb konszolidációs hullám indult el...
MA 19:02
A közönséges delfinek, amelyek a világ legelterjedtebb tengeri emlősei közé tartoznak, egyre rövidebb ideig élnek az Észak-Atlanti-óceánban...
MA 18:59
Az MI-asszisztensek ma már nemcsak jegyzeteket foglalnak össze, e-maileket írnak vagy kérdésekre válaszolnak – képesek önállóan cselekedni: hibajegyeket nyitnak, naplókat elemeznek, fiókokat kezelnek, sőt automatikusan el is hárítanak incidenseket...
MA 18:30
⚠ A Microsoft legújabb, októberi Patch Tuesday-je igazi rémálom a rendszergazdáknak: több mint 175 biztonsági hibát javítottak, amelyek közül hármat jelenleg is kihasználnak, további hármat pedig már nyilvánosan ismernek...
MA 18:26
📅 A Google egy új MI-alapú eszközt vezet be, amely megkönnyíti a Gmailt és a Google Naptárt használóknak a találkozók megszervezését...
MA 18:00
🎓 A tudomány legkiemelkedőbb teljesítményeit díjazó Nobel-díjak történetében újra és újra szembetűnik, hogy a tudósok útja ritkán egyenes – sőt, sokszor egész kontinenseket szelnek át, mire rangos elismerésben részesülnek...
MA 17:30
🛠 A Microsoft legújabb Office-ikonjai világszerte megjelennek a felhasználók képernyőin, de csak kevesen tudják, hány különös és szokatlan tervet utasított el a vállalat, mire megszületett a végleges dizájn...
MA 17:00
👀 A Sora 2, az OpenAI fejlett szövegből videót készítő modellje mérföldkő a mesterséges intelligencia fejlődésében...
MA 16:02
🤔 A DirecTV 2026-tól radikális újdonsággal készül a Gemini streaming eszközein: érkeznek az MI által generált reklámképernyők, amelyeken akár a te arcod is főszerepet kaphat...
MA 15:59
😉 Az OpenAI vezérigazgatója, Sam Altman nemrégiben bejelentette, hogy a ChatGPT hamarosan képes lesz felnőtt felhasználók számára erotikus tartalmakat is létrehozni, miután a vállalat szerinte már orvosolta a mesterséges intelligenciával folytatott beszélgetések okozta mentális egészségi kockázatokat...
MA 15:30
Az Egyesült Államok Járványügyi Központjánál (CDC) az elmúlt hétvégén tömeges elbocsátások zajlottak le, amelyek alapjaiban rengették meg a közegészségügyi rendszer működését...
MA 15:01
💪 Az egész életen át tartó állóképességi sportolás nemcsak az izmokat, hanem az immunrendszert is folyamatosan edzésben tartja, így az fiatalosan és hatékonyan működik...
MA 14:59
👀 A világ legerősebb és legtávolabbi rádiókarikájára (furcsa rádiókarika, ORC – odd radio circle) bukkant rá egy nemzetközi csillagászcsapat, amelyben lelkes amatőrök is részt vettek...
MA 14:31
💫 2025. július 2-án az amerikai NASA Fermi Gamma-ray Burst Monitor (Fermi-GBM) közel három órán át észlelt jeleket ugyanabból a forrásból...
MA 14:02
A Hold legnagyobb és legősibb kráteréről, a Déli-sark–Aitken (South Pole–Aitken) medencéről csak most derült ki, mennyire másként keletkezett, mint eddig gondoltuk...
MA 13:59
💻 Az Nvidia új, mindössze 1,2 kg súlyú számítógépe, a DGX Spark, 128 GB egyesített memóriával és egy petaflops számítási teljesítménnyel érkezik, mindezt egy 15 x 15 x 5 cm-es dobozban...
MA 13:45
A Salesforce ügyfélszolgálati folyamatai MI-alapú eszközökkel működnek, amelyek évente körülbelül 36 milliárd forint megtakarítást hoznak a cégnek...
MA 10:32
Évmilliárdokkal ezelőtt, amikor a Földet még sűrű, oxigénhiányos tengerek borították, aligha gondolnánk, hogy ekkor is rejtőzhettek már komplex élőlények...
MA 10:22
👀 A Samsung hivatalosan is bejelentette, hogy október 21-én este 10 órakor bemutatja a régóta várt Project Moohan vegyes valóság szemüveget...