Az MI még mindig naiv: nem tud különbséget tenni tény és vélemény között
A legújabb kutatások szerint a mai nagyméretű nyelvi modellek, mint a GPT-4o, még mindig komoly gondban vannak azzal, hogy megkülönböztessék a tényeket az emberi hiedelmektől – főleg, ha a hiedelem hamis. Ez jelentősen növeli a téves információk terjedésének kockázatát.
Hibás döntések a fontos területeken
A Stanford Egyetem kutatói 24 népszerű MI-modellt teszteltek, több mint 13 ezer kérdésre adott válaszaikat vizsgálva. Kiderült, hogy az újabb modellek – például a 2024 májusában megjelent GPT-4o – 34 százalékkal kevésbé ismerték fel a hamis hiedelmeket, mint a valósakat. A régebbi modelleknél ez az arány még rosszabb volt: ott 39 százalékos különbséget találtak. A modellek a tények felismerésében is eltérően teljesítettek: az újabbaknál 91 százalékos pontosságot mértek, a régebbieknél csak 72–85 százalék közöttit.
Felületes gondolkodásmód és veszélyes hiányosságok
A vizsgált modellek nem valódi tudásra vagy logikus helyzetfelismerésre támaszkodnak, inkább mintázatokat ismernek fel – ez könnyen félrevezetheti az embereket. Különösen olyan területeken, ahol a pontatlan MI-válasz emberi életeket, illetve jogi vagy tudományos eredményeket befolyásolhat.
Idén világszerte közel 555 billió forintot (1,5 billió dollárt) költenek MI-fejlesztésre – jósolja a Gartner elemzőcég. Az MI nemcsak a telefonokban vagy autókban, hanem a kenyérpirítókban és a streaming-szolgáltatásokban is megjelenik. Az elterjedést egyelőre nem akadályozzák a hibák, pedig például az MI-alapú ügyfélszolgálatok erősen alulteljesítenek, és a titoktartás jelentőségét sem értik.
Európai biztonsági szakértők megerősítették, hogy két orosz űreszköz az elmúlt években legalább egy tucat, kulcsfontosságú európai műholdat figyelt meg...
Az Abbott egészségügyi technológiai cég visszahívta a FreeStyle Libre 3 és FreeStyle Libre 3 Plus folyamatos vércukorszintmérő szenzorokat, mert ezek hamisan alacsony glükózértéket mutatnak...
💧 A Jupiter jeges holdján, az Európa felszínén most először mutatták ki a létfontosságú ammónia jelenlétét, ami jelentős áttörés lehet a földönkívüli élet keresésében...
Kiemelt fordulópontok egy napon: An Lushan császárrá avatja magát és megalapítja Yant, Mexico elfogadja a mai alkotmányát, az Apollo 14 pedig a Holdra ér...
Az emberi tudat eredetét máig rejtély övezi: a kutatók még mindig nem értik pontosan, miként képes az agy fizikai működése gondolatokat, érzelmeket és öntudatot teremteni...
A 33 éves Isaac négy éve dolgozik középszinten fejlesztőmérnökként egy nagy techcégnél, ahol komoly változásokat érzékelt a belépőszintű munkaerő körül...
Érdemes megérteni, hogy a Parkinson-kórt eddig elsősorban mozgászavarnak tartották, pedig a betegség hátterében jóval összetettebb idegi hálózat rejtőzhet...
🔐 A Samsung hamarosan bemutatja az új Galaxy S26 modelleket, de a szivárgások szerint az elérhető árú verziók főleg csak apróbb fejlesztéseket kapnak...
💡 A Microsoft elindította a beépített Sysmon-támogatás tesztelését a Windows 11 rendszerben, igaz, egyelőre csak a Windows Insider programban részt vevő felhasználók élvezhetik az újdonságot...
💸 Lényeges, hogy tavaly szeptemberben az Nvidia és az OpenAI szándéknyilatkozatot írt alá, miszerint az Nvidia akár 36 billió forint (100 milliárd dollár) értékben fektetne be az OpenAI MI-infrastruktúrájába...
Az okosotthonokba lassan bekúszik az MI, és ma már nem luxus, ha egy kamera felismeri a családtagokat, különbséget tesz egy futár és a saját kutyád között, vagy kiértékeli a nap eseményeit...
💸 A Tether, a világ egyik legismertebb stabilcoin-kibocsátója drasztikusan visszafogta tőkebevonási terveit, miután a befektetők nem igazán voltak lenyűgözve az akár 180 000 milliárd forintos (500 milliárd USD) álomértékeléstől...
📱 Érdemes megvizsgálni, mennyire éri meg összehajtható telefont venni 2026-ban, hiszen egyre több gyártó dob piacra ilyen készüléket, és a felhasználók véleménye is sokat árnyalja a képet...