2025. 07. 06., 16:51

Az MI chatrobotok kamuznak a tudományos eredményekről

Az MI chatrobotok kamuznak a tudományos eredményekről
Az elmúlt években egyre kifinomultabb MI chatrobotok jelentek meg, de ezzel együtt nőtt annak a veszélye is, hogy ezek a nagyméretű nyelvi modellek félreértelmezik vagy túlságosan leegyszerűsítik a tudományos kutatások eredményeit. Egy friss kutatás szerint a legmodernebb MI rendszerek, mint a ChatGPT, a Llama vagy a DeepSeek, hajlamosabbak a túlzott általánosításra és a kritikus részletek figyelmen kívül hagyására. Ez valójában rontja a modellek pontosságát és megbízhatóságát, különösen az orvosi és tudományos területeken.

Az egyszerűsítés veszélyei

A kutatók közel 4900 tudományos publikáció összefoglalását elemezték, és azt találták, hogy az MI chatek ötször gyakrabban általánosítottak, mint az emberi szakértők. Ha a chatbotokat nem egyszerű összefoglalásra, hanem pontos tartalmi összefoglalóra utasították, akkor kétszer nagyobb eséllyel túlozták el a kutatások eredményeit. Ráadásul a legújabb modellek esetében ez a hatás tovább erősödött, míg a régebbi verziók inkább kerülték a bizonytalan kérdések megválaszolását.

Jelentős eltérések a megfogalmazásban

Az MI modellek működése során az információ több rétegen szűrődik át, így gyakran veszítenek el lényeges részleteket. A tudományos közleményeknél ez különösen nagy probléma, mert a körülmények, megszorítások és a kontextus elengedhetetlenek a helyes értelmezéshez. Egy konkrét példa: a DeepSeek egy orvosi összefoglalóban a „biztonságos és sikeresen alkalmazható kezelés” kifejezést átírta „biztonságos és hatékony kezelési lehetőségre”, ami félrevezető lehetett volna az orvosi gyakorlatban. Más esetben a Llama chatrobot kihagyta a gyógyszeres kezelés adagolását, gyakoriságát és a hatásokat, ezzel kockáztatva, hogy az orvosok a szükségesnél általánosabban alkalmazzák a gyógyszert.

Miért problémás az általánosítás?

A kutatók tíz népszerű MI modellt teszteltek – többek között a ChatGPT négy és a Claude három változatát, a Llama két verzióját és egy DeepSeek modellt. Egyértelműen kiderült, hogy főleg a ChatGPT, a Llama és a DeepSeek modellek, amikor pontosabb választ kellett volna adniuk, kétszer nagyobb eséllyel túlozták el az eredményeket. Egyedül a Claude teljesített minden tekintetben jól. Az MI modellek gyakran átalakították a numerikus adatokat általános információkká, ezekből a torzításokból pedig nemcsak félreérthető összefoglalók születtek, hanem akár veszélyes kezelési javaslatok is.


Bizalomvesztés és félreértések

Az MI rendszerek teljesítménye és torzításai miatt a szakemberek attól tartanak, hogy a félrevezető összefoglalók hozzájárulnak a tudományos eredmények félremagyarázásához, miközben az emberek egyre inkább ezeket a modelleket használják információszerzésre. Egy pszichológiai MI cég alelnöke szerint ráadásul a torzítások gyakran alattomosabbak: egy állítás hangsúlyát lopva növelik meg. Mivel például az orvoslásban az MI-összefoglalók már a napi rutin részévé váltak, különösen fontos lenne szűrőket alkalmazni, hogy a végleges szövegek biztosan tükrözzék az eredeti kutatások bizonyítékait.

Lehet-e javítani ezen?

A tanulmány szerzői elismerik, hogy a vizsgálat nem volt teljes körű; további kutatások szükségesek például más tudományos feladatok vagy nem angol nyelvű szövegek esetében. Ugyanakkor abban egyetértenek, hogy a promptok kidolgozottsága is befolyásolhatja a végeredményt, és ahogy az MI eszközök mindennapossá válnak, egyre nő annak a veszélye, hogy széles körben félreértelmezik a tudományos eredményeket.

A szakma több képviselője szerint alapvető hiba, hogy a fejlesztők általános célú MI modelleket használnak speciális szakterületeken anélkül, hogy hozzáértő szakemberek felügyelnék a folyamatot, holott ezekhez sokkal célzottabb oktatás szükséges.

2025, adminboss, www.livescience.com alapján

  • Te mit gondolsz, jó ötlet bízni az MI összefoglalókban szakmai területeken?
  • Mit tennél, ha gyanúsan általános választ kapsz egy komoly kérdésre?
  • Szerinted megéri-e kockáztatni az egyszerűség kedvéért a pontosságot?


Legfrissebb posztok

MA 10:36

Az Intel szárnyal: a Google-szövetség új csúcsokra repíti a részvényt

Az Intel hétfőn rövid idő alatt öt százalékot erősödött a tőzsdén, miután bejelentették stratégiai együttműködésük bővítését a Google-lel...

MA 10:29

Az átverős technikai ügyfélszolgálat: 13 millió dollárnak lába kelt

💯 Michael Cotter egyetlen problémával szembesült: a technikai ügyfélszolgálati cégénél, a Tech Live Connectnél túl magasak lettek a visszaterhelések...

MA 09:58

A Sony és egy YouTuber életre kelti az animációs Bloodborne-t

Las Vegasban, a CinemaCon fesztivál keretei között robbant a hír: a Sony animációs filmet készít a kultikus Bloodborne videojáték alapján...

MA 09:50

A tavasz titokzatos ragyogása: földfény az éjszakai égen

Áprilisban a Hold nemcsak a megszokott ragyogásával hívja fel magára a figyelmet: ebben az időszakban gyakrabban figyelhető meg a ritka és misztikus földfény (earthshine) is...

MA 09:43

Az MI-s Claude zuhanóágban – már ő is panaszkodik

😭 Jellemző példa erre, hogy az egykor a programozók kedvencévé vált, az Anthropichoz köthető Claude mostanra egyre több kritikát kap mind a költségek, mind a minőség terén...

MA 09:36

A Dogecoin berobban? Csak 3% a mémcoin-szezonban

🐶 Míg a kriptopiac kicsit bizonytalanul egyensúlyoz, a Dogecoin kifejezetten erősen muzsikál: szépen kapaszkodik felfelé, és egészen meggyőző, hogy most végre nem fullad ki az emelkedés, hanem tartja a szintet...

MA 09:15

A Doublespeed MI-vel verte át a befektetőket – kitört a botrány

⚠ A Doublespeed nevű startup, amely az Andreessen Horowitz (a16z) támogatásával működik, komoly hackertámadás áldozatává vált...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 4/14

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 06:06

Történelmi események a mai napon (Április 14.)

Ezen a napon koronázások, háborúk és sorsfordító döntések formálták a világot: a lengyel államiság keresztény alapokra állt, a Khalsa létrejött, a spanyol monarchiát köztársaság váltotta, miközben a Titanic jéghegynek ütközött...

hétfő 21:46

Az MI felfalja az óriásplatformok bevételeit

Kezdetben mindennapjainkat és gazdasági döntéseinket digitális platformok uralták. Az online tevékenységek bővülésével egyre inkább ezekre a szolgáltatókra támaszkodtunk, legyen szó arról, hogy keresünk a Google-ben, üzenetet váltunk WhatsAppon, videókat nézünk a YouTube-on, kapcsolatot tartunk az Instagramon, vagy vásárolunk az Amazonon...

hétfő 21:34

Az AT&T sunyi díjemelésére a régi ügyfelek ráfázhatnak

Áprilistól drágább lesz az élet azoknak az AT&T előfizetőknek, akik hosszú évek óta ragaszkodnak régi vezeték nélküli tarifacsomagjukhoz...

hétfő 21:01

Az MI beégett a bíróságon: kitalált ügyek, súlyos következmények

Az MI térnyerése az élet számos területén látványos ígéretekkel érkezett, de a jog világában teljesen más kihívásokkal találta szembe magát...

hétfő 20:45

A valódi Zuckerberg helyett már a mesterséges főnök diktál?

Képzeld el, hogy egy fontos céges kérdéssel fordulsz a vezérhez, várva a személyes, motiváló választ – aztán kiderül, hogy „Mark Zuckerberg” valójában csak egy mesterien kiképzett MI-klón, amely a vezér minden gesztusát, hangszínét, múltbeli nyilatkozatát, sőt a céges stratégiához fűzött gondolatait is tökéletesen utánozza...

hétfő 20:34

Az Artemis II diadala és a világ legkövérebb papagája: két szenzáció

🚀 Ezen a héten több tudományos szenzáció is született: az Artemis II űrmisszió hazatérése, a kihalás széléről visszatérő különleges új-zélandi madár, valamint a Torinói lepel erősen vitatott eredetű DNS-mintái mind hozzájárultak az izgalmakhoz...

hétfő 20:24

A balti bálna a végóráit éli, Németország tehetetlen

Egy tízméteres hím púpos bálna hónapok óta vergődik a németországi Balti-tengeren, miközben egy egész ország látja tehetetlenül az állat lassú haldoklását...

hétfő 20:14

Az MI véget vet az online oktatásnak?

🤓 Az egyetemi oktatás sosem volt könnyű pálya, hiszen a bér alacsony, a munka bizonytalan, mégis rengetegen választják, mert a tanítás öröme semmihez sem fogható...

hétfő 19:56

A Circle csak bírósági végzésre fagyasztja be az USDC-t

🔒 A stablecoinok világában egyre nagyobb botrányt kelt, hogy hackerek százmilliókat lopnak el digitális valutákból, miközben a kibocsátók tétlenül nézik...

hétfő 19:45

Az új Roblox-gyerekfiókok felforgatják a szabályokat – jön a szigorúbb ellenőrzés

🔒 A Roblox júniustól kétféle, korosztályhoz kötött fiókot vezet be a fiatalabb játékosok számára: Roblox Kids és Roblox Select...

hétfő 19:34

Az új adatgyűjtő vírus, amely jelszó nélkül is kifoszt

🔒 2026 elején egy vadonatúj infógyűjtő, a Storm jelent meg az alvilági hackerkörökben...

hétfő 19:12

Az Adobe villámfrissítéssel zárja az Acrobat kritikus biztonsági rést

⚡ Az Adobe kritikus biztonsági frissítést adott ki az Acrobat és az Acrobat Reader szoftvereihez, hogy orvosolja a CVE-2026-34621 nevű sebezhetőséget, amelyet már hónapok óta zéró-napos támadásokban kihasználják...

hétfő 19:01

Az Android Auto végre átveszi a klímavezérlést?

Az Android Auto fejlesztései új lendületet kaptak: hamarosan lehetőség nyílik a klímaberendezés vezérlésére közvetlenül az autó kijelzőjéről, anélkül, hogy ki kellene lépni az Android Auto felületéről...

hétfő 18:56

A Google Messengerben végre kukázhatók az üzenetek

Sokáig igazi stresszforrás volt a törlés a Google Messengerben, hiszen azonnal és végleg eltűntek az üzenetek, ha megnyomtad a törlés gombot...

hétfő 18:45

A túl erős fény visszavetheti a növények fejlődését

A növények növekedését a fény nemcsak serkenti, hanem korlátozhatja is. Japán kutatók meglepő eredményre jutottak: világosban fejlődő borsóhajtásokban az epidermisz – vagyis a növény külső rétege – sokkal szorosabban tapad az alatta lévő szövetekhez, mint a sötétben nevelt növények esetében...

hétfő 18:34

Az újabb Rockstar-káosz: hackertámadás borzolja a GTA VI előszelét

🔫 Képzeld el, hogy a Rockstar Games – igen, az a stúdió, amelyik a Grand Theft Auto VI-n (GTA 6) dolgozik – megint hackertámadás célpontja lett...

hétfő 18:23

Az új fogkrém, amely véget vet a fogínybetegségeknek

😃 Az emberi szájban több mint 700-féle baktérium él, de csak kevés felelős a súlyos fogínybetegségekért...

hétfő 17:56

A mesterséges intelligencia sötét oldala: veszélyben a kriptotárcák

🔐 A technológiai világ egyre inkább a mesterséges intelligenciára támaszkodik, és a kriptovilágban is látványos forradalom készül...

hétfő 17:47

Az olcsó OLED nagy blöffje? Gigabyte GO27Q24G teszt

💡 Egy lényeges szempont, hogy a Gigabyte GO27Q24G egy újabb próbálkozás arra, hogy a gamerek számára elérhető áron kínáljon OLED kijelzős monitort, mégpedig egy régebbi LG WOLED panel segítségével...

hétfő 17:35

Az univerzális légúti vakcina: mennyit kell még várnunk?

😷 Képzelj el egy olyan oltást, amely egyszerre véd az influenza, a COVID-19, a tüdőbe jutó baktériumok és a szezonális allergének ellen...

hétfő 17:23

Az új kriptoőrület: száguld a Bitcoin, tombol a RAVE

Külön említést érdemel, hogy az elmúlt napokban a Bitcoin továbbra is stabilan tartja magát 25,5 millió forint (70 000 USD) körül, még akkor is, ha világszerte erősödnek a geopolitikai feszültségek, és a hagyományos piacok inkább a biztonságot keresik...