2025. 07. 06., 16:51

Az MI chatrobotok kamuznak a tudományos eredményekről

Az MI chatrobotok kamuznak a tudományos eredményekről
Az elmúlt években egyre kifinomultabb MI chatrobotok jelentek meg, de ezzel együtt nőtt annak a veszélye is, hogy ezek a nagyméretű nyelvi modellek félreértelmezik vagy túlságosan leegyszerűsítik a tudományos kutatások eredményeit. Egy friss kutatás szerint a legmodernebb MI rendszerek, mint a ChatGPT, a Llama vagy a DeepSeek, hajlamosabbak a túlzott általánosításra és a kritikus részletek figyelmen kívül hagyására. Ez valójában rontja a modellek pontosságát és megbízhatóságát, különösen az orvosi és tudományos területeken.

Az egyszerűsítés veszélyei

A kutatók közel 4900 tudományos publikáció összefoglalását elemezték, és azt találták, hogy az MI chatek ötször gyakrabban általánosítottak, mint az emberi szakértők. Ha a chatbotokat nem egyszerű összefoglalásra, hanem pontos tartalmi összefoglalóra utasították, akkor kétszer nagyobb eséllyel túlozták el a kutatások eredményeit. Ráadásul a legújabb modellek esetében ez a hatás tovább erősödött, míg a régebbi verziók inkább kerülték a bizonytalan kérdések megválaszolását.

Jelentős eltérések a megfogalmazásban

Az MI modellek működése során az információ több rétegen szűrődik át, így gyakran veszítenek el lényeges részleteket. A tudományos közleményeknél ez különösen nagy probléma, mert a körülmények, megszorítások és a kontextus elengedhetetlenek a helyes értelmezéshez. Egy konkrét példa: a DeepSeek egy orvosi összefoglalóban a „biztonságos és sikeresen alkalmazható kezelés” kifejezést átírta „biztonságos és hatékony kezelési lehetőségre”, ami félrevezető lehetett volna az orvosi gyakorlatban. Más esetben a Llama chatrobot kihagyta a gyógyszeres kezelés adagolását, gyakoriságát és a hatásokat, ezzel kockáztatva, hogy az orvosok a szükségesnél általánosabban alkalmazzák a gyógyszert.

Miért problémás az általánosítás?

A kutatók tíz népszerű MI modellt teszteltek – többek között a ChatGPT négy és a Claude három változatát, a Llama két verzióját és egy DeepSeek modellt. Egyértelműen kiderült, hogy főleg a ChatGPT, a Llama és a DeepSeek modellek, amikor pontosabb választ kellett volna adniuk, kétszer nagyobb eséllyel túlozták el az eredményeket. Egyedül a Claude teljesített minden tekintetben jól. Az MI modellek gyakran átalakították a numerikus adatokat általános információkká, ezekből a torzításokból pedig nemcsak félreérthető összefoglalók születtek, hanem akár veszélyes kezelési javaslatok is.


Bizalomvesztés és félreértések

Az MI rendszerek teljesítménye és torzításai miatt a szakemberek attól tartanak, hogy a félrevezető összefoglalók hozzájárulnak a tudományos eredmények félremagyarázásához, miközben az emberek egyre inkább ezeket a modelleket használják információszerzésre. Egy pszichológiai MI cég alelnöke szerint ráadásul a torzítások gyakran alattomosabbak: egy állítás hangsúlyát lopva növelik meg. Mivel például az orvoslásban az MI-összefoglalók már a napi rutin részévé váltak, különösen fontos lenne szűrőket alkalmazni, hogy a végleges szövegek biztosan tükrözzék az eredeti kutatások bizonyítékait.

Lehet-e javítani ezen?

A tanulmány szerzői elismerik, hogy a vizsgálat nem volt teljes körű; további kutatások szükségesek például más tudományos feladatok vagy nem angol nyelvű szövegek esetében. Ugyanakkor abban egyetértenek, hogy a promptok kidolgozottsága is befolyásolhatja a végeredményt, és ahogy az MI eszközök mindennapossá válnak, egyre nő annak a veszélye, hogy széles körben félreértelmezik a tudományos eredményeket.

A szakma több képviselője szerint alapvető hiba, hogy a fejlesztők általános célú MI modelleket használnak speciális szakterületeken anélkül, hogy hozzáértő szakemberek felügyelnék a folyamatot, holott ezekhez sokkal célzottabb oktatás szükséges.

2025, adminboss, www.livescience.com alapján

  • Te mit gondolsz, jó ötlet bízni az MI összefoglalókban szakmai területeken?
  • Mit tennél, ha gyanúsan általános választ kapsz egy komoly kérdésre?
  • Szerinted megéri-e kockáztatni az egyszerűség kedvéért a pontosságot?


Legfrissebb posztok

MA 14:23

Az Osmo Pocket 4 új szenzorral és Pro változattal hódíthat

Lényeges szempont, hogy a DJI Osmo Pocket sorozat eddig is a vloggerek kedvence volt, köszönhetően kiváló teljesítményének és zsebméretű kialakításának...

MA 14:03

Az első összefonódott, mozgó atomok: az univerzum új csodája

💫 Érdemes megérteni, hogy a fizikában most először sikerült megfigyelni két mozgásban lévő atom kvantumösszefonódását...

MA 13:34

A feledésbe merült Microsoft-hibák újra lecsapnak

Sokak meglepetésére újra támadás alatt állnak olyan sérülékenységek a Microsoft rendszereiben, amelyeket korábban már javítottak...

MA 13:23

Az új kvantumforradalom: már itt van, vagy még ötven év?

⚛ Chad Rigetti neve összeforrt a kvantumszámítógépek világával, még ha legtöbben csak a Marvel-filmekből hallották a fogalmat...

MA 13:01

A Meta arcfelismerő szemüvege: a botrány, amitől rettegünk

A Meta legújabb okosszemüvege hatalmas vihart kavart a civil szervezetek körében...

MA 12:57

Az európai fitneszóriás adatbotránya: egymillió tag adatai veszélyben

A holland központú Basic-Fit, Európa legnagyobb fitneszterem-lánca, kibertámadás áldozatává vált: hackerek bejutottak a cég rendszerébe, és közel egymillió tagról szereztek bizalmas adatokat...

MA 12:34

A sötét semmi gyorsabban vágtat, mint a fény

💫 Egy lényeges szempont, hogy a fizikában eddig elképzelhetetlennek számított, hogy bármi is gyorsabb lehet a fénynél – most azonban a tudósok mégis észleltek valamit, ami látszólag átlépi ezt a kozmikus sebességhatárt...

MA 12:23

Az Xbox végre belátta: túl drága a Game Pass?

Asha Sharma, az Xbox új vezérigazgatója mindössze néhány hete ül a főnöki székben, de máris felkavarta az állóvizet...

MA 11:45

Az FBI lecsapott a texasi férfira, aki Sam Altman otthonát megtámadta

Hihetetlen, de igaz: a texasi hatóságok épp akkor csaptak le egy 20 éves férfi otthonára, amikor azzal is vádolták, hogy Molotov-koktélos támadást intézett Sam Altman, az OpenAI vezérigazgatója San Franciscó-i otthona ellen...

MA 11:24

A termékeny sperma kulcsa: nyáron a legjobb a minőség

🍆 Nem is gondolnánk, de a sperma minősége komolyan változik az év során, és a legjobb eredmények épp a forró nyári hónapokra esnek...

MA 11:12

Molotov-koktélt dobtak Sam Altman házára az MI ellen tiltakozva

💥 Az OpenAI vezérigazgatója, Sam Altman otthonánál San Franciscóban péntek hajnalban valaki Molotov-koktélt dobott a kapura, majd elmenekült...

MA 11:02

Az MI lenyelte a programozókat – most a kreativitás diktál

Ha valaha is úgy gondoltad, hogy a kódolás a gyors meggazdagodás útja, ideje átértékelni a dolgokat...

MA 10:57

A San Franciscó-i öböl bálnatemető: sorra pusztulnak a szürke bálnák

💀 A San Francisco-öböl a szürke bálnák számára halálos útvonallá vált: az éhes állatok egyre gyakrabban keresik fel a forgalmas vizeket, sokan közülük azonban nem élik túl a kalandot...

MA 10:36

Az Intel szárnyal: a Google-szövetség új csúcsokra repíti a részvényt

Az Intel hétfőn rövid idő alatt öt százalékot erősödött a tőzsdén, miután bejelentették stratégiai együttműködésük bővítését a Google-lel...

MA 10:29

Az átverős technikai ügyfélszolgálat: 13 millió dollárnak lába kelt

💯 Michael Cotter egyetlen problémával szembesült: a technikai ügyfélszolgálati cégénél, a Tech Live Connectnél túl magasak lettek a visszaterhelések...

MA 09:58

A Sony és egy YouTuber életre kelti az animációs Bloodborne-t

Las Vegasban, a CinemaCon fesztivál keretei között robbant a hír: a Sony animációs filmet készít a kultikus Bloodborne videojáték alapján...

MA 09:50

A tavasz titokzatos ragyogása: földfény az éjszakai égen

Áprilisban a Hold nemcsak a megszokott ragyogásával hívja fel magára a figyelmet: ebben az időszakban gyakrabban figyelhető meg a ritka és misztikus földfény (earthshine) is...

MA 09:43

Az MI-s Claude zuhanóágban – már ő is panaszkodik

😭 Jellemző példa erre, hogy az egykor a programozók kedvencévé vált, az Anthropichoz köthető Claude mostanra egyre több kritikát kap mind a költségek, mind a minőség terén...

MA 09:36

A Dogecoin berobban? Csak 3% a mémcoin-szezonban

🐶 Míg a kriptopiac kicsit bizonytalanul egyensúlyoz, a Dogecoin kifejezetten erősen muzsikál: szépen kapaszkodik felfelé, és egészen meggyőző, hogy most végre nem fullad ki az emelkedés, hanem tartja a szintet...

MA 09:15

A Doublespeed MI-vel verte át a befektetőket – kitört a botrány

⚠ A Doublespeed nevű startup, amely az Andreessen Horowitz (a16z) támogatásával működik, komoly hackertámadás áldozatává vált...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 4/14

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 06:06

Történelmi események a mai napon (Április 14.)

Ezen a napon koronázások, háborúk és sorsfordító döntések formálták a világot: a lengyel államiság keresztény alapokra állt, a Khalsa létrejött, a spanyol monarchiát köztársaság váltotta, miközben a Titanic jéghegynek ütközött...

hétfő 21:46

Az MI felfalja az óriásplatformok bevételeit

Kezdetben mindennapjainkat és gazdasági döntéseinket digitális platformok uralták. Az online tevékenységek bővülésével egyre inkább ezekre a szolgáltatókra támaszkodtunk, legyen szó arról, hogy keresünk a Google-ben, üzenetet váltunk WhatsAppon, videókat nézünk a YouTube-on, kapcsolatot tartunk az Instagramon, vagy vásárolunk az Amazonon...

hétfő 21:34

Az AT&T sunyi díjemelésére a régi ügyfelek ráfázhatnak

Áprilistól drágább lesz az élet azoknak az AT&T előfizetőknek, akik hosszú évek óta ragaszkodnak régi vezeték nélküli tarifacsomagjukhoz...

hétfő 21:01

Az MI beégett a bíróságon: kitalált ügyek, súlyos következmények

Az MI térnyerése az élet számos területén látványos ígéretekkel érkezett, de a jog világában teljesen más kihívásokkal találta szembe magát...

hétfő 20:45

A valódi Zuckerberg helyett már a mesterséges főnök diktál?

Képzeld el, hogy egy fontos céges kérdéssel fordulsz a vezérhez, várva a személyes, motiváló választ – aztán kiderül, hogy „Mark Zuckerberg” valójában csak egy mesterien kiképzett MI-klón, amely a vezér minden gesztusát, hangszínét, múltbeli nyilatkozatát, sőt a céges stratégiához fűzött gondolatait is tökéletesen utánozza...

hétfő 20:34

Az Artemis II diadala és a világ legkövérebb papagája: két szenzáció

🚀 Ezen a héten több tudományos szenzáció is született: az Artemis II űrmisszió hazatérése, a kihalás széléről visszatérő különleges új-zélandi madár, valamint a Torinói lepel erősen vitatott eredetű DNS-mintái mind hozzájárultak az izgalmakhoz...

hétfő 20:24

A balti bálna a végóráit éli, Németország tehetetlen

Egy tízméteres hím púpos bálna hónapok óta vergődik a németországi Balti-tengeren, miközben egy egész ország látja tehetetlenül az állat lassú haldoklását...

hétfő 20:14

Az MI véget vet az online oktatásnak?

🤓 Az egyetemi oktatás sosem volt könnyű pálya, hiszen a bér alacsony, a munka bizonytalan, mégis rengetegen választják, mert a tanítás öröme semmihez sem fogható...