Az MI chatrobotok kamuznak a tudományos eredményekről

Az MI chatrobotok kamuznak a tudományos eredményekről
Az elmúlt években egyre kifinomultabb MI chatrobotok jelentek meg, de ezzel együtt nőtt annak a veszélye is, hogy ezek a nagyméretű nyelvi modellek félreértelmezik vagy túlságosan leegyszerűsítik a tudományos kutatások eredményeit. Egy friss kutatás szerint a legmodernebb MI rendszerek, mint a ChatGPT, a Llama vagy a DeepSeek, hajlamosabbak a túlzott általánosításra és a kritikus részletek figyelmen kívül hagyására. Ez valójában rontja a modellek pontosságát és megbízhatóságát, különösen az orvosi és tudományos területeken.

Az egyszerűsítés veszélyei

A kutatók közel 4900 tudományos publikáció összefoglalását elemezték, és azt találták, hogy az MI chatek ötször gyakrabban általánosítottak, mint az emberi szakértők. Ha a chatbotokat nem egyszerű összefoglalásra, hanem pontos tartalmi összefoglalóra utasították, akkor kétszer nagyobb eséllyel túlozták el a kutatások eredményeit. Ráadásul a legújabb modellek esetében ez a hatás tovább erősödött, míg a régebbi verziók inkább kerülték a bizonytalan kérdések megválaszolását.

Jelentős eltérések a megfogalmazásban

Az MI modellek működése során az információ több rétegen szűrődik át, így gyakran veszítenek el lényeges részleteket. A tudományos közleményeknél ez különösen nagy probléma, mert a körülmények, megszorítások és a kontextus elengedhetetlenek a helyes értelmezéshez. Egy konkrét példa: a DeepSeek egy orvosi összefoglalóban a „biztonságos és sikeresen alkalmazható kezelés” kifejezést átírta „biztonságos és hatékony kezelési lehetőségre”, ami félrevezető lehetett volna az orvosi gyakorlatban. Más esetben a Llama chatrobot kihagyta a gyógyszeres kezelés adagolását, gyakoriságát és a hatásokat, ezzel kockáztatva, hogy az orvosok a szükségesnél általánosabban alkalmazzák a gyógyszert.

Miért problémás az általánosítás?

A kutatók tíz népszerű MI modellt teszteltek – többek között a ChatGPT négy és a Claude három változatát, a Llama két verzióját és egy DeepSeek modellt. Egyértelműen kiderült, hogy főleg a ChatGPT, a Llama és a DeepSeek modellek, amikor pontosabb választ kellett volna adniuk, kétszer nagyobb eséllyel túlozták el az eredményeket. Egyedül a Claude teljesített minden tekintetben jól. Az MI modellek gyakran átalakították a numerikus adatokat általános információkká, ezekből a torzításokból pedig nemcsak félreérthető összefoglalók születtek, hanem akár veszélyes kezelési javaslatok is.


Bizalomvesztés és félreértések

Az MI rendszerek teljesítménye és torzításai miatt a szakemberek attól tartanak, hogy a félrevezető összefoglalók hozzájárulnak a tudományos eredmények félremagyarázásához, miközben az emberek egyre inkább ezeket a modelleket használják információszerzésre. Egy pszichológiai MI cég alelnöke szerint ráadásul a torzítások gyakran alattomosabbak: egy állítás hangsúlyát lopva növelik meg. Mivel például az orvoslásban az MI-összefoglalók már a napi rutin részévé váltak, különösen fontos lenne szűrőket alkalmazni, hogy a végleges szövegek biztosan tükrözzék az eredeti kutatások bizonyítékait.

Lehet-e javítani ezen?

A tanulmány szerzői elismerik, hogy a vizsgálat nem volt teljes körű; további kutatások szükségesek például más tudományos feladatok vagy nem angol nyelvű szövegek esetében. Ugyanakkor abban egyetértenek, hogy a promptok kidolgozottsága is befolyásolhatja a végeredményt, és ahogy az MI eszközök mindennapossá válnak, egyre nő annak a veszélye, hogy széles körben félreértelmezik a tudományos eredményeket.

A szakma több képviselője szerint alapvető hiba, hogy a fejlesztők általános célú MI modelleket használnak speciális szakterületeken anélkül, hogy hozzáértő szakemberek felügyelnék a folyamatot, holott ezekhez sokkal célzottabb oktatás szükséges.

2025, adminboss, www.livescience.com alapján

  • Te mit gondolsz, jó ötlet bízni az MI összefoglalókban szakmai területeken?
  • Mit tennél, ha gyanúsan általános választ kapsz egy komoly kérdésre?
  • Szerinted megéri-e kockáztatni az egyszerűség kedvéért a pontosságot?



Legfrissebb posztok

hétfő 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...

MA 07:43

Az Athena-terv botránya felforgatja a NASA jövőjét

🚀 Washingtonban, a Capitol Hillen egyre inkább forrnak az indulatok egy titokzatos dokumentum, az Athena-terv nyilvánosságra kerülése miatt...

MA 07:36

Az MI végre feltöri a Crohn‑betegség titkos kódját

Évtizedes találgatások után a kutatók rájöttek, hogyan vezet a Crohn‑betegséghez két bélfehérje kapcsolatának megszakadása – és hogyan lehetne ezt helyreállítani a gyulladás megszüntetése érdekében...

MA 07:29

Az MI-modellek alig értik a saját működésüket

🤔 A nyelvi modellek önreflexiója továbbra is gyenge lábakon áll. Az Anthropic legújabb kutatása szerint ezek a nagy nyelvi modellek (LLM-ek) csak ritkán képesek felismerni és leírni saját belső folyamataikat, annak ellenére, hogy olykor mutatnak némi önismereti jelet...



MA 07:22

Az OpenAI az Amazonhoz költözik, de továbbra is Microsoft-függő

Az OpenAI hét évre szóló, közel 14 000 milliárd forintos (38 milliárd dolláros) megállapodást kötött az Amazon Web Services-szel (AWS), hogy biztosítsa növekvő MI-számítási kapacitásait...

MA 07:15

Az ellopott rendőrségi fiókok miatt lyukasak a Flock kamerái?

🔒 Az amerikai törvényhozók szerint komoly veszélynek vannak kitéve azok az autórendszám-felismerő kamerák, amelyeket a Flock Safety üzemeltet országszerte, miután kiderült, hogy a cég nem kötelezi ügyfeleit a többfaktoros hitelesítés (MFA) használatára...



APP
MA 07:13

APPok, Amik Ingyenesek MA, 11/4

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     伙力火车票 (iPhone/iPad)A 高铁管家 egy kínai utazási app, amely először kínált valós idejű vonatinformációkat...

MA 07:08

Az elnök nem is tudja, kit mentett fel

🙄 Donald Trump, volt amerikai elnök a közelmúltban kegyelmet adott a Binance kriptotőzsde alapítójának és volt vezérigazgatójának, Changpeng Zhaónak (C...

MA 07:01

Az ál-Solidity bővítmény csapdába csalja a fejlesztőket

A fejlesztők újabb veszélyforrással néznek szembe: a SleepyDuck nevű távoli elérésű trójai a népszerű Solidity-kiterjesztés hamis változataként jelent meg az Open VSX nyílt forráskódú bővítménytárban...



MA 06:57

Az összefonódott atomok erősebbé teszik a fénykibocsátást

💡 A fizikusok új kutatásban kimutatták, hogy az atomok közti közvetlen kölcsönhatás képes jelentősen felerősíteni a szuperradianciát, vagyis az atomok tömeges, tökéletesen hangolt fénykibocsátását...



MA 06:53

Az iPhone üveghatásának szabályozása végre a te kezedbe kerülhet

Az iOS 26.1 már letölthető, és izgalmas újdonságokat hoz az iPhone-tulajdonosoknak...

MA 06:40

Profi orrfuvola: fújd az orroddal a show-t!

A Bocarina Professional fekete orrfuvola minden zenészkedvű kíváncsinak kiváló választás. Ez az orral fújható különleges hangszer egyedülálló módon, minimális gyakorlással is élvezetes zenei élményt nyújt...

hétfő 20:55

Az Xpeng lenyomja a nagyokat olcsó villanyautóival

A kínai Xpeng történelmi növekedést mutat az elektromos autók piacán: egymás után második hónapban szállított le több mint 40 000 autót, ezzel a szegmens robbanásszerű tömegpiaci stratégiájának egyik legnagyobb nyertesévé vált...

hétfő 20:46

Az élet mulandóságát hirdette egy pompeji mozaik

Egyedülálló mozaikot fedeztek fel Pompejiben, amely még a Vezúv kitörése előtt készült, és emlékezteti a szemlélőt: mindannyian halandók vagyunk...



hétfő 20:37

Az első engedélyezett BMW: itt a kéz nélküli autópályás vezetés

A BMW első autógyártóként kapta meg a friss ENSZ 171-es szabályozás szerinti jóváhagyást, amellyel Motorway Assistant nevű rendszerét már több országban is bevezethetik...

hétfő 20:28

Valóban nekünk szólnak az MI-böngészők?

A böngészők világa forradalmi változásokon megy keresztül, az MI-integráció egyre nagyobb teret hódít...



hétfő 20:19

Az Apple legolcsóbb okosórája most fillérekbe kerül

Az Apple Watch SE 3 most először lett igazán olcsó: az Amazonon 199,99 dollárért, vagyis nagyjából 73 000 forintért lehet megvásárolni, ami körülbelül 18 000 forintos árcsökkenést jelent...

hétfő 20:01

Az OpenAI már évi 4 700 milliárd forint körül jár?

Sam Altman, az OpenAI vezérigazgatója szerint a cég jóval 13 milliárd dollár, vagyis nagyjából 4 700 milliárd forint éves bevétellel büszkélkedhet – és nála most már tényleg elég a folytonos faggatózásból, hogy miből fizetik ki az elképesztő költségeket...

hétfő 19:46

Az élet szikráját az ifjú Nap dühöngése adhatta

A fiatal Naphoz hasonló csillagok óriási energiájú kitörései döntő szerepet játszhattak abban, hogy a Földön megjelenjen az élet...