Az MI chatrobotok kamuznak a tudományos eredményekről

Az MI chatrobotok kamuznak a tudományos eredményekről
Az elmúlt években egyre kifinomultabb MI chatrobotok jelentek meg, de ezzel együtt nőtt annak a veszélye is, hogy ezek a nagyméretű nyelvi modellek félreértelmezik vagy túlságosan leegyszerűsítik a tudományos kutatások eredményeit. Egy friss kutatás szerint a legmodernebb MI rendszerek, mint a ChatGPT, a Llama vagy a DeepSeek, hajlamosabbak a túlzott általánosításra és a kritikus részletek figyelmen kívül hagyására. Ez valójában rontja a modellek pontosságát és megbízhatóságát, különösen az orvosi és tudományos területeken.

Az egyszerűsítés veszélyei

A kutatók közel 4900 tudományos publikáció összefoglalását elemezték, és azt találták, hogy az MI chatek ötször gyakrabban általánosítottak, mint az emberi szakértők. Ha a chatbotokat nem egyszerű összefoglalásra, hanem pontos tartalmi összefoglalóra utasították, akkor kétszer nagyobb eséllyel túlozták el a kutatások eredményeit. Ráadásul a legújabb modellek esetében ez a hatás tovább erősödött, míg a régebbi verziók inkább kerülték a bizonytalan kérdések megválaszolását.

Jelentős eltérések a megfogalmazásban

Az MI modellek működése során az információ több rétegen szűrődik át, így gyakran veszítenek el lényeges részleteket. A tudományos közleményeknél ez különösen nagy probléma, mert a körülmények, megszorítások és a kontextus elengedhetetlenek a helyes értelmezéshez. Egy konkrét példa: a DeepSeek egy orvosi összefoglalóban a „biztonságos és sikeresen alkalmazható kezelés” kifejezést átírta „biztonságos és hatékony kezelési lehetőségre”, ami félrevezető lehetett volna az orvosi gyakorlatban. Más esetben a Llama chatrobot kihagyta a gyógyszeres kezelés adagolását, gyakoriságát és a hatásokat, ezzel kockáztatva, hogy az orvosok a szükségesnél általánosabban alkalmazzák a gyógyszert.

Miért problémás az általánosítás?

A kutatók tíz népszerű MI modellt teszteltek – többek között a ChatGPT négy és a Claude három változatát, a Llama két verzióját és egy DeepSeek modellt. Egyértelműen kiderült, hogy főleg a ChatGPT, a Llama és a DeepSeek modellek, amikor pontosabb választ kellett volna adniuk, kétszer nagyobb eséllyel túlozták el az eredményeket. Egyedül a Claude teljesített minden tekintetben jól. Az MI modellek gyakran átalakították a numerikus adatokat általános információkká, ezekből a torzításokból pedig nemcsak félreérthető összefoglalók születtek, hanem akár veszélyes kezelési javaslatok is.


Bizalomvesztés és félreértések

Az MI rendszerek teljesítménye és torzításai miatt a szakemberek attól tartanak, hogy a félrevezető összefoglalók hozzájárulnak a tudományos eredmények félremagyarázásához, miközben az emberek egyre inkább ezeket a modelleket használják információszerzésre. Egy pszichológiai MI cég alelnöke szerint ráadásul a torzítások gyakran alattomosabbak: egy állítás hangsúlyát lopva növelik meg. Mivel például az orvoslásban az MI-összefoglalók már a napi rutin részévé váltak, különösen fontos lenne szűrőket alkalmazni, hogy a végleges szövegek biztosan tükrözzék az eredeti kutatások bizonyítékait.

Lehet-e javítani ezen?

A tanulmány szerzői elismerik, hogy a vizsgálat nem volt teljes körű; további kutatások szükségesek például más tudományos feladatok vagy nem angol nyelvű szövegek esetében. Ugyanakkor abban egyetértenek, hogy a promptok kidolgozottsága is befolyásolhatja a végeredményt, és ahogy az MI eszközök mindennapossá válnak, egyre nő annak a veszélye, hogy széles körben félreértelmezik a tudományos eredményeket.

A szakma több képviselője szerint alapvető hiba, hogy a fejlesztők általános célú MI modelleket használnak speciális szakterületeken anélkül, hogy hozzáértő szakemberek felügyelnék a folyamatot, holott ezekhez sokkal célzottabb oktatás szükséges.

2025, adminboss, www.livescience.com alapján

  • Te mit gondolsz, jó ötlet bízni az MI összefoglalókban szakmai területeken?
  • Mit tennél, ha gyanúsan általános választ kapsz egy komoly kérdésre?
  • Szerinted megéri-e kockáztatni az egyszerűség kedvéért a pontosságot?



Legfrissebb posztok

hétfő 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...



hétfő 20:55

Az Xpeng lenyomja a nagyokat olcsó villanyautóival

A kínai Xpeng történelmi növekedést mutat az elektromos autók piacán: egymás után második hónapban szállított le több mint 40 000 autót, ezzel a szegmens robbanásszerű tömegpiaci stratégiájának egyik legnagyobb nyertesévé vált...



hétfő 20:46

Az élet mulandóságát hirdette egy pompeji mozaik

Egyedülálló mozaikot fedeztek fel Pompejiben, amely még a Vezúv kitörése előtt készült, és emlékezteti a szemlélőt: mindannyian halandók vagyunk...

hétfő 20:37

Az első engedélyezett BMW: itt a kéz nélküli autópályás vezetés

A BMW első autógyártóként kapta meg a friss ENSZ 171-es szabályozás szerinti jóváhagyást, amellyel Motorway Assistant nevű rendszerét már több országban is bevezethetik...



hétfő 20:28

Valóban nekünk szólnak az MI-böngészők?

A böngészők világa forradalmi változásokon megy keresztül, az MI-integráció egyre nagyobb teret hódít...

hétfő 20:19

Az Apple legolcsóbb okosórája most fillérekbe kerül

Az Apple Watch SE 3 most először lett igazán olcsó: az Amazonon 199,99 dollárért, vagyis nagyjából 73 000 forintért lehet megvásárolni, ami körülbelül 18 000 forintos árcsökkenést jelent...



hétfő 20:01

Az OpenAI már évi 4 700 milliárd forint körül jár?

Sam Altman, az OpenAI vezérigazgatója szerint a cég jóval 13 milliárd dollár, vagyis nagyjából 4 700 milliárd forint éves bevétellel büszkélkedhet – és nála most már tényleg elég a folytonos faggatózásból, hogy miből fizetik ki az elképesztő költségeket...

hétfő 19:46

Az élet szikráját az ifjú Nap dühöngése adhatta

A fiatal Naphoz hasonló csillagok óriási energiájú kitörései döntő szerepet játszhattak abban, hogy a Földön megjelenjen az élet...

hétfő 19:37

Az idegesítő Windows-hiba végre eltűnt: leáll, ha leállítod

Sok felhasználó dühöngött már azon, hogy a „Frissítés és leállítás” opció valójában nem állította le a gépet, hanem újraindította...



hétfő 19:28

Az új Redmagic gamer mobil tényleg folyadékhűtéssel jön

🔥 A Redmagic 11 Pro szakít a hagyományokkal: ez az első olyan okostelefon (a kínai modelleken kívül), amely valódi folyadékhűtéssel érkezik...



hétfő 19:19

Az Nvidia és a Microsoft beindítja az MI-őrületet az Emirátusokban

🚀 Az Egyesült Államok jóváhagyta, hogy a Microsoft exportálhassa az Nvidia legújabb, csúcsteljesítményű GB300-as GPU-it az Egyesült Arab Emírségekbe...



hétfő 19:11

2025, Nov 3 Google Trend

Keresés1 Volumen2 Növekmény %3 manófalva 2000 900 otp 5000 100 otp internetbank 2000 300 jim curtis 2000 1000 david harbour 2000 1000 hideg 1000 1000 torre dei conti 500 1000 sassuolo–genoa 200 1000 családi pótlék utalása 1000 1000 tisza világ 500 800 miller dávid 10000 1000 milan–roma 2000 1000 időjárás 20000 75 időkép 5000 75...



hétfő 19:10

Az új Windows-frissítés miatt nem lehet bezárni a Feladatkezelőt

Az októberi, KB5067036 számú Windows 11-frissítés váratlan hibát okozott: a Feladatkezelő bezárása után is a háttérben marad, ami jelentősen ronthatja a gép teljesítményét...



hétfő 19:03

Véget értek az Internet Archive küzdelmei, de nagy árat fizettek érte

A San Franciscó-i Internet Archive ebben a hónapban ünnepelte, hogy a Wayback Machine elérte az ezermilliárdodik lementett weboldalt...

hétfő 18:47

Eltűnt a Facebook varázsa, nosztalgikus reklámokkal próbál visszacsábítani

A karácsonyi időszakban minden eddiginél többen kelnek útra, hogy hazalátogassanak, családjukkal és régi barátaikkal találkozzanak...

hétfő 18:37

Az egész világ pénzügyeit bekebelezi a blokklánc?

A Standard Chartered vezérigazgatója, Bill Winters szerint hamarosan szinte minden nemzetközi pénzügyi tranzakció digitális blokkláncfőkönyvre kerül át, és a pénzek is teljesen digitálissá válnak...

hétfő 18:28

Az orka-csapatok már a cápabölcsődéket is vadásszák

🐴 Először sikerült felvételt készíteni arról, ahogy egy orkacsapat (gyilkos bálnák) fiatal nagy fehér cápákat támad meg a Kaliforniai-öbölben...

hétfő 18:20

Az év ajándékslágerei 2025-ben, mindenki ezekért rajong

2025-ben ismét kirobbanóan népszerű lett a Google által összeállított Holiday 100 toplista, amely a legkeresettebb ajándékokat vonultatja fel...

hétfő 18:10

Már a fiatal nagy fehér cápákat is megtámadják az orák

🐟 Az elmúlt években különleges orkapopulációra figyeltek fel a Kaliforniai-öbölben, amelynek tagjai mesteri módon vadásznak fiatal nagy fehér cápákra: a zsákmányt hasra fordítják, hogy könnyedén hozzájussanak a rendkívül tápanyagdús májhoz...