Orvosi kockázat, mégis lelkesen használják a halluzó MI-t

Orvosi kockázat, mégis lelkesen használják a halluzó MI-t
Az MI-modellek időnként “hallucinálnak” – azaz magabiztosan kitalálnak dolgokat – de ez a kutatók szerint nem elegendő ok arra, hogy kizárjuk őket az egészségügyi felhasználásból. Kutatók egy csoportja most feltérképezte a kockázatokat és tervet dolgozott ki, hogy miként lehet minimalizálni a károkat, miközben az orvosok továbbra is használhatják ezeket a nem mindig megbízható szoftverasszisztenseket. 25 technológiai és orvosi szakértő neves akadémiai és egészségügyi szervezetektől – köztük az MIT, a Harvard Orvosi Egyetem, a Washington Egyetem, a Carnegie Mellon Egyetem, a Szöuli Nemzeti Egyetemi Kórház, a Google, a Columbia Egyetem és a Johns Hopkins Egyetem – vállalta, hogy katalogizálja és elemzi az általános MI-modellek orvosi hallucinációit, azzal a céllal, hogy jobb szabályokat dolgozzanak ki az MI egészségügyi környezetben történő használatára.

Amikor az MI orvosnak képzeli magát

“Az orvosi hallucinációk szakmai kifejezéseket használnak és logikusnak tűnő érvelést mutatnak be, ami megnehezíti felismerésüket szakértői vizsgálat nélkül” – írják a szerzők a “Medical Hallucinations in Foundation Models and Their Impact on Healthcare” című tanulmányukban, amelyben amellett érvelnek, hogy kármegelőzési stratégiákra van szükség.

A szerzők abból indulnak ki, hogy az óriási neurális hálózatok – amelyeket emberek munkáján és egyéb adatokon képeztek ki – olyan cégektől, mint az Anthropic, a Google, a Meta és az OpenAI, “jelentős lehetőségeket kínálnak a klinikai döntéstámogatás javításától az orvosi kutatás átalakításán át az egészségügyi minőség és biztonság javításáig”.

A hallucinációk típusai és azok gyakorisága

A tanulmányban bemutatott taxonómia a következő kategóriákat tartalmazza: tárgyi tévedések; elavult hivatkozások; téves korrelációk; kitalált források vagy irányelvek; és hiányos érvelési láncok.

A szerzők öt általános célú nyelvi modell – o1, gemini-2.0-flash-exp, gpt-4o, gemini-1.5-flash és claude-3.5 sonnet – klinikai érvelési képességeit értékelték három célzott feladaton: események időrendi rendezése; laboratóriumi adatok értelmezése; és differenciáldiagnózis-generálás. A modelleket 0-tól (nincs kockázat) 5-ig (katasztrofális) terjedő skálán értékelték.

Az eredmények vegyesek voltak: “A diagnózis-előrejelzés mutatta következetesen a legalacsonyabb hallucinációs arányt minden modell között, 0 és 22 százalék között mozogva. Ezzel szemben a pontos tárgyi emlékezetet és időbeli integrációt igénylő feladatok – időrendi rendezés (0,25-24,6 százalék) és laboratóriumi adatok megértése (0,25-18,7 százalék) – jelentősen magasabb hallucinációs gyakoriságot mutattak.”

Az orvosok meglepően bizakodóak

A kutatók 75 orvos körében végeztek felmérést az MI-eszközök használatáról. Úgy tűnik, nincs visszaút: “40-en naponta használták ezeket az eszközöket, 9-en hetente többször, 13-an havonta néhányszor, és 13-an jelentettek ritka vagy nulla használatot” – írja a tanulmány, hozzátéve, hogy 30 válaszadó magas szintű bizalmat fejezett ki az MI-modell kimenetei iránt.

A szkepticizmus hiánya a résztvevők 40 százalékánál annál is meglepőbb, mivel “91,8 százalékuk tapasztalt már orvosi hallucinációt a klinikai gyakorlatban”, és “84,7 százalékuk megfontolta, hogy az általuk tapasztalt hallucináció potenciálisan befolyásolhatja a beteg egészségét”.

Elgondolkodhatunk azon, vajon az újonnan felvett orvosi személyzet számára megengedett lenne-e a hallucinációra hajlamos MI-modellekéhez hasonló hibaarány.


Sürgősen szabályozásra van szükség

A kutatók azzal zárják tanulmányukat, hogy hangsúlyozzák a szabályozások sürgős szükségességét, valamint a hibákért viselt jogi felelősség tisztázását.

“Ha egy MI-modell félrevezető diagnosztikai információkat ad ki, felmerül a kérdés, hogy a felelősséget az MI-fejlesztőre kell-e hárítani a képzési adatok esetleges hiányosságai miatt, az egészségügyi szolgáltatóra az átláthatatlan kimenetekre való túlzott támaszkodás miatt, vagy az intézményre a nem megfelelő felügyelet miatt” – mondják a szerzők.

Tekintettel a jelenlegi amerikai adminisztráció szövetségi szintű MI-politikai iránymutatásának hiányára, a kutatók felhívása “etikai irányelvekre és robusztus keretrendszerekre a betegbiztonság és elszámoltathatóság biztosítása érdekében” valószínűleg nem fog szövetségi szinten választ kapni.

  • Te hogyan kezelnéd a hibaarányokat, amikor újonnan felvett orvosi személyzetet képezel az MI-modellek használatára?
  • Mit tennél azért, hogy az orvosok jobban felismerjék az MI-modell által okozott "hallucinációkat"?
  • Szerinted ki legyen jogilag felelős, ha egy MI-modellel támogatott döntés betegséget okoz?



Legfrissebb posztok

Earendel, az univerzum hajnalcsillaga vagy csak űrbéli délibáb

MA 15:27

Earendel, az univerzum hajnalcsillaga vagy csak űrbéli délibáb

💫 Az univerzum kutatói újabb izgalmas felfedezést tettek, amikor a Hubble űrteleszkóp egy különleges gravitációs lencséződésnek köszönhetően 2022-ben rábukkant egy fényforrásra, amely közvetlenül az ősrobbanás után, a világegyetem születésével...

Az olcsóbb Xbox Cloud Gaming közelebb van, mint gondolnád

MA 14:51

Az olcsóbb Xbox Cloud Gaming közelebb van, mint gondolnád

A Microsoft ismét felvetette az ötletet, hogy elérhetőbbé teszi az Xbox Cloud Gaminget. Jelenleg ez a szolgáltatás csak az Xbox Game Pass Ultimate előfizetés részeként használható, ami havi...

Az ember formájú robotok cirkusza: bénázás és bunyó Kínában

MA 14:26

Az ember formájú robotok cirkusza: bénázás és bunyó Kínában

🤖 Kínában először rendezik meg a Humanoid Robotok Világjátékait (World Humanoid Robot Games), ahol több mint 500 robot, 16 országból érkezve méri össze erejét futásban, fociban, kick-boxban és számos...

Az OpenAI árazása miatt megindulhat az MI nagy árháborúja

MA 14:01

Az OpenAI árazása miatt megindulhat az MI nagy árháborúja

Az OpenAI mindenkit meglepett, amikor a héten néhány nap alatt két új MI-modellt adott ki, ráadásul elérhető áron. Az új GPT-5-öt a cég vezérigazgatója, Sam Altman, a világ...

Az MI-őrület miatt 15 ezermilliárd forint ment veszendőbe

MA 13:51

Az MI-őrület miatt 15 ezermilliárd forint ment veszendőbe

💸 Az amerikai vállalatok elképesztő, 12 250 és 14 000 milliárd forint (35–40 milliárd USD) közötti összeget költöttek generatív MI-kezdeményezésekre, mégis alig tudnak felmutatni kézzelfogható eredményeket. Egy friss kutatás...


MA 13:26

Az MI feltalálója, Mark Rober beköltözik a Netflixre

A világhírű YouTuber és egykori NASA-mérnök, Mark Rober hamarosan a Netflixen is megcsillogtatja tudományos kísérleteit. Rober különleges, edukatív videóival milliókat szórakoztat; többek között a hírhedt bűzös glitterbombát is...

Az MI végre emlékszik: Claude már a múltbeli beszélgetéseket is előhívja

MA 13:01

Az MI végre emlékszik: Claude már a múltbeli beszélgetéseket is előhívja

A legújabb fejlesztésnek köszönhetően Claude, az Anthropic MI chatbotja már képes előhívni a korábbi beszélgetéseidet – de csak ha te is akarod. Ez a funkció elsősorban a Max,...

Az ázsiai technológiai óriások zuhanása: A SoftBank drámai esése

MA 12:51

Az ázsiai technológiai óriások zuhanása: A SoftBank drámai esése

A SoftBank Group részvényei szerda reggel 9,2%-ot estek Tokióban, magukkal rántva az ázsiai technológiai vállalatok többségét is. Az eladási hullám Amerikából indult, miután az MI-sztár Nvidia gyengén teljesített,...

Az igazi viking titok: nem csak raboltak, kereskedtek is a Közel-Kelettel

MA 12:26

Az igazi viking titok: nem csak raboltak, kereskedtek is a Közel-Kelettel

🪑 1100 éves viking kincsleletet találtak Észak-Angliában, amely egészen új képet fest a vikingek gazdagságáról. A Bedale-kincs néven ismert lelet szó szerint mesél: arany karddísz, ezüst ékszerek, valamint 29...