Orvosi kockázat, mégis lelkesen használják a halluzó MI-t

Orvosi kockázat, mégis lelkesen használják a halluzó MI-t
Az MI-modellek időnként “hallucinálnak” – azaz magabiztosan kitalálnak dolgokat – de ez a kutatók szerint nem elegendő ok arra, hogy kizárjuk őket az egészségügyi felhasználásból. Kutatók egy csoportja most feltérképezte a kockázatokat és tervet dolgozott ki, hogy miként lehet minimalizálni a károkat, miközben az orvosok továbbra is használhatják ezeket a nem mindig megbízható szoftverasszisztenseket. 25 technológiai és orvosi szakértő neves akadémiai és egészségügyi szervezetektől – köztük az MIT, a Harvard Orvosi Egyetem, a Washington Egyetem, a Carnegie Mellon Egyetem, a Szöuli Nemzeti Egyetemi Kórház, a Google, a Columbia Egyetem és a Johns Hopkins Egyetem – vállalta, hogy katalogizálja és elemzi az általános MI-modellek orvosi hallucinációit, azzal a céllal, hogy jobb szabályokat dolgozzanak ki az MI egészségügyi környezetben történő használatára.

Amikor az MI orvosnak képzeli magát

“Az orvosi hallucinációk szakmai kifejezéseket használnak és logikusnak tűnő érvelést mutatnak be, ami megnehezíti felismerésüket szakértői vizsgálat nélkül” – írják a szerzők a “Medical Hallucinations in Foundation Models and Their Impact on Healthcare” című tanulmányukban, amelyben amellett érvelnek, hogy kármegelőzési stratégiákra van szükség.

A szerzők abból indulnak ki, hogy az óriási neurális hálózatok – amelyeket emberek munkáján és egyéb adatokon képeztek ki – olyan cégektől, mint az Anthropic, a Google, a Meta és az OpenAI, “jelentős lehetőségeket kínálnak a klinikai döntéstámogatás javításától az orvosi kutatás átalakításán át az egészségügyi minőség és biztonság javításáig”.

A hallucinációk típusai és azok gyakorisága

A tanulmányban bemutatott taxonómia a következő kategóriákat tartalmazza: tárgyi tévedések; elavult hivatkozások; téves korrelációk; kitalált források vagy irányelvek; és hiányos érvelési láncok.

A szerzők öt általános célú nyelvi modell – o1, gemini-2.0-flash-exp, gpt-4o, gemini-1.5-flash és claude-3.5 sonnet – klinikai érvelési képességeit értékelték három célzott feladaton: események időrendi rendezése; laboratóriumi adatok értelmezése; és differenciáldiagnózis-generálás. A modelleket 0-tól (nincs kockázat) 5-ig (katasztrofális) terjedő skálán értékelték.

Az eredmények vegyesek voltak: “A diagnózis-előrejelzés mutatta következetesen a legalacsonyabb hallucinációs arányt minden modell között, 0 és 22 százalék között mozogva. Ezzel szemben a pontos tárgyi emlékezetet és időbeli integrációt igénylő feladatok – időrendi rendezés (0,25-24,6 százalék) és laboratóriumi adatok megértése (0,25-18,7 százalék) – jelentősen magasabb hallucinációs gyakoriságot mutattak.”

Az orvosok meglepően bizakodóak

A kutatók 75 orvos körében végeztek felmérést az MI-eszközök használatáról. Úgy tűnik, nincs visszaút: “40-en naponta használták ezeket az eszközöket, 9-en hetente többször, 13-an havonta néhányszor, és 13-an jelentettek ritka vagy nulla használatot” – írja a tanulmány, hozzátéve, hogy 30 válaszadó magas szintű bizalmat fejezett ki az MI-modell kimenetei iránt.

A szkepticizmus hiánya a résztvevők 40 százalékánál annál is meglepőbb, mivel “91,8 százalékuk tapasztalt már orvosi hallucinációt a klinikai gyakorlatban”, és “84,7 százalékuk megfontolta, hogy az általuk tapasztalt hallucináció potenciálisan befolyásolhatja a beteg egészségét”.

Elgondolkodhatunk azon, vajon az újonnan felvett orvosi személyzet számára megengedett lenne-e a hallucinációra hajlamos MI-modellekéhez hasonló hibaarány.


Sürgősen szabályozásra van szükség

A kutatók azzal zárják tanulmányukat, hogy hangsúlyozzák a szabályozások sürgős szükségességét, valamint a hibákért viselt jogi felelősség tisztázását.

“Ha egy MI-modell félrevezető diagnosztikai információkat ad ki, felmerül a kérdés, hogy a felelősséget az MI-fejlesztőre kell-e hárítani a képzési adatok esetleges hiányosságai miatt, az egészségügyi szolgáltatóra az átláthatatlan kimenetekre való túlzott támaszkodás miatt, vagy az intézményre a nem megfelelő felügyelet miatt” – mondják a szerzők.

Tekintettel a jelenlegi amerikai adminisztráció szövetségi szintű MI-politikai iránymutatásának hiányára, a kutatók felhívása “etikai irányelvekre és robusztus keretrendszerekre a betegbiztonság és elszámoltathatóság biztosítása érdekében” valószínűleg nem fog szövetségi szinten választ kapni.

  • Te hogyan kezelnéd a hibaarányokat, amikor újonnan felvett orvosi személyzetet képezel az MI-modellek használatára?
  • Mit tennél azért, hogy az orvosok jobban felismerjék az MI-modell által okozott "hallucinációkat"?
  • Szerinted ki legyen jogilag felelős, ha egy MI-modellel támogatott döntés betegséget okoz?


Legfrissebb posztok

MA 07:57

A Grubhub sem úszta meg: adatlopási hullám csapott le

A Grubhub ételrendelő platform elismerte, hogy hekkerek illetéktelenül hozzáfértek a rendszereihez, megszerezve érzékeny adatokat, és a cég most zsarolási kísérlettel is szembesül...

MA 07:51

Egy filléres kendő harmadára vágja a maláriát a babáknál

Évszázadok óta hátukon viszik a kisbabákat az anyák Kelet-Afrikától Latin-Amerikán át Ázsiáig, egyszerű vászonkendőkbe kötözve őket...

MA 07:43

A világegyetem ragadós massza? Erre senki sem számított

🧠 Világegyetemünk működését leíró jelenlegi modelljei nehezen magyarázzák meg a legfrissebb csillagászati megfigyeléseket, hacsak nem tekintjük az űrt furcsa módon ragadós folyadéknak...

MA 07:37

Az esélyegyenlőség nyitja: a mentorálás a német gyerekekért

📚 A német oktatási rendszerben továbbra is erősen meghatározza a szociális háttér, hogy a gyerekek milyen iskolatípusba kerülnek negyedik osztály után...

MA 07:29

Az elméleti fizika nagy vitája: tévedhet a speciális relativitáselmélet?

⚠ A Lorentz-invariancia, vagyis az az elképzelés, hogy az univerzum minden pontján ugyanazok a fizikai törvények érvényesek, a speciális relativitáselmélet egyik alappillére...

MA 07:22

Az újabb szenátusi halasztás padlóra küldi a Bitcoint

💸 A kriptovaluta-piac csütörtökön megtorpant, miután az amerikai szenátus elhalasztotta az egyik legfontosabb szabályozási törvényjavaslat megtárgyalását...

MA 07:15

A valódi véletlen lézer: meglepően kiszámíthatatlan

Egy lényeges szempont, hogy a lézerek világában a véletlen lézer fogalma első hallásra ellentmondásosnak tűnhet...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 1/16

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     خط (iPhone/iPad)A خط egy alkalmazás, amely lehetővé teszi, hogy szép arab betűtípusokkal írj szöveget képekre...

MA 07:03

Az egészségesnek mondott üdítők: leleplezzük a wellness-mítoszt

Az egészséges üdítők trendje továbbra is tarol – a nagy üdítőgyártók sorra jelennek meg prebiotikus szódaújdonságokkal...

MA 06:57

A Spotify megint drágul – most a pénztárcád kapja a refrént

Több mint egy évtizednyi stabil árazás után a Spotify ismét emel: a Premium előfizetés ára februártól 4 750 forintról 5 150 forintra nő havonta...

MA 06:50

Az AMD processzorokat egyetlen bithiba is sebezhetővé teheti

Érdemes megérteni, hogy az AMD processzorok legújabb sérülékenysége komoly fejtörést okoz a virtualizációban, különösen azoknak, akik felhőszolgáltatásokban vagy virtualizált környezetekben dolgoznak...

MA 06:43

Az amerikaiak rajonganak a tudományért, mégis tartanak Amerika lemaradásától

Az Egyesült Államok lakosságának túlnyomó többsége fontosnak tartja, hogy az ország élen járjon a tudományban...

MA 06:37

Az eltűnő tengeri fűmezők rejtett kincsei

🐠 Amikor azt vizsgáljuk, hogy a természet közelsége miként javíthatja a közérzetünket, sokan inkább erdőkre vagy a beporzókat támogató gazdag élőhelyekre gondolnak...

MA 06:29

Az USA óriási chipmegállapodása dollármilliárdokat hoz Tajvannak

Az Egyesült Államok és Tajvan most kötött megállapodása 250 milliárd dolláros (kb...

MA 06:23

Az új űrtávcső vadászatra indul: százezer exobolygó nyomában

A NASA monumentális új Roman űrtávcsöve elkészült, és már a közeljövőben óriási exobolygó-vadászatra indul...

MA 06:08

A legzsírosabb fizetéseket az ingatlanmágnások gyermekei zsebelik be

💰 A brit lakáspiaci fellendülés három évtizeddel ezelőtt örökre megváltoztatta a vagyoni viszonyokat: a háztulajdonos szülők gyerekei ma is sokkal előnyösebb helyzetből indulnak, különösen a fiúk...

MA 06:06

Történelmi események a mai napon (Január 16.)

Ezen a napon ostromok dőltek el, birodalmak születtek és háborúk kezdődtek, miközben mérföldkövek születtek a jogban, a kultúrában és az űrkutatásban...

MA 06:02

Az első űrhajós-evakuálás az ISS-ről orvosi vészhelyzet miatt

🛸 A NASA történetének egyik legemlékezetesebb fejezete zárult le: orvosi vészhelyzet miatt először kellett sürgősen hazahozni egy űrhajóst a Nemzetközi Űrállomásról (ISS)...

csütörtök 20:49

A Paramount+ durván emel: ennyivel lesz drágább az előfizetés

2026 sem marad áremelés nélkül: a Paramount Plus streaming szolgáltatás díjai mostantól magasabbak...