Orvosi kockázat, mégis lelkesen használják a halluzó MI-t

Orvosi kockázat, mégis lelkesen használják a halluzó MI-t
Az MI-modellek időnként “hallucinálnak” – azaz magabiztosan kitalálnak dolgokat – de ez a kutatók szerint nem elegendő ok arra, hogy kizárjuk őket az egészségügyi felhasználásból. Kutatók egy csoportja most feltérképezte a kockázatokat és tervet dolgozott ki, hogy miként lehet minimalizálni a károkat, miközben az orvosok továbbra is használhatják ezeket a nem mindig megbízható szoftverasszisztenseket. 25 technológiai és orvosi szakértő neves akadémiai és egészségügyi szervezetektől – köztük az MIT, a Harvard Orvosi Egyetem, a Washington Egyetem, a Carnegie Mellon Egyetem, a Szöuli Nemzeti Egyetemi Kórház, a Google, a Columbia Egyetem és a Johns Hopkins Egyetem – vállalta, hogy katalogizálja és elemzi az általános MI-modellek orvosi hallucinációit, azzal a céllal, hogy jobb szabályokat dolgozzanak ki az MI egészségügyi környezetben történő használatára.

Amikor az MI orvosnak képzeli magát

“Az orvosi hallucinációk szakmai kifejezéseket használnak és logikusnak tűnő érvelést mutatnak be, ami megnehezíti felismerésüket szakértői vizsgálat nélkül” – írják a szerzők a “Medical Hallucinations in Foundation Models and Their Impact on Healthcare” című tanulmányukban, amelyben amellett érvelnek, hogy kármegelőzési stratégiákra van szükség.

A szerzők abból indulnak ki, hogy az óriási neurális hálózatok – amelyeket emberek munkáján és egyéb adatokon képeztek ki – olyan cégektől, mint az Anthropic, a Google, a Meta és az OpenAI, “jelentős lehetőségeket kínálnak a klinikai döntéstámogatás javításától az orvosi kutatás átalakításán át az egészségügyi minőség és biztonság javításáig”.

A hallucinációk típusai és azok gyakorisága

A tanulmányban bemutatott taxonómia a következő kategóriákat tartalmazza: tárgyi tévedések; elavult hivatkozások; téves korrelációk; kitalált források vagy irányelvek; és hiányos érvelési láncok.

A szerzők öt általános célú nyelvi modell – o1, gemini-2.0-flash-exp, gpt-4o, gemini-1.5-flash és claude-3.5 sonnet – klinikai érvelési képességeit értékelték három célzott feladaton: események időrendi rendezése; laboratóriumi adatok értelmezése; és differenciáldiagnózis-generálás. A modelleket 0-tól (nincs kockázat) 5-ig (katasztrofális) terjedő skálán értékelték.

Az eredmények vegyesek voltak: “A diagnózis-előrejelzés mutatta következetesen a legalacsonyabb hallucinációs arányt minden modell között, 0 és 22 százalék között mozogva. Ezzel szemben a pontos tárgyi emlékezetet és időbeli integrációt igénylő feladatok – időrendi rendezés (0,25-24,6 százalék) és laboratóriumi adatok megértése (0,25-18,7 százalék) – jelentősen magasabb hallucinációs gyakoriságot mutattak.”

Az orvosok meglepően bizakodóak

A kutatók 75 orvos körében végeztek felmérést az MI-eszközök használatáról. Úgy tűnik, nincs visszaút: “40-en naponta használták ezeket az eszközöket, 9-en hetente többször, 13-an havonta néhányszor, és 13-an jelentettek ritka vagy nulla használatot” – írja a tanulmány, hozzátéve, hogy 30 válaszadó magas szintű bizalmat fejezett ki az MI-modell kimenetei iránt.

A szkepticizmus hiánya a résztvevők 40 százalékánál annál is meglepőbb, mivel “91,8 százalékuk tapasztalt már orvosi hallucinációt a klinikai gyakorlatban”, és “84,7 százalékuk megfontolta, hogy az általuk tapasztalt hallucináció potenciálisan befolyásolhatja a beteg egészségét”.

Elgondolkodhatunk azon, vajon az újonnan felvett orvosi személyzet számára megengedett lenne-e a hallucinációra hajlamos MI-modellekéhez hasonló hibaarány.


Sürgősen szabályozásra van szükség

A kutatók azzal zárják tanulmányukat, hogy hangsúlyozzák a szabályozások sürgős szükségességét, valamint a hibákért viselt jogi felelősség tisztázását.

“Ha egy MI-modell félrevezető diagnosztikai információkat ad ki, felmerül a kérdés, hogy a felelősséget az MI-fejlesztőre kell-e hárítani a képzési adatok esetleges hiányosságai miatt, az egészségügyi szolgáltatóra az átláthatatlan kimenetekre való túlzott támaszkodás miatt, vagy az intézményre a nem megfelelő felügyelet miatt” – mondják a szerzők.

Tekintettel a jelenlegi amerikai adminisztráció szövetségi szintű MI-politikai iránymutatásának hiányára, a kutatók felhívása “etikai irányelvekre és robusztus keretrendszerekre a betegbiztonság és elszámoltathatóság biztosítása érdekében” valószínűleg nem fog szövetségi szinten választ kapni.

  • Te hogyan kezelnéd a hibaarányokat, amikor újonnan felvett orvosi személyzetet képezel az MI-modellek használatára?
  • Mit tennél azért, hogy az orvosok jobban felismerjék az MI-modell által okozott "hallucinációkat"?
  • Szerinted ki legyen jogilag felelős, ha egy MI-modellel támogatott döntés betegséget okoz?


Legfrissebb posztok

MA 09:22

A Nano Banana tarol a neten: ki áll mögötte?

Aki valaha találkozott MI-alapú képgenerátorokkal, nagy eséllyel látott már Nano Banana által készített képet, akár anélkül is, hogy tudta volna...

MA 09:15

Az ősi kannabiszenzimek visszatérnek: új korszak jön az orvoslásban?

🌾 A Wageningeni Egyetem kutatói sikeresen rekonstruálták a kannabisz évmilliókkal ezelőtti enzimjeit, amelyek kulcsszerepet játszottak a jól ismert hatóanyagok – például a THC, CBD és CBC – kialakulásában...

MA 09:08

Az eltitkolt igazság: a Boeing tudott a végzetes UPS-géphibáról

📦 Egy 2023 novemberében, Kentuckyban lezuhant UPS MD-11F teherszállító repülőgépen kritikus szerkezeti hibát találtak a nyomozók, amelynek veszélyeiről a Boeing már 15 évvel korábban tudott hasonló típusoknál...

MA 09:01

A népszerű WordPress-bővítmény hibája adminjogot ad a támadóknak

⚠ Több mint 40 000 WordPress-oldalt veszélyeztet az a súlyos sebezhetőség, amelyet a Modular DS nevű bővítményben fedeztek fel...

MA 08:57

Az okoskarkötő, ami fenekestül felforgatja a fogamzásgátlást

A Natural Cycles, az ismert MI-alapú fogamzásgátló alkalmazás fejlesztője egy új karkötővel rukkolt elő, amely a hőmérő helyett használható...

MA 08:51

Az OpenAI óriásüzletet kötött: villámgyorsabb válaszok jönnek a ChatGPT-től

Az OpenAI 2028-ig 750 megawatt teljesítményű, tányérméretű gyorsítókat vásárol a Cerebrastól, hogy jelentősen felgyorsítsa a ChatGPT MI-szolgáltatásait...

MA 08:44

Az új kriptotörvény elbukott – de ez még nem a vége

💸 Az amerikai szenátorok az utolsó pillanatban lefújták egy jelentős, kriptovalutákat szabályozó törvénytervezet bizottsági szavazását, miután több pontban sem sikerült megegyezni...

MA 08:37

Az első orvosi vészhelyzet miatti űrevakuálás sikerrel ért véget

Felmerül a kérdés, mennyire felkészült a modern űrutazás a váratlan egészségügyi helyzetekre...

MA 08:29

Az MI-láz tetőfokán: így ne rontsd el mesterséges ügynökeidet

A mesterséges intelligencia már nemcsak eszköz, hanem képesség, amely minden szervezet működését felforgatja...

MA 08:22

Az új Gmail-cím hamarosan bárkié lehet

Sokan évek óta bosszankodnak, hogy nem változtathatják meg nevetséges vagy rosszul megválasztott Gmail-címüket...

MA 08:15

Az OpenAI végre tényleg érti a korábbi kérdéseidet

A ChatGPT mostantól megbízhatóbban keres és emlékszik a korábbi beszélgetéseidre, de egyelőre csak a Plus- és Pro-előfizetők számára érhető el az új fejlesztés...

MA 08:08

A Gmail nagy dobása: végre megváltoztatható az e‑mail‑címed

📧 Mostantól lehetőség nyílik arra, amire sokan vártak: a Google engedélyezi, hogy megváltoztasd a @gmail...

MA 08:03

Az arizonai csipforradalom berobban: rekordösszeggel terjeszkedik a TSMC

🚀 A világ legnagyobb bérgyártó chipvállalata, a TSMC tovább emeli tétjét az amerikai gyártásban: az eddigi 61 ezermilliárd forintos (165 milliárd dollár) kötelezettségvállalást további óriásberuházások követik Arizonában...

MA 07:57

A Grubhub sem úszta meg: adatlopási hullám csapott le

A Grubhub ételrendelő platform elismerte, hogy hekkerek illetéktelenül hozzáfértek a rendszereihez, megszerezve érzékeny adatokat, és a cég most zsarolási kísérlettel is szembesül...

MA 07:51

Egy filléres kendő harmadára vágja a maláriát a babáknál

Évszázadok óta hátukon viszik a kisbabákat az anyák Kelet-Afrikától Latin-Amerikán át Ázsiáig, egyszerű vászonkendőkbe kötözve őket...

MA 07:43

A világegyetem ragadós massza? Erre senki sem számított

🧠 Világegyetemünk működését leíró jelenlegi modelljei nehezen magyarázzák meg a legfrissebb csillagászati megfigyeléseket, hacsak nem tekintjük az űrt furcsa módon ragadós folyadéknak...

MA 07:37

Az esélyegyenlőség nyitja: a mentorálás a német gyerekekért

📚 A német oktatási rendszerben továbbra is erősen meghatározza a szociális háttér, hogy a gyerekek milyen iskolatípusba kerülnek negyedik osztály után...

MA 07:29

Az elméleti fizika nagy vitája: tévedhet a speciális relativitáselmélet?

⚠ A Lorentz-invariancia, vagyis az az elképzelés, hogy az univerzum minden pontján ugyanazok a fizikai törvények érvényesek, a speciális relativitáselmélet egyik alappillére...

MA 07:22

Az újabb szenátusi halasztás padlóra küldi a Bitcoint

💸 A kriptovaluta-piac csütörtökön megtorpant, miután az amerikai szenátus elhalasztotta az egyik legfontosabb szabályozási törvényjavaslat megtárgyalását...