Orvosi kockázat, mégis lelkesen használják a halluzó MI-t

Orvosi kockázat, mégis lelkesen használják a halluzó MI-t
Az MI-modellek időnként “hallucinálnak” – azaz magabiztosan kitalálnak dolgokat – de ez a kutatók szerint nem elegendő ok arra, hogy kizárjuk őket az egészségügyi felhasználásból. Kutatók egy csoportja most feltérképezte a kockázatokat és tervet dolgozott ki, hogy miként lehet minimalizálni a károkat, miközben az orvosok továbbra is használhatják ezeket a nem mindig megbízható szoftverasszisztenseket. 25 technológiai és orvosi szakértő neves akadémiai és egészségügyi szervezetektől – köztük az MIT, a Harvard Orvosi Egyetem, a Washington Egyetem, a Carnegie Mellon Egyetem, a Szöuli Nemzeti Egyetemi Kórház, a Google, a Columbia Egyetem és a Johns Hopkins Egyetem – vállalta, hogy katalogizálja és elemzi az általános MI-modellek orvosi hallucinációit, azzal a céllal, hogy jobb szabályokat dolgozzanak ki az MI egészségügyi környezetben történő használatára.

Amikor az MI orvosnak képzeli magát

“Az orvosi hallucinációk szakmai kifejezéseket használnak és logikusnak tűnő érvelést mutatnak be, ami megnehezíti felismerésüket szakértői vizsgálat nélkül” – írják a szerzők a “Medical Hallucinations in Foundation Models and Their Impact on Healthcare” című tanulmányukban, amelyben amellett érvelnek, hogy kármegelőzési stratégiákra van szükség.

A szerzők abból indulnak ki, hogy az óriási neurális hálózatok – amelyeket emberek munkáján és egyéb adatokon képeztek ki – olyan cégektől, mint az Anthropic, a Google, a Meta és az OpenAI, “jelentős lehetőségeket kínálnak a klinikai döntéstámogatás javításától az orvosi kutatás átalakításán át az egészségügyi minőség és biztonság javításáig”.

A hallucinációk típusai és azok gyakorisága

A tanulmányban bemutatott taxonómia a következő kategóriákat tartalmazza: tárgyi tévedések; elavult hivatkozások; téves korrelációk; kitalált források vagy irányelvek; és hiányos érvelési láncok.

A szerzők öt általános célú nyelvi modell – o1, gemini-2.0-flash-exp, gpt-4o, gemini-1.5-flash és claude-3.5 sonnet – klinikai érvelési képességeit értékelték három célzott feladaton: események időrendi rendezése; laboratóriumi adatok értelmezése; és differenciáldiagnózis-generálás. A modelleket 0-tól (nincs kockázat) 5-ig (katasztrofális) terjedő skálán értékelték.

Az eredmények vegyesek voltak: “A diagnózis-előrejelzés mutatta következetesen a legalacsonyabb hallucinációs arányt minden modell között, 0 és 22 százalék között mozogva. Ezzel szemben a pontos tárgyi emlékezetet és időbeli integrációt igénylő feladatok – időrendi rendezés (0,25-24,6 százalék) és laboratóriumi adatok megértése (0,25-18,7 százalék) – jelentősen magasabb hallucinációs gyakoriságot mutattak.”

Az orvosok meglepően bizakodóak

A kutatók 75 orvos körében végeztek felmérést az MI-eszközök használatáról. Úgy tűnik, nincs visszaút: “40-en naponta használták ezeket az eszközöket, 9-en hetente többször, 13-an havonta néhányszor, és 13-an jelentettek ritka vagy nulla használatot” – írja a tanulmány, hozzátéve, hogy 30 válaszadó magas szintű bizalmat fejezett ki az MI-modell kimenetei iránt.

A szkepticizmus hiánya a résztvevők 40 százalékánál annál is meglepőbb, mivel “91,8 százalékuk tapasztalt már orvosi hallucinációt a klinikai gyakorlatban”, és “84,7 százalékuk megfontolta, hogy az általuk tapasztalt hallucináció potenciálisan befolyásolhatja a beteg egészségét”.

Elgondolkodhatunk azon, vajon az újonnan felvett orvosi személyzet számára megengedett lenne-e a hallucinációra hajlamos MI-modellekéhez hasonló hibaarány.


Sürgősen szabályozásra van szükség

A kutatók azzal zárják tanulmányukat, hogy hangsúlyozzák a szabályozások sürgős szükségességét, valamint a hibákért viselt jogi felelősség tisztázását.

“Ha egy MI-modell félrevezető diagnosztikai információkat ad ki, felmerül a kérdés, hogy a felelősséget az MI-fejlesztőre kell-e hárítani a képzési adatok esetleges hiányosságai miatt, az egészségügyi szolgáltatóra az átláthatatlan kimenetekre való túlzott támaszkodás miatt, vagy az intézményre a nem megfelelő felügyelet miatt” – mondják a szerzők.

Tekintettel a jelenlegi amerikai adminisztráció szövetségi szintű MI-politikai iránymutatásának hiányára, a kutatók felhívása “etikai irányelvekre és robusztus keretrendszerekre a betegbiztonság és elszámoltathatóság biztosítása érdekében” valószínűleg nem fog szövetségi szinten választ kapni.

  • Te hogyan kezelnéd a hibaarányokat, amikor újonnan felvett orvosi személyzetet képezel az MI-modellek használatára?
  • Mit tennél azért, hogy az orvosok jobban felismerjék az MI-modell által okozott "hallucinációkat"?
  • Szerinted ki legyen jogilag felelős, ha egy MI-modellel támogatott döntés betegséget okoz?


Legfrissebb posztok

csütörtök 18:24

Penrose szám: A bizonyíték Isten létére?

Sir Roger Penrose brit matematikus és elméleti fizikus, aki a fekete lyukak szingularitásának és az általános relativitáselmélet új matematikai alapjainak feltárásáért kapott Nobel-díjat, az 1970-es években sokkoló, a tudományos világot megosztó tézist közölt...

MA 15:19

A kihunyt fények nyomában: UFO-k vagy titkos atomkísérletek?

🛰 Fontos kérdés, hogy több mint hetven évvel ezelőtt Kaliforniában, a Palomar Obszervatórium csillagászai különös, csillagszerű fényvillanásokat fotóztak az égbolton: ezek a pontok egy órán belül megjelentek, majd eltűntek — mindez jóval az első műhold, a Szputnyik–1 (Sputnik 1) fellövése előtt...

MA 15:01

Az ego feloldódásának titka: így írja át agyhullámainkat a DMT

A pszichedelikus szerek, mint a DMT, képesek mélyen átalakítani a szubjektív élményt és az agy működését...

MA 14:49

A nyugdíjkorhatár-döntések kulisszatitkai

A papíron egyszerű számolással ki lehet számolni, hogy a nyugdíj optimalizálásának legjobb módja, ha valaki minél később, akár 70 évesen igényli a társadalombiztosítási ellátást...

MA 14:33

Az AirDrop megbolondítja a Google Pixel 10-et

🔁 A Google nagy meglepetésre elhozta az AirDrop funkciót a Pixel 10-re, mindenféle Apple-segítség nélkül...

MA 14:17

Az edzés sem ment meg a szmog ártalmaitól?

🏃 A rendszeres mozgás rengeteg egészségügyi előnnyel jár: csökkenti a szívbetegségek, a rák és a korai halálozás esélyét, javítja a testi-lelki állapotot...

MA 14:02

A végtelen sörhab titkát végre megfejtették a svájci kutatók

Sokan úgy érzik, hogy egy hideg sör csak vastag, krémes habkoronával az igazi – ám a hab általában gyorsan összeesik, mire a korsóhoz nyúlnánk...

MA 13:49

Az EU keményít: a DMA az Apple hirdetéseit és térképeit is érintheti

Az Európai Bizottság vizsgálatot indít, hogy az Apple hirdetési szolgáltatása, az Apple Ads, és térképszolgáltatása, az Apple Maps a Digital Markets Act (DMA) nevű szabályozás szigorú előírásai alá tartoznak-e...

MA 13:33

A kannabiszboltok megbetegítik a környéket

💉 A kutatók több mint hatmillió ember adatait elemezték, hogy feltárják, milyen hatással van a kannabiszboltok közelsége a lakosok egészségére...

MA 13:17

Az álmaink velünk nőnek: így alakulnak át az évek során

💫 Gyerekként az álmok világa egészen más, mint idős korban, egy hospice-ágyban...

MA 12:49

Az agy öntisztító rendszere észrevétlenül károsodhat sorozatos fejsérülések után

😷 Felmerül a kérdés, milyen hosszú távú hatásai lehetnek a sportolóknál ismételten elszenvedett fejsérüléseknek, különösen ökölvívók és MMA-harcosok esetében...

MA 12:17

A vérben lapul az öregedés elleni új csodafegyver?

💊 Új, vérben élő baktérium által termelt vegyületeket fedeztek fel, amelyek meglepően hatékonyak lehetnek a bőr öregedése ellen...

MA 12:04

A végső töréspont: meddig bírja az emberi kitartás?

💪 Mi történik, ha a test tartósan a végletekig terhelődik? Elit ultrafutók, kerékpárosok és triatlonisták segítségével a tudósok most választ kerestek erre, és sikerült felfedniük az emberi állóképesség láthatatlan plafonját...

MA 12:01

A Perseverance marsjáró már a Napot is kémleli

👌 A NASA új feladatot adott a Marson dolgozó Perseverance marsjárónak: a következő két hónapban naponta készít felvételt a Napról, hogy adatokat gyűjtsön a napfoltokról és más naptevékenységekről...

MA 11:50

Az IT-biztonság megöli a lelkesedést? Itt a kiégés ellenszere

A kiberbiztonsági szektorban dolgozni valódi kihívás – a szakma lüktető tempója és a folyamatos éberség nem ismer pihenőt...

MA 11:17

Az ausztrál őslakosok ősi múltja: 60 ezer év és hobbit-rokonság?

Több mint 2 400 ősi és mai óceániai ember genetikai vizsgálata alapján a kutatók egyre biztosabbak abban, hogy az emberek már 60 000 éve megtelepedtek Észak-Ausztráliában...

MA 11:01

Az egyetlen matekos amerikai elnök: Garfield meglepő bizonyítása

😎 James A. Garfield, az Egyesült Államok 20. elnöke nemcsak politikai pályán, hanem a matematikában is maradandót alkotott: 1876-ban önálló bizonyítást adott a Pitagorasz-tételhez...

MA 10:58

Az iskolák lemaradtak: háttérbe szorul az MI-korszak írása

📚 Az írástudás már régen nemcsak a toll és a papír használatát jelenti – digitális eszközökkel írni ma elengedhetetlen készség...

MA 10:50

Az adatvédelemnek üzent hadat Franciaország: menekül a GrapheneOS

A mobilos operációs rendszert fejlesztő GrapheneOS elhagyta a francia OVHcloud szervereit, mert úgy látják, Franciaország veszélyes hely az adatvédelmet előtérbe helyező, nyílt forráskódú projektek számára...