2025. 03. 14., 12:16

Orvosi kockázat, mégis lelkesen használják a halluzó MI-t

Orvosi kockázat, mégis lelkesen használják a halluzó MI-t
Az MI-modellek időnként “hallucinálnak” – azaz magabiztosan kitalálnak dolgokat – de ez a kutatók szerint nem elegendő ok arra, hogy kizárjuk őket az egészségügyi felhasználásból. Kutatók egy csoportja most feltérképezte a kockázatokat és tervet dolgozott ki, hogy miként lehet minimalizálni a károkat, miközben az orvosok továbbra is használhatják ezeket a nem mindig megbízható szoftverasszisztenseket. 25 technológiai és orvosi szakértő neves akadémiai és egészségügyi szervezetektől – köztük az MIT, a Harvard Orvosi Egyetem, a Washington Egyetem, a Carnegie Mellon Egyetem, a Szöuli Nemzeti Egyetemi Kórház, a Google, a Columbia Egyetem és a Johns Hopkins Egyetem – vállalta, hogy katalogizálja és elemzi az általános MI-modellek orvosi hallucinációit, azzal a céllal, hogy jobb szabályokat dolgozzanak ki az MI egészségügyi környezetben történő használatára.

Amikor az MI orvosnak képzeli magát

“Az orvosi hallucinációk szakmai kifejezéseket használnak és logikusnak tűnő érvelést mutatnak be, ami megnehezíti felismerésüket szakértői vizsgálat nélkül” – írják a szerzők a “Medical Hallucinations in Foundation Models and Their Impact on Healthcare” című tanulmányukban, amelyben amellett érvelnek, hogy kármegelőzési stratégiákra van szükség.

A szerzők abból indulnak ki, hogy az óriási neurális hálózatok – amelyeket emberek munkáján és egyéb adatokon képeztek ki – olyan cégektől, mint az Anthropic, a Google, a Meta és az OpenAI, “jelentős lehetőségeket kínálnak a klinikai döntéstámogatás javításától az orvosi kutatás átalakításán át az egészségügyi minőség és biztonság javításáig”.

A hallucinációk típusai és azok gyakorisága

A tanulmányban bemutatott taxonómia a következő kategóriákat tartalmazza: tárgyi tévedések; elavult hivatkozások; téves korrelációk; kitalált források vagy irányelvek; és hiányos érvelési láncok.

A szerzők öt általános célú nyelvi modell – o1, gemini-2.0-flash-exp, gpt-4o, gemini-1.5-flash és claude-3.5 sonnet – klinikai érvelési képességeit értékelték három célzott feladaton: események időrendi rendezése; laboratóriumi adatok értelmezése; és differenciáldiagnózis-generálás. A modelleket 0-tól (nincs kockázat) 5-ig (katasztrofális) terjedő skálán értékelték.

Az eredmények vegyesek voltak: “A diagnózis-előrejelzés mutatta következetesen a legalacsonyabb hallucinációs arányt minden modell között, 0 és 22 százalék között mozogva. Ezzel szemben a pontos tárgyi emlékezetet és időbeli integrációt igénylő feladatok – időrendi rendezés (0,25-24,6 százalék) és laboratóriumi adatok megértése (0,25-18,7 százalék) – jelentősen magasabb hallucinációs gyakoriságot mutattak.”

Az orvosok meglepően bizakodóak

A kutatók 75 orvos körében végeztek felmérést az MI-eszközök használatáról. Úgy tűnik, nincs visszaút: “40-en naponta használták ezeket az eszközöket, 9-en hetente többször, 13-an havonta néhányszor, és 13-an jelentettek ritka vagy nulla használatot” – írja a tanulmány, hozzátéve, hogy 30 válaszadó magas szintű bizalmat fejezett ki az MI-modell kimenetei iránt.

A szkepticizmus hiánya a résztvevők 40 százalékánál annál is meglepőbb, mivel “91,8 százalékuk tapasztalt már orvosi hallucinációt a klinikai gyakorlatban”, és “84,7 százalékuk megfontolta, hogy az általuk tapasztalt hallucináció potenciálisan befolyásolhatja a beteg egészségét”.

Elgondolkodhatunk azon, vajon az újonnan felvett orvosi személyzet számára megengedett lenne-e a hallucinációra hajlamos MI-modellekéhez hasonló hibaarány.


Sürgősen szabályozásra van szükség

A kutatók azzal zárják tanulmányukat, hogy hangsúlyozzák a szabályozások sürgős szükségességét, valamint a hibákért viselt jogi felelősség tisztázását.

“Ha egy MI-modell félrevezető diagnosztikai információkat ad ki, felmerül a kérdés, hogy a felelősséget az MI-fejlesztőre kell-e hárítani a képzési adatok esetleges hiányosságai miatt, az egészségügyi szolgáltatóra az átláthatatlan kimenetekre való túlzott támaszkodás miatt, vagy az intézményre a nem megfelelő felügyelet miatt” – mondják a szerzők.

Tekintettel a jelenlegi amerikai adminisztráció szövetségi szintű MI-politikai iránymutatásának hiányára, a kutatók felhívása “etikai irányelvekre és robusztus keretrendszerekre a betegbiztonság és elszámoltathatóság biztosítása érdekében” valószínűleg nem fog szövetségi szinten választ kapni.

  • Te hogyan kezelnéd a hibaarányokat, amikor újonnan felvett orvosi személyzetet képezel az MI-modellek használatára?
  • Mit tennél azért, hogy az orvosok jobban felismerjék az MI-modell által okozott "hallucinációkat"?
  • Szerinted ki legyen jogilag felelős, ha egy MI-modellel támogatott döntés betegséget okoz?


Legfrissebb posztok

MA 09:16

Egy parancs, és bármely nyílt forrású repo MI-hátsó ajtó lesz

🔒 Érdemes megvizsgálni, hogy forradalmi gyorsasággal terjednek az ügynökalapú MI-eszközök a nyílt forrású fejlesztések világában, amelyekkel akár egyetlen parancs is megkerülheti a teljes biztonsági védvonalakat...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/6

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Rhythmicity Rhythm Trainer (iPhone/iPad)A Rhythm Trainer by Rhythmicity egy fizika alapú gyakorlóalkalmazás, amelyet zenészek, diákok és tanárok használnak...

MA 09:09

Az elszállt Mars-álom: Musk, OpenAI és az eltűnt 80 milliárd

🚀 Elon Musk ambiciózus terve, hogy embereket telepítsen a Marsra, ismét a figyelem középpontjába került, amikor Greg Brockman, az OpenAI elnöke a bíróságon tanúskodott az OpenAI jövőjét is meghatározó per egyik kulcsszereplőjeként...

MA 08:57

Az XRP 1,42 dollár felett: Jöhet a 66%-os 2025-ös rali?

Az XRP árfolyama ismét átlépte az 1,42 dolláros határt, és jelenleg egy izgalmas árfolyammintát mutat, amely legutóbb 2025-ben volt látható...

MA 08:50

Az óriási gamer PC: szobányi őrület óriás ventilátorokkal, klímával és szaunával

💻 Hihetetlen, de mégis igaz, hogy egy lelkes PC-rajongó nemrégiben egy szoba méretű gamer PC-t épített, ami messze túlmutat minden eddigi moddoláson...

MA 08:36

Az MI-vel elég a leírás: molekulát tervez helyetted – Synthegy

🧩 Az új molekulák létrehozása továbbra is a kémia egyik legbonyolultabb feladata...

MA 08:30

A SubQ ezerszeres MI-hatékonyságot ígér, a kutatók kétkednek

Egy kevéssé ismert miami startup, a Subquadratic, nem mindennapi bejelentéssel rukkolt elő: állításuk szerint sikerült elsőként feloldaniuk azt a matematikai akadályt, amely 2017 óta meghatározza és egyben korlátozza a legtöbb fejlett MI-rendszert...

MA 08:22

A Bitcoin 81 ezer fölött: a MicroStrategy eladna osztalékért?

💸 A kriptopiac újabb történelmi csúcsára ért: a bitcoin árfolyama átlépte a 81 000 dolláros határt (29,2 millió forint)...

MA 08:15

A Steam Decken még mindig káosz: miért „Unsupported” a Masters of Albion?

🚧 Peter Molyneux legújabb god game-je, a Masters of Albion, április végén került korai hozzáférésbe...

MA 08:08

Egy gyakori alvási szokás megduplázhatja a szívroham kockázatát

Az alvással kapcsolatos rendszertelenség csendben, észrevétlenül növelheti a komoly szívproblémák kialakulásának esélyét...

MA 08:03

A Saylor-stratégia bitcoineladást sejtet az osztalékért

A Michael Saylor által vezetett MicroStrategy 12,54 milliárd dolláros (kb. 4 350 milliárd forintos) negyedéves veszteséget jelentett, miközben 818 334 darab bitcoint birtokol – darabonként átlagosan 75 537 dolláros (kb...

MA 07:57

A világgazdaság teljes tokenizációja elkerülhetetlen – Joseph Lubin szerint

Az elmúlt években robbanásszerűen gyorsult fel a blokklánc-technológia terjedése, amelynek egyik legnagyobb úttörője, az Ethereum társalapítója, Joseph Lubin szerint már nem kérdés, hanem adottság: a világgazdaság teljes tokenizációja elkerülhetetlenné vált...

MA 07:43

A tárgyaláson: “Musk meg akart ütni” – állítja az OpenAI-vezető

👊 Greg Brockman, az OpenAI elnöke tanúskodott egy kaliforniai bíróság előtt, ahol elmondta, hogy 2017-ben Elon Musk annyira dühös lett, hogy komolyan attól tartott, a milliárdos megüti...

MA 07:37

A véletlen áttörés, ami megfelezheti a Mars-utat

Az űrutazás jövője új fordulatot vehet, miután egy brazil kozmológus véletlenül olyan módszert fedezett fel, amely alaposan lerövidítheti a Mars-expedíciók menetidejét...

MA 07:30

A tölgyek visszatartják a tavaszt, hogy kiéheztessék a hernyókat

🌳 Tavasszal az erdőben minden az időzítésen múlik. A hernyók és más rovarok éppen akkor kelnek ki, amikor a friss, zsenge levelek a legtöbb tápanyagot tartalmazzák...

MA 07:23

Az eper új korszaka: finomabb, táplálóbb, növekedés módosítása nélkül

🍓 A gyümölcsök minőségének javítása anélkül, hogy a növény növekedése vagy terméshozama csökkenne, régóta nehéz feladatnak számít a mezőgazdaságban...

MA 07:16

A Webb-űrtávcső pokoli, Merkúr-szerű szuper-Földet leplezett le

A James Webb-űrtávcső újabb döbbenetes felfedezést tett: a közeli, vörös törpecsillag körül keringő LHS 3844 b nevű exobolygó felszíni összetételét részletesen feltérképezték...

MA 07:09

Az Xbox atyja titokban, a Microsoft-kampuszról gyűjtött vadélesztővel sütött kenyeret

A legendás Seamus Blackley, aki fejlesztőként és tervezőként nagy sikereket ért el a videojátékiparban, most egészen más területen villantotta meg kreativitását...

MA 06:58

Az új GPT-5.5 Instant megmutatja, mire emlékszik – de nem mindent

Az OpenAI legújabb frissítése jelentősen változtat a ChatGPT működésén: a GPT-5...

MA 06:50

A kripto elterjedését még mindig a bizalmatlanság gátolja

🔑 A kriptovaluták elterjedésének egyik legnagyobb akadálya továbbra is a bizalom hiánya...

MA 06:44

A Subnautica 2 viharban edződött: a közösség tartotta életben

Az elmúlt hónapok igazi hullámvasútként teltek a Subnautica 2 fejlesztőcsapatának: pereskedés, bizonytalanság, szervezeti változások színesítették a mindennapokat...

MA 06:37

A Plutón túl: tiltott légkört lehel egy jeges világ

Egy különös égitest kering a Naprendszer peremén, a Neptunuszon túl, ahol a hideg és a sötétség uralkodik...

MA 06:29

A túl alacsony és túl magas pulzus is sztrókot kockáztat

❤️ Ez a jelenség jól illusztrálható azzal, hogy a szakemberek eddig főként a magas pulzust tartották kockázatosnak, most viszont nagyszabású kutatás derítette ki: a túl alacsony és a túl magas nyugalmi pulzus egyaránt összefügghet a stroke kockázatának növekedésével...

MA 06:23

Az újabb leépítések sem fékezik a MindsEye zuhanását

📉 Különösen igaz ez akkor, ha egy fejlesztőstúdió a legjobban várt tartalmi bővítés (DLC) megjelenése után is az elbocsátások miatt kerül címlapra...

MA 06:17

A Fidzsi-szigeteken tűzként terjed a HIV

Fontos megérteni, hogy a dél-csendes-óceáni Fidzsi-szigeteken az utóbbi években drámai ütemben nő a HIV-fertőzöttek száma...

MA 06:05

Történelmi események a mai napon (Május 6.)

Mai időutazásunkon átszáguldunk a reformációtól a modern pénzpiaci sokkig: az angol Biblia-templomprogramtól és a Penny Black indulásától a Hindenburg-katasztrófáig és a skót–walesi önkormányzatiság megszületéséig...

kedd 20:45

A Wall Street figyelmeztet: az emberi piac nem bírja a gépsebességű kereskedést

Wall Street és a kriptovilág vezetői egyre komolyabb kihívást látnak abban, hogy a modern pénzügyi piacok az emberi tempó helyett már éjjel-nappal gépek által vezérelt, automatizált rendszerekre támaszkodnak...

kedd 20:35

A Kaptár rendezője szerint Leon Kennedy hetvenévesen is visszatérhet

👷 Leon Kennedy visszatérése az A kaptár: Rekviem (Resident Evil: Requiem) ben minden rajongó számára örömteli pillanat volt...

kedd 20:23

Az illat, amely egy csapásra a középkorba ránt

🚬 Van, aki szívesen költene 70 ezer forintot egy olyan parfümre, amely egy sárban dagonyázó középkori főhős világát idézi meg?..