2025. 09. 25., 09:41

Még mindig gyengén teljesít az MI, ha tudományos cikkeket kell összefoglalni

Még mindig gyengén teljesít az MI, ha tudományos cikkeket kell összefoglalni
A tudományos újságírás egyik legnagyobb kihívása, hogy a bonyolult kutatási eredményeket közérthetően, mégis pontosan adja át a nagyközönség számára. Bár az utóbbi évek MI-fejlesztései, például a ChatGPT, ígéretes lehetőségeket kínálnak az ilyen összefoglalók készítésében, a valóságban ezek a rendszerek még messze elmaradnak az elvárható szinttől. Az Amerikai Tudományos Fejlesztési Szövetség (AAAS) ezért egy éven át vizsgálta, hogyan teljesít a ChatGPT a Science magazinban gyakran megjelenő tömörített hírszemlék írásában.

Emberi minőség kontra MI-megoldás

A kísérlet során 2023 decembere és 2024 decembere között hetente legfeljebb két, kifejezetten nehéz tudományos közleményt választottak ki, hogy azokat három, különböző részletességű MI-prompt segítségével foglaltassák össze a ChatGPT-vel. Ezek között voltak úttörő felfedezések, vitatott témák, technikai zsargonnal teli írások és embereken végzett kutatások is. A kivonatokat a szokásos, tapasztalt SciPak szerzők értékelték — kvantitatív és kvalitatív módszerekkel is.

Fontos szempont, hogy a mérések szerint az MI-vel készült összefoglalók gyakran feláldozták a pontosságot az egyszerűségért, és számos ténybeli hibát, valamint téves következtetést tartalmaztak. Bár a stílus néha hasonlított a szerkesztőségi írásokéhoz, a tartalom megbízhatósága messze elmaradt a kívánalmaktól. Ezzel szemben az emberi szerzők összefoglalói jóval kiegyensúlyozottabbak és alaposabbak voltak.

Az MI hiányosságai

A kísérlet során összesen 64 szakcikk rövid összefoglalóját hasonlították össze a szerkesztők. A leggyakoribb hibák közé tartozott, hogy a ChatGPT gyakran összekeverte az ok-okozati összefüggéseket a véletlenszerű egybeesésekkel, nem adott elég kontextust, vagy túlértékelte az eredmények jelentőségét — például túl gyakran nevezett valamit világviszonylatban újnak vagy áttörőnek. Ráadásul a tényszerű pontatlanságok javítása ugyanannyi, ha nem több emberi munkát igényelt, mint egy teljesen új összefoglaló megírása.

A pontszámok sem voltak meggyőzőek: átlagosan 2,26-ot és 2,14-et kaptak az 5 pontos skálán, ahol az 1 jelentette a teljesen alkalmatlant, míg az 5 a tökéletességet. Mindössze egy összefoglaló kapott maximális értékelést; ezzel szemben harmincszor is a legutolsó helyre sorolták az MI munkáit.

Még nincs MI-forradalom a tudományos újságírásban

Összességében kijelenthető, hogy a ChatGPT jelenlegi változatai nem érik el azt a szakmai színvonalat, amelyet akár egy szerkesztett SciPak hírszemlétől elvárnánk. Bár ígéretes segédeszközök lehetnek egyszerűbb feladatokhoz vagy vázlatíráshoz, tényleges szerkesztett tartalom létrehozásához a súlyos tényellenőrzési igény miatt továbbra is nélkülözhetetlen az emberi szakértelem. Az AAAS szakértői szerint csak akkor érdemes újra próbálkozni ezzel, ha a ChatGPT egy jelentős, minőségi frissítésen esik át.

2025, adminboss, arstechnica.com alapján

  • Te miért tartod fontosnak, hogy az információk pontosak legyenek?
  • Mit tennél, ha egy félrevezető összefoglalót olvasnál egy tudományos témáról?
  • Szerinted mikor lehet majd egy gép annyira megbízható, mint egy ember ilyen feladatban?


Legfrissebb posztok

MA 15:12

Az Ozempic titka: miért hat jobban egyeseknél?

🧠 Erre utal többek között az, hogy azok a cukorbeteg páciensek, akik elsősorban azért esznek túl, mert csábító az étel látványa vagy illata, sokkal eredményesebben fogynak, és javítják vércukorszintjüket Ozempic (vagy ahhoz hasonló GLP-1-gyógyszer) szedése esetén, mint azok, akik inkább stressz vagy rossz hangulat miatt esznek...

MA 15:01

A trójai falóként támadó új gyógyszer látványosan fogyaszt

🧪 Fontos kérdés, hogy miként lehet hatékonyabban és biztonságosabban kezelni az elhízást és a 2-es típusú cukorbetegséget...

MA 14:56

Az alaplapgyártók válságban: egyre kevesebben építenek új PC-t

📈 A PC-építés világa megrendült, az alaplapgyártók eladásai évtizedes mélyponton vannak. Nem elég, hogy folyamatosan drágul a memória, a közel-keleti háborús helyzet is árfelhajtó hatást gyakorol, így a saját gépet építők egyre kevésbé érzik érdemesnek új gépbe fektetni...

MA 14:34

Az angolok védőérméiből viking ékszer lett – szinte tragikomikus

💎 Két különleges ezüstpénz került elő Dániában, amelyeket eredetileg Angliában vertek a viking portyázók elleni védelem reményében...

MA 14:23

A tartós BTC-bikapiac milliónyi tokent söpörhet el – Ben Cowen

📈 A kriptovilág alapvetően a kockázatról szól, de az elmúlt években sosem látott áradattal jelentek meg az értéktelen, spekulatív tokenek...

MA 14:01

Az A fiúk fináléja nem töltelék – Kripke visszavág

💥 Az A fiúk (The Boys) ötödik, egyben befejező évada alaposan felkavarta a rajongók állóvizét...

MA 13:57

A One UI 8.5 végre megérkezett a Galaxy készülékekre – itt a lista

Külön említést érdemel, hogy hosszas várakozás után a Samsung végre megkezdte a One UI 8...

MA 13:45

A házvendég 10 milliót követel Renée Zellwegeréktől és Ant Ansteadtól

😡 Ant Anstead bérelt házában történt furcsa baleset komoly jogi vitát szült...

MA 13:35

Az új vízalapú akku a 24. századig bírja – és lebomlik

Egy új, vizes alapú akkumulátor minden eddiginél hosszabb élettartamot ígér, miközben teljesen biztonságosan kidobható a környezetbe: semmilyen mérgező anyagot nem tartalmaz...

MA 12:34

Yat Siu szerint a jövő 100 milliárd MI‑ügynök, a metaverzum csak háttér

🤖 A metaverzumról alkotott kép radikálisan átalakul. Yat Siu, az Animoca Brands elnöke szerint a jövő már nem az emberek VR-sisakos álomvilágába vezet, hanem a digitális háttérben dolgozó, önjáró MI-ügynököké...

MA 12:23

A BNY, a világ legnagyobb letétkezelő bankja, bővíti kriptoszolgáltatásait Abu-Dzabiban

💰 Jellemző példa erre, hogy a New York-i BNY, amely 59 billió dollár (kb...

MA 11:23

A DNS-ed többet árul el a sikeredről, mint a neveltetésed?

🤓 Kezdetben mindenki azt hitte, hogy a siker kulcsa a családi háttérben és a gondos nevelésben rejlik...

MA 11:12

A kalap, amiért egykor mindent kockára tettek az angolok

🎩 Az ember azt hihetné, a kalap sosem volt más, mint divatos kiegészítő vagy a rossz idő elleni védelem...

MA 11:01

A tudósok véletlenül rábukkantak az élet szabályait felrúgó DNS-re

Újragondolásra késztet, mennyire állandóak a biológia alapelvei: egy mikroszkopikus élőlény váratlanul felülírta az egyik legfontosabbat...

MA 10:50

Az AI-kor piackutatása: 60 ezer digitális iker válaszol azonnal

🌐 Fontos kérdés, hogy a gyorsan változó világban mennyire számít még a hagyományos piackutatás, ha egyetlen TikTok-videó már világszerte trenddé emelhet egy márkát néhány óra alatt...

MA 10:43

Az intézmények banki mintára kérik a kriptóhiteleket

💳 Bitcoinnal foglalkozó nagyvállalatok ma már nem elsősorban az úttörő decentralizált pénzügyi megoldásokért lelkesednek, hanem az átláthatóságot, az egyértelmű szabályokat és a jól értelmezhető kockázatkezelést keresik...

MA 10:29

A modern kiberbűnözés alappillére: 15 ezres MI-befektetési csaláshálózat leleplezve

Jellemző példa erre, hogy egy több mint 15 000 oldalból álló, kiterjedt hálózat hirdeti hamis MI-befektetési ajánlatait, és mindehhez népszerű hirdetéskövető szolgáltatásokat használ fel...

MA 10:23

A KitchenAid félautomata eszpresszógép zseniális – minden kézi gépre lapos fenekű portaszűrőt

☕ Érdemes megvizsgálni, mennyire változtatja meg a reggeli kávéélményt a KitchenAid legújabb félautomata eszpresszógépe, amely egyszerre ötvözi a klasszikus dizájnt és a modern, letisztult kezelőfelületet...

MA 10:15

Az American Bitcoin 23%-kal vágta a költségeit, AI-ra áll át

💸 Az American Bitcoin, amely a Trump fivérekhez köthető, az első negyedévben jelentősen csökkentette a bitcoinbányászati költségeit: 23%-kal kevesebbet, mintegy 13,1 millió forintot (kb...

MA 09:50

Az Atari megvette a Wizardry jogait, indul az újrakiadás-hadjárat

🎮 Érdemes megvizsgálni, milyen hatással lehet a klasszikus szerepjátékok világára, ha egy olyan ikonikus sorozat, mint a Wizardry, visszatér a piacra...

APP
MA 09:12

APPok, Amik Ingyenesek MA, 5/7

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     DualShot Recorder (iPhone/iPad)A DualShot Recorder alkalmazás lehetővé teszi, hogy egyszerre függőleges és vízszintes videófelvételeket készíts...

MA 09:01

Az első határokon átnyúló tokenizált állampapír-visszaváltás: Ripple és JPMorgan az XRP Ledgeren

💰 Fontos kérdés, hogy a pénzügyi rendszerek miként tudnak alkalmazkodni a valós idejű, határokon átnyúló tranzakciókhoz...

MA 08:57

A tűzszünet-remények emelik a részvényeket, a bitcoin-rali megtorpan, Dogecoin -4%

📈 Erős hét után enyhe megtorpanás látható a főbb kriptovalutáknál, miután a nemzetközi részvénypiacok új rekordokat döntöttek...

MA 08:50

A cumberlandi szénbányák mélyéből tiszta energia tör fel

Az egykori bányaváros, Cumberland, egykor szinte teljes egészében a szénbányászatra épült: generációkon át ez határozta meg a mindennapokat, több ezer embernek adott munkát, és évente millió tonna szenet küldtek innen a világ különböző pontjaira...

MA 08:43

Három jel, hogy a bitcoin 32 millió forintra tör

Az elmúlt három hónapban a bitcoin árfolyama közel 23 millió forintról 29 millió forint fölé emelkedett, és újabb áttörésre készülhet...

MA 08:36

Itt a robotok appboltja: nyílt forrású Reachy Mini, 200+ app

🤖 A technológia világát hosszú időn át a mobilalkalmazások uralták, ám most új korszak kezdődik: nemcsak a telefonodra, hanem a robotodra is letölthetsz programokat...

MA 08:22

A NASA lenyűgöző felvétele: örvénylő felhők és ritka sarki vihar Alaszka felett

Dél-Alaszka télbúcsúztatója lélegzetelállító látványosságot hozott, amelyet a NASA egyik műholdja örökített meg...

MA 08:15

A techóriásokat is rettegésben tartják az MI-ügynökök?

😱 Az interneten egyre jelentősebbé válnak az MI-ügynökök, és bizonyos jelek arra utalnak, hogy 2035-re már többen lesznek, mint a tényleges internethasználók...

MA 08:02

Az éjszaka háromszor fényesebb lehet: műholdak veszélyeztetik a Vera C. Rubin Obszervatóriumot

Kezdetben az éjszakai égbolt viszonylagos sötétsége lehetővé tette, hogy a földi csillagászati műszerek soha nem látott részletességgel térképezhessék fel az univerzumot...