Még mindig gyengén teljesít az MI, ha tudományos cikkeket kell összefoglalni

Még mindig gyengén teljesít az MI, ha tudományos cikkeket kell összefoglalni
A tudományos újságírás egyik legnagyobb kihívása, hogy a bonyolult kutatási eredményeket közérthetően, mégis pontosan adja át a nagyközönség számára. Bár az utóbbi évek MI-fejlesztései, például a ChatGPT, ígéretes lehetőségeket kínálnak az ilyen összefoglalók készítésében, a valóságban ezek a rendszerek még messze elmaradnak az elvárható szinttől. Az Amerikai Tudományos Fejlesztési Szövetség (AAAS) ezért egy éven át vizsgálta, hogyan teljesít a ChatGPT a Science magazinban gyakran megjelenő tömörített hírszemlék írásában.

Emberi minőség kontra MI-megoldás

A kísérlet során 2023 decembere és 2024 decembere között hetente legfeljebb két, kifejezetten nehéz tudományos közleményt választottak ki, hogy azokat három, különböző részletességű MI-prompt segítségével foglaltassák össze a ChatGPT-vel. Ezek között voltak úttörő felfedezések, vitatott témák, technikai zsargonnal teli írások és embereken végzett kutatások is. A kivonatokat a szokásos, tapasztalt SciPak szerzők értékelték — kvantitatív és kvalitatív módszerekkel is.

Fontos szempont, hogy a mérések szerint az MI-vel készült összefoglalók gyakran feláldozták a pontosságot az egyszerűségért, és számos ténybeli hibát, valamint téves következtetést tartalmaztak. Bár a stílus néha hasonlított a szerkesztőségi írásokéhoz, a tartalom megbízhatósága messze elmaradt a kívánalmaktól. Ezzel szemben az emberi szerzők összefoglalói jóval kiegyensúlyozottabbak és alaposabbak voltak.

Az MI hiányosságai

A kísérlet során összesen 64 szakcikk rövid összefoglalóját hasonlították össze a szerkesztők. A leggyakoribb hibák közé tartozott, hogy a ChatGPT gyakran összekeverte az ok-okozati összefüggéseket a véletlenszerű egybeesésekkel, nem adott elég kontextust, vagy túlértékelte az eredmények jelentőségét — például túl gyakran nevezett valamit világviszonylatban újnak vagy áttörőnek. Ráadásul a tényszerű pontatlanságok javítása ugyanannyi, ha nem több emberi munkát igényelt, mint egy teljesen új összefoglaló megírása.

A pontszámok sem voltak meggyőzőek: átlagosan 2,26-ot és 2,14-et kaptak az 5 pontos skálán, ahol az 1 jelentette a teljesen alkalmatlant, míg az 5 a tökéletességet. Mindössze egy összefoglaló kapott maximális értékelést; ezzel szemben harmincszor is a legutolsó helyre sorolták az MI munkáit.

Még nincs MI-forradalom a tudományos újságírásban

Összességében kijelenthető, hogy a ChatGPT jelenlegi változatai nem érik el azt a szakmai színvonalat, amelyet akár egy szerkesztett SciPak hírszemlétől elvárnánk. Bár ígéretes segédeszközök lehetnek egyszerűbb feladatokhoz vagy vázlatíráshoz, tényleges szerkesztett tartalom létrehozásához a súlyos tényellenőrzési igény miatt továbbra is nélkülözhetetlen az emberi szakértelem. Az AAAS szakértői szerint csak akkor érdemes újra próbálkozni ezzel, ha a ChatGPT egy jelentős, minőségi frissítésen esik át.

2025, adminboss, arstechnica.com alapján

  • Te miért tartod fontosnak, hogy az információk pontosak legyenek?
  • Mit tennél, ha egy félrevezető összefoglalót olvasnál egy tudományos témáról?
  • Szerinted mikor lehet majd egy gép annyira megbízható, mint egy ember ilyen feladatban?


Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

kedd 20:34

A gőték láthatatlan genetikai csapdába estek

Ami először apróságnak tűnt, komoly evolúciós rejtéllyé nőtte ki magát a tarajos és márványos gőték körében...

kedd 20:17

Áttörés: már a legritkább betegségeket is gyógyítják

Egy mindössze hat hónapos baba, KJ Muldoon lett az első a világon, aki személyre szabott CRISPR-génszerkesztéses kezelést kapott egyedi genetikai mutációjára...

kedd 20:01

A tini hacker rács mögött: 64 millió ellopott adat

Spanyol rendőrök Barcelonában elfogtak egy 19 éves fiatalt, aki kilenc különböző cég rendszereibe tört be, majd 64 millió ember személyes adatait próbálta eladni az interneten...

kedd 19:49

Jön az új chipgyártó, vége az MI energiazabálásnak?

⚡ Érdekes felvetés, hogy az MI gyors fejlődése nemcsak hatékonysági, hanem egyre inkább energiagazdálkodási kihívás elé állítja a világot...

kedd 19:33

Az ősi csillagok átírják a Tejútrendszer történetét

⭐ Felmerül a kérdés, hogy mennyire ismerjük valójában saját galaxisunk, a Tejút, történetét...

kedd 19:02

Az Instacart trükkös árazása: ki fizet többet ugyanazért?

Egy friss kutatás döbbenetes eredményeket hozott az Instacart árképzéséről: a felhasználók ugyanabból az üzletből származó, ugyanazon termékre akár öt különböző árat is láthattak...

kedd 18:50

Az MI-lázban most éri meg igazán videókártyát venni

Érdekes felvetés, hogy a mesterséges intelligencia iránti kirobbanó kereslet néhány hónapon belül alaposan felhajthatja a videókártyák árait...

kedd 18:34

Az űrbe költöznek az adatszerverek – forradalom vagy vakvágány?

🚀 Például egyre többen foglalkoznak azzal a gondolattal, hogy a nagy teljesítményű adatközpontokat a Föld helyett az űrben helyezzék el...

kedd 18:18

Az univerzum rejtett rendje: áttörés a fraktális káosz feltárásában

🌈 Az univerzum felszínes rendjével szemben ott lüktet a káosz: véletlenek, apró kilengések formálnak mindent, a hatalmas galaxisoktól a leghétköznapibb jégvirágig...

kedd 17:49

Leállt a Microsoft Copilot – pórul jártak az európai felhasználók

⚠ Az elmúlt órákban jelentős hiba akadályozta Európa-szerte a Microsoft Copilot MI-asszisztens használatát, így a felhasználók nem érhetik el sem a copilot...

kedd 17:33

Az év animációs szenzációja: jön a Zootropolis 2 streamingre

🐶 Zootropolis 2 (Zootopia 2), a Disney nagysikerű animációs filmjének folytatása, várhatóan 2026 elején érkezik meg az otthonokba...

kedd 16:50

Kínába csempészték az Nvidia GPU-kat: 60 milliárdos botrány

📦 Az amerikai hatóságok ismét komoly, Kínához köthető csempészési hálózatot számoltak fel, amelyen keresztül exportkorlátozás alá eső MI-chipeket szállítottak volna Kínába és más tiltott országokba...

kedd 16:34

Az Android-nyomkövetők hadat üzennek az AirTagnek

🔎 Az Apple AirTag népszerűségét látva hamarosan új nyomkövető eszközök jelennek meg Androidra...

kedd 16:20

A Meta zsonglőrködik: a Llama után érkezik az Avocado-káosz

🥑 Meta, a Facebook anyavállalata az elmúlt évben jelentős irányváltáson ment keresztül a mesterséges intelligencia fejlesztésében...

kedd 16:02

Újabb vágás: a Standard Chartered tovább farag a bitcoin-előrejelzésén

📈 A Bitcoin árfolyamának emelkedése elakadt, különösen a gyenge negyedik negyedéves teljesítmény után...

kedd 15:49

Az Intel és a Tata óriási dobásra készül Indiában

🚀 Az Intel új szövetséget kötött az indiai óriásvállalattal, a Tatával, és közösen vizsgálják majd a chipgyártás lehetőségeit India első félvezetőgyárában...

kedd 15:17

A Google új MI-alkalmazása már vásárlásra is csábít

🛒 A Google MI-alapú próbafülke-alkalmazása, a Doppl új felfedező hírfolyammal bővült, ahol bárki azonnal be is szerezheti a kiválasztott ruhákat...

kedd 15:02

A mesterséges intelligencia már átírja a nyelvünket?

Egyre több moderátor és kutató aggódik amiatt, hogy az emberek beszéde feltűnően hasonlít az MI által generált nyelvezethez...