2025. 09. 25., 09:41

Még mindig gyengén teljesít az MI, ha tudományos cikkeket kell összefoglalni

Még mindig gyengén teljesít az MI, ha tudományos cikkeket kell összefoglalni
A tudományos újságírás egyik legnagyobb kihívása, hogy a bonyolult kutatási eredményeket közérthetően, mégis pontosan adja át a nagyközönség számára. Bár az utóbbi évek MI-fejlesztései, például a ChatGPT, ígéretes lehetőségeket kínálnak az ilyen összefoglalók készítésében, a valóságban ezek a rendszerek még messze elmaradnak az elvárható szinttől. Az Amerikai Tudományos Fejlesztési Szövetség (AAAS) ezért egy éven át vizsgálta, hogyan teljesít a ChatGPT a Science magazinban gyakran megjelenő tömörített hírszemlék írásában.

Emberi minőség kontra MI-megoldás

A kísérlet során 2023 decembere és 2024 decembere között hetente legfeljebb két, kifejezetten nehéz tudományos közleményt választottak ki, hogy azokat három, különböző részletességű MI-prompt segítségével foglaltassák össze a ChatGPT-vel. Ezek között voltak úttörő felfedezések, vitatott témák, technikai zsargonnal teli írások és embereken végzett kutatások is. A kivonatokat a szokásos, tapasztalt SciPak szerzők értékelték — kvantitatív és kvalitatív módszerekkel is.

Fontos szempont, hogy a mérések szerint az MI-vel készült összefoglalók gyakran feláldozták a pontosságot az egyszerűségért, és számos ténybeli hibát, valamint téves következtetést tartalmaztak. Bár a stílus néha hasonlított a szerkesztőségi írásokéhoz, a tartalom megbízhatósága messze elmaradt a kívánalmaktól. Ezzel szemben az emberi szerzők összefoglalói jóval kiegyensúlyozottabbak és alaposabbak voltak.

Az MI hiányosságai

A kísérlet során összesen 64 szakcikk rövid összefoglalóját hasonlították össze a szerkesztők. A leggyakoribb hibák közé tartozott, hogy a ChatGPT gyakran összekeverte az ok-okozati összefüggéseket a véletlenszerű egybeesésekkel, nem adott elég kontextust, vagy túlértékelte az eredmények jelentőségét — például túl gyakran nevezett valamit világviszonylatban újnak vagy áttörőnek. Ráadásul a tényszerű pontatlanságok javítása ugyanannyi, ha nem több emberi munkát igényelt, mint egy teljesen új összefoglaló megírása.

A pontszámok sem voltak meggyőzőek: átlagosan 2,26-ot és 2,14-et kaptak az 5 pontos skálán, ahol az 1 jelentette a teljesen alkalmatlant, míg az 5 a tökéletességet. Mindössze egy összefoglaló kapott maximális értékelést; ezzel szemben harmincszor is a legutolsó helyre sorolták az MI munkáit.

Még nincs MI-forradalom a tudományos újságírásban

Összességében kijelenthető, hogy a ChatGPT jelenlegi változatai nem érik el azt a szakmai színvonalat, amelyet akár egy szerkesztett SciPak hírszemlétől elvárnánk. Bár ígéretes segédeszközök lehetnek egyszerűbb feladatokhoz vagy vázlatíráshoz, tényleges szerkesztett tartalom létrehozásához a súlyos tényellenőrzési igény miatt továbbra is nélkülözhetetlen az emberi szakértelem. Az AAAS szakértői szerint csak akkor érdemes újra próbálkozni ezzel, ha a ChatGPT egy jelentős, minőségi frissítésen esik át.

2025, adminboss, arstechnica.com alapján

  • Te miért tartod fontosnak, hogy az információk pontosak legyenek?
  • Mit tennél, ha egy félrevezető összefoglalót olvasnál egy tudományos témáról?
  • Szerinted mikor lehet majd egy gép annyira megbízható, mint egy ember ilyen feladatban?


Legfrissebb posztok

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/21

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Terminal Madness – Revelations (iPhone/iPad)A *Terminal Madness: Revelations* egy fizetős sci-fi kalandjáték, amelyben izgalmas történet és komplex logikai feladványok várnak...

MA 06:05

Történelmi események a mai napon (Március 21.)

Időutazás a történelemben: nagy ostromok, sorsfordító törvények és megrázó tragédiák sorakoznak ezen a napon...

APP
péntek 07:11

APPok, Amik Ingyenesek MA, 3/20

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben egy kisvárosban élő mutánsok mindennapjaiba nyerhetsz betekintést...

péntek 06:05

Történelmi események a mai napon (Március 20.)

Viharos nap a történelemben: a Holland Kelet-indiai Társaság megszületésétől 🧭 a napóleoni Száz Nap kezdetéig, Einstein relativitáselméletétől 🧠 a modern háborúk fordulópontjaiig...

APP
csütörtök 07:12

APPok, Amik Ingyenesek MA, 3/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Mutazione (iPhone/iPad)A Mutazione egy kalandjáték, amelyben a vidéki kisváros hétköznapi pletykái és a természetfeletti események keverednek...

csütörtök 06:06

Történelmi események a mai napon (Március 19.)

Mi történt ma a történelemben? A Mongol Birodalom győzelmével véget ér a Szung-dinasztia Kínában 🇨🇳, az angol alsóház eltörli a Lordok Házát 🏛️, a náci csapatok megszállják Magyarországot 🇭🇺, és a Tuskegee Airmen egységet hivatalosan aktiválják ✈️...

szerda 12:01

Az IKEA okosotthona: menő és olcsó, mégsem működik

📦 Az IKEA új, mindenki számára elérhető okos kütyüi végre megérkeztek! A gondolat izgalmas: menő, okos izzók, kapcsolók, dugaljak, mind kezdőáron, már 2400 forinttól...

szerda 11:34

Az MI-asszisztensek kijátszása: veszélyes parancsok az orrod előtt

🛡 Egy új, böngészőkben alkalmazható trükk lehetővé teszi, hogy rosszindulatú parancsokat rejtsenek el közvetlenül a weboldalakon anélkül, hogy azt az MI‑asszisztensek észrevennék...

szerda 11:23

Az iPhone 16e megkapja az álomfrissítést, amiről az Android csak álmodik

😍 Fontos kérdés, hogy mennyire lehet egy okostelefont olcsón, akár otthon is fejleszteni, főleg, ha új funkciók utólag is elérhetők lesznek...

szerda 11:13

Az USA-ban berobban a vastagbélrák az 50 év alattiaknál

💉 Az Egyesült Államokban egyre fiatalabbakat érint a vastagbélrák, amely immár a leggyakoribb daganatos halálok az 50 év alattiak körében...

szerda 11:01

Az új Google Gemini már mindent tud rólad – ráadásul ingyen

A Google újraírta a szabályokat: mostantól a Geminiben mindenki számára ingyenesen elérhető az a funkció, amellyel valóban személyre szabott válaszokat adhat...

szerda 10:50

Az orosz hackerek új kártevőhulláma elözönli a GitHubot

Jellemző példa erre, hogy napjaink egyik legagresszívebb ellátásilánc-támadása, a GlassWorm ismét lecsapott: több mint 400 fejlesztői csomag, forráskódtár és bővítmény vált fertőzötté olyan platformokon, mint a GitHub, az npm, a Visual Studio Code és az OpenVSX...

szerda 10:43

Most te vagy a hangmérnök: itt az új Spotify-mód

🎧 A Spotify most végre bevezette az Exkluzív módot (Exclusive Mode) Windowsra – innentől a szoftver ráteszi a kezét a hangkártyádra, és kiküszöböli, hogy a géped belemotyogjon a zenédbe...

szerda 10:36

Az Apple új titkos fegyvere: láthatatlanul javították a sebezhetőséget

🔒 Az Apple először élesítette a Háttérbiztonsági fejlesztések nevű rendszerét, amellyel anélkül javíthattak egy kritikus WebKit-sebezhetőséget, hogy a teljes operációs rendszert frissíteni kellett volna...

szerda 10:30

Az akcentus rejtett ára: kinek a hangja számít igazán?

Modern munkahelyeken sokan hiszik, hogy a legjobb ötletek maguktól érvényesülnek: az győz, aki meggyőzően érvel, vagy eredeti meglátással áll elő...

szerda 10:23

Az észak-koreai hekkerek kifosztották a Bitrefillt: 19 ezren pórul jártak

💰 Március 1-jén nagyszabású kibertámadás érte a nagy nemzetközi kriptopénzes fizetési és ajándékkártya-platformot, a Bitrefillt...

szerda 10:16

A gyerekkori stressz egész életre beleég a bélrendszerbe

😱 A korai gyermekkori stressz nem csupán mentális sebeket hagyhat maga után, hanem a bélrendszer működését is átrendezheti...

szerda 10:10

Az iráni háború miatt rekordon a benzinárak Amerikában

Miközben az iráni háború felbolygatta a globális olajpiacot, az üzemanyagárak soha nem látott magasságokba emelkedtek Amerikában...

szerda 09:57

Az Apple lopakodva telepíti a biztonsági frissítéseket a készülékeidre

🔒 Az Apple beindította a háttérben letöltődő biztonsági javításokat, amelyek olyan észrevétlenül érkeznek, hogy talán észre sem veszed őket – de a telefonod vagy a géped nagyon hálás lesz érte...

szerda 09:51

Az iráni blokád a Hormuzi-szoros lezárásával fenyeget

Az elmúlt hetek eseményei szinte megbénították a Hormuzi-szoros forgalmát: ahol korábban naponta több mint 100 tanker haladt át, most viszont február vége óta alig 21 tette meg az utat...

szerda 09:44

Az amerikai tőzsde igazi mélypontja még odébb van?

📈 A látszólagos tőzsdei robbanás ellenére a befektetők már hónapok óta gyakorlatilag medvepiacban mozognak...

szerda 09:29

Az albérletpiac most neked dolgozik – érkeznek a durva kedvezmények

Szóval végre valami, aminek most tényleg lehet örülni bérlőként: az albérletpiacon közel 12 éve nem látott szintre emelkedtek az extra kedvezmények...

szerda 09:23

A Meta leteszi az asztalodra a Manus MI-ügynököt

A Meta frissen felvásárolt MI-startupja, a Manus most egy asztali alkalmazással hozza el saját mesterségesintelligencia-ügynökét közvetlenül a felhasználók számítógépeire...

szerda 09:16

Az utolsó tánc: újabb frissítés az FBC: Firebreakhez – de minek?

🔥 Mielőtt bárki eltemetné az FBC: Firebreak-et, fontos tudni, hogy a Remedy kiadta hozzá az utolsó tartalmi frissítést—de cseppet se aggódj, a szerverek még évekig bírni fogják a strapát...

szerda 09:11

A Mistral Forge letaszítja trónjukról az MI-szuperszámítógépeket

👑 A francia Mistral AI bemutatta a Forge nevű platformját, amellyel cégek és állami intézmények saját MI-modelleket építhetnek, továbbfejleszthetnek és folyamatosan igazíthatnak a saját adataikhoz szabva – mindezt teljes körű adatvédelem mellett...

szerda 09:01

Az XRP-n 5,5 milliárd forint a tét: háború a tőzsdén

💸 Fontos kérdés, hogy mi történik az XRP árfolyamával a következő napokban...

szerda 08:57

A nagy Pikachu-leleplezés: Pizzafutár lett a Pokémon GO-ból?

👑 A Pokémon GO valaha csak játék volt, ma már viszont sokkal több: szinte észrevétlenül a városi robotok navigációs segédeszközévé vált...

szerda 08:38

Az Nvidia MI-ügynökplatformja tényleg biztonságos?

🔒 Kezdetben az MI-fejlesztések fő fókuszában a képességek és a funkcionalitás állt, de most először jelent meg egy átfogó biztonsági rendszer már a kiadás pillanatában...

szerda 08:30

Az MI-engedélyezés könnyen vállalati káoszhoz vezethet

Az MI-alapú ügynökök egyre több vállalatnál végzik el helyettünk az érzékeny feladatokat: CRM-rendszerekbe lépnek be, adatbázisokat olvasnak, e-maileket küldenek...