Az MI már titokban átírta a tudományos cikkeket?

Valószínűleg te is olvastál már olyan online szöveget, amelyet részben vagy egészben egy nagyméretű nyelvi modell (LLM), például a ChatGPT vagy a Google Gemini generált. Ahogy ezek az MI-rendszerek egyre emberszerűbb stílusban képesek fogalmazni, egyre nehezebb felismerni, hol ér véget az emberi szerző munkája, és hol kezdődik a gép alkotása.

A tudományos közeg is érintett

Az MI által generált tartalom hirtelen elterjedése komoly aggályokat keltett a tudományos világban is. Kutatók az Egyesült Államokból és Németországból 15 millió élettudományi folyóiratban megjelent absztraktot elemeztek, hogy felmérjék, milyen mértékben észlelhető az LLM-használat okozta változás a szövegezésben. Az eredmények szerint 2024-ben legalább a publikációk 13,5%-a valamilyen formában LLM által íródott. Az adatok egy nyílt hozzáférésű folyóiratban jelentek meg.

Szavakban mérhető MI-hatás

A kutatók korábban szinte kizárólag emberi és MI-generált mintaszövegek összevetésével próbálták mérni az LLM-ek befolyását, ez azonban számos torzításhoz vezetett. Most viszont azt vizsgálták, hogy bizonyos szavak túlhasználata hogyan változott a ChatGPT megjelenése előtt és után. A COVID-19 járvány többlethalálozási elemzéseihez hasonlóan összevetették a szavak felbukkanásának arányát a két időszakban.

Virágnyelv helyett tartalom

A ChatGPT 2022-es megjelenése után drasztikus eltolódást mértek. Míg 2024 előtt a feleslegesen használt szavak 79,2%-a főnév volt, idén ez az arány már csak 66% az igéknél, míg 14% a mellékneveknél – főként olyan hangzatos kifejezések, mint a bemutatás (showcasing), sarkalatos (pivotal) vagy küszködés (grappling). A kutatók azt is megállapították, hogy az MI-használat jelentős eltéréseket mutat szakterületenként, országonként és folyóiratonként is.

2025, adrienne, phys.org alapján

Share on Social Media