
A tudományos közeg is érintett
Az MI által generált tartalom hirtelen elterjedése komoly aggályokat keltett a tudományos világban is. Kutatók az Egyesült Államokból és Németországból 15 millió élettudományi folyóiratban megjelent absztraktot elemeztek, hogy felmérjék, milyen mértékben észlelhető az LLM-használat okozta változás a szövegezésben. Az eredmények szerint 2024-ben legalább a publikációk 13,5%-a valamilyen formában LLM által íródott. Az adatok egy nyílt hozzáférésű folyóiratban jelentek meg.
Szavakban mérhető MI-hatás
A kutatók korábban szinte kizárólag emberi és MI-generált mintaszövegek összevetésével próbálták mérni az LLM-ek befolyását, ez azonban számos torzításhoz vezetett. Most viszont azt vizsgálták, hogy bizonyos szavak túlhasználata hogyan változott a ChatGPT megjelenése előtt és után. A COVID-19 járvány többlethalálozási elemzéseihez hasonlóan összevetették a szavak felbukkanásának arányát a két időszakban.
Virágnyelv helyett tartalom
A ChatGPT 2022-es megjelenése után drasztikus eltolódást mértek. Míg 2024 előtt a feleslegesen használt szavak 79,2%-a főnév volt, idén ez az arány már csak 66% az igéknél, míg 14% a mellékneveknél – főként olyan hangzatos kifejezések, mint a bemutatás (showcasing), sarkalatos (pivotal) vagy küszködés (grappling). A kutatók azt is megállapították, hogy az MI-használat jelentős eltéréseket mutat szakterületenként, országonként és folyóiratonként is.