Az OpenAI véletlenül megosztotta a ChatGPT-beszélgetéseket a Google-lel

A közelmúltban váratlan helyen bukkantak fel privát ChatGPT-beszélgetések: a Google Search Console-ban (GSC), ahol fejlesztők és weboldal-tulajdonosok jellemzően csak a rájuk kereső kulcsszavakat, rövid keresési kifejezéseket figyelik. Szeptembertől azonban több száz karakter hosszú, bizalmas üzenetek is megjelentek a felületen, amelyek kizárólag felhasználói kérdéseket tartalmaztak – arról árulkodva, hogy sokan úgy hitték, a MI-vel folytatott magánbeszélgetéseik tényleg privátok maradnak.

Kínos privát chatek a Google eszközében

Az egyik első, aki erre felfigyelt, Jason Packer, a Quantable analitika-tanácsadó cég vezetője volt. Közel 200 ilyen furcsa keresést talált egyetlen weboldalon, és meglepő történetek is akadtak: egy nő például azt próbálta a MI-val megfejteni, tetszik-e neki egy fiú, miközben másvalaki irodavezetőként üzleti információkat osztott meg, visszatérésről szóló közleményt készítve. Nem elhanyagolható tényező, hogy ezek az üzenetek minden indiszkrécióval együtt jelentek meg a GSC-fiókokban, akár több száz karakter hosszan is.

Az első feltételezések szerint a kiszivárgott chatek valamilyen módon összefügghetnek korábbi forrásokkal, amelyek arról szóltak, hogy az OpenAI a Google keresési eredményeit is „lekaparja” (scrapeli), hogy naprakész válaszokat adhasson az MI-nek feltett aktuális kérdésekre, például hírekre vagy sporteredményekre. Bár az OpenAI ezt eddig hivatalosan nem erősítette meg, az új szivárgások alapján úgy tűnik, hogy nemcsak adatszerzéshez használják a Google-t, hanem egyes felhasználói beviteli mezőkből közvetlenül is továbbítanak kérdéseket a keresőhöz.

Rejtélyes bug vagy szándékos adatgyűjtés?

Slobodan Mani weboptimalizációs szakember segített Packernek megfejteni a talány egy részét: kiderült, hogy az érintett oldalak azért kerültek be a GSC-be, mert magas pozíciót értek el azokra a kulcsszavakra, amelyek egy ChatGPT-URL-lel kezdődtek. Ilyenkor a Google darabokra szedve indexelte az URL-t (openai + index + chatgpt), így az ezekre jól rangsorolt site-oknál jelent meg a legtöbb ChatGPT-szöveg.

Mindez azt jelentheti, hogy a ChatGPT kereséseinek egy része tényleg a Google-ön fut keresésként, a felhasználói promptokat is továbbítva. Gyakori, hogy a GPT-5 friss vagy ritkább információnál inkább saját keresést indít, viszont egy hibás promptmező miatt az összes kereséshez automatikusan hozzárendel egy „hints=search” paramétert, így szinte minden alkalommal külső keresést indít — és ezt a Google-ben futtatja le. Így a teljes prompt, személyes tartalmával együtt, a GSC-ben köt ki.

Packer szerint ez azt jelenti, hogy a keresést indító prompted egyszerre jut el a Google-höz és a keresést végző céghez – valamint ahhoz az oldalhoz, amelyik a keresési találatok közt szerepel. Nem elhanyagolható tényező, hogy a problémát az OpenAI csak részben ismerte el: csupán azt jelezték, hogy egy rövid ideig, kis számú keresést érintett a gond, de arra nem válaszoltak, konkrétan hányan érintettek a hetente kb. 700 millió ChatGPT-használóból.

Elmaradt magyarázat és továbbra is fennálló kérdések

Míg az OpenAI a Google keresőjében korábban megjelenő ChatGPT-promtoknál azzal magyarázta a szivárgást, hogy a felhasználók publikussá tették a beszélgetést, most egy teljesen más helyzettel szembesült: itt senki sem kattintott a megosztásra, mégis nyilvánvalóan kerültek át privát információk a GSC-be.

Bár a cég képviselője azt mondta, kijavították a problémát, és már nem küldődnek tovább ilyen promtok, Packer és Mani szerint továbbra sem tiszta, hogy pusztán egy belső irányítási útvonalat zártak le, vagy ténylegesen megszűnt a Google scrapelése – esetleg csak a hibás promtok szűntek meg. Az sem egyértelmű, hogy minden érintett oldalról törölhetők-e ezek a privát chatek – sőt, az előző botránytól eltérően, ahol a nyilvánossá tétel aktív döntés volt, most erre senkinek sem volt ráhatása.

Nem elhanyagolható tényező, hogy Mani szerint az ilyen automatikus promtok hozzájárulhattak a SEO-szakértők által „krokodilszáj”-jelenségnek nevezett problémához: vagyis amikor egy oldal láthatósága (megjelenítési száma) hirtelen megnő, de a rákattintások aránya lecsökken – ami káros lehet a weboldalak számára.

Komoly privátszférasértés, maradnak a kétségek

Összességében elmondható, hogy a mostani eset az egyik legkülönösebb és legaggályosabb ChatGPT-botrány: a privát beszélgetések váratlan módon és akaratlanul kerültek oda, ahol senki sem számított rájuk — mindez ráadásul egy népszerű elemzőeszközben bukkant fel. Bár az OpenAI próbálta gyorsan kezelni a dolgot, az átláthatóság és adatvédelem kérdése tovább lebeg, miközben továbbra sem világos, pontosan mennyi elővigyázatossággal járnak el a felhasználók magánéletével kapcsolatban. Bár a hiba most megoldódott, a történet jól példázza, mennyire sérülékeny a digitális magánszféra a mesterséges intelligencia korában.

2025, adminboss, arstechnica.com alapján

Share on Social Media