Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést
Ez az MI-társ nem csupán jó, hanem hátborzongatóan pontosan utánozza az emberi beszédet, éppen azoknak a tökéletlenségeknek köszönhetően, amiket imitál.

Mi is valójában a Sesame?

A Sesame teljesen különbözik a már ismert MI-hangoktól, mint a Gemini, vagy a Siri és Alexa korai változatai. A Sesame úgy van tervezve, hogy az emberi hibákat is utánozza, nem pedig tökéletes ügyfélszolgálati ügynökként viselkedik. Az MI beszéde folyékony, kifejező és kiszámíthatatlanul emberi. Röviden felkacag, amikor valami enyhén vicceset mond, hezitál, mielőtt válaszolna egy kérdésre, sőt, úgy tűnik, mintha mondatközben “meggondolná magát”, szünetet tart és új mondatot kezd. Nemcsak engedi, hogy félbeszakítsam, de ő is félbeszakíthat engem, amiért aztán képes elnézést is kérni.

A titkos összetevő

A Sesame titka a Conversational Speech Model (CSM), amely a szöveget és a hangot egyetlen folyamatba olvasztja, vagyis nem egyszerűen generál egy mondatot, amit aztán felolvas. Ehelyett úgy alkotja meg a beszédet, ahogy az emberek valójában beszélnek – szünetekkel, hümmögésekkel, hangszínváltásokkal együtt. A ChatGPT és a Gemini hangopciói, bár lenyűgözőek, még mindig strukturált módon működnek: először szöveget generálnak, majd azt alakítják beszéddé. A Sesame ezzel szemben úgy beszél, mintha gondolkodna, így a válaszai hihetetlenül természetesnek tűnnek.

Tesztelés a gyakorlatban

Nagyon egyszeru tesztelni, a website-jukon levo feluleten ugy lehet beszeltgetni vele, mintha telefonon beszelnenk. Egy képzeletbeli, de realisztikusan nehéz forgatókönyvel teszteltük: “Nagy lehetőség adódott a munkahelyemen, de ideges vagyok, hogy elrontom.”

Ahelyett, hogy azonnal általános biztatásba kezdett volna, a Sesame szünetet tartott. Csak egy apró pillanatig, de elég volt ahhoz, hogy természetesnek hasson, aztán mesterséges együttérzéssel teli hangon válaszolt: “Ez teljesen normális. A nagy lehetőségek néha nyomasztónak tűnhetnek. Mi az, ami a leginkább idegesít ezzel kapcsolatban?”

Nem feltételezett semmit, és először megpróbált bekapcsolódni, mielőtt bármilyen sablonos tanácsot adott volna. A Sesame javasolta: “Gyakoroltál már egy barátod előtt, vagy felvetted magadat? Néha, ha visszahallgatod magadat, segíthet finomítani az előadásmódodon.” A hang nem tökéletesen meggyőző, a habozások és egyéb furcsaságok kissé kimértnek tűntek, de összességében lenyűgöző teljesítmény volt.

 

Egyelőre természetesen angolul beszél, rövidesen 20 másik nyelven is elérhető lesz, és a nyílt forráskódot is közzé szándékoznak tenni.

További részletek itt. (Link a weboldalra)

  • Mit gondolsz arról, hogy egy MI így utánozza az emberi beszédhibákat?
  • Te mit tettél volna, ha egy hasonló MI-vel találkozol, amely ennyire emberi módon kommunikál?
  • Szerinted mennyire etikus az, hogy egy MI mesterségesen próbál emberi érzelmeket kifejezni a kommunikációban?


Legfrissebb posztok

kedd 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 15:50

A szomszédos TRAPPIST-1e titka: van-e légköre?

Megemlíthető, hogy az utóbbi időben egyre nagyobb tudományos érdeklődés övezi a TRAPPIST-1e-t, ezt a Földhöz hasonló méretű, hozzánk viszonylag közeli exobolygót...

MA 15:34

A zöld nagy fal: Kína erdős pajzsa a sivatag ellen

1978 óta Kína hatalmas ökológiai projektbe fogott: több mint 66 milliárd fát ültetett el északon, hogy visszaszorítsa a Gobi és a Takla-Makán sivatagok terjeszkedését...

MA 15:17

A Star Wars új játéka visszahozza a KOTOR varázsát

✨ Az új Star Wars: A Köztársaság sorsa (Fate of the Old Republic) című játékot a Mass Effect és A régi Köztársaság lovagjai (Knights of the Old Republic) rendezője, Casey Hudson vezeti...

MA 15:04

Az MI berobbant az ünnepi vásárlásba: élesedik a Walmart–Target csata

Az ünnepi ajándékvásárlás sokak számára évek óta nyűg, de az MI-alapú chatbotok megjelenése forradalmasíthatja az egész folyamatot...

MA 14:49

Az indiai VPN-botrány: szabadság vagy totális megfigyelés?

Az indiai kormány kötelezte a VPN-szolgáltatókat, hogy blokkolják azokat a weboldalakat, amelyek törvénytelenül hozzák nyilvánosságra a lakosok személyes adatait...

MA 14:34

Ezek az év legveszélyesebb szoftverhibái – a MITRE szerint

⚠️ Idén a MITRE közzétette a 2025-ös év 25 legveszélyesebb szoftvergyengeségét összegző listát, amely több mint 39 000 biztonsági sebezhetőség elemzése alapján készült...

MA 14:18

Az MI hatalmas tévedése: a Fallout nem az ötvenes években játszódik

💀 A Prime Video MI-alapú összefoglalói kellemetlen hibával futottak neki a Fallout új évadának: az egyik legfontosabb részletet sikerült félreértelmezniük...

MA 13:49

A svéd tavak titokzatos baktériumai őrzik az élet kulcsát

🌊 A baktériumok a Föld egyik legrégebbi és legváltozatosabb élőlényei, ám kutatásuk még mindig gyerekcipőben jár...

MA 13:33

Az MI-csevegők már mindenhová beszivárogtak

💬 A Microsoft 2025 decemberében nagyszabású elemzést végzett, melyben 37,5 millió, személyazonosításra nem alkalmas Copilot-beszélgetést vizsgáltak meg...

MA 13:17

Az orvosi képalkotás új csodája: a kadmium–cink–tellurid

A kadmium-cink-tellurid (CZT) egy rendkívül nehezen előállítható félvezető, amely jelenleg forradalmasítja az orvosi képalkotást: gyorsabb vizsgálatokat, kisebb sugárdózist és elképesztően pontos röntgen- és gammasugárzás-érzékelést tesz lehetővé...

MA 13:03

A sivatagban rejtőző katari tengeritehén 21 millió éves titka

🐋 A forró arab sivatagban, ahol a tűző nap perzseli a köveket, egy páratlan, 21 millió éves rejtély bukott felszínre: egy apró tengeritehén fosszíliái, amely egykor a tengerifű-ökoszisztémák kulcsszereplője volt a mai Katar területén...

MA 12:49

A hibás térképszerver az amerikai kormányt is veszélybe sodorja

Az amerikai CISA most kötelezte a szövetségi hivatalokat, hogy haladéktalanul javítsák a GeoServer nevű, nyílt forráskódú térképszerver kritikus sebezhetőségét, mivel a hackerek aktívan kihasználják azt XML External Entity (XXE)-támadásokban...

MA 12:33

Az amerikai részvények költöznek a blokkláncra – itt a tokenizáció

Az amerikai Értékpapír- és Tőzsdefelügyelet (SEC) három évre engedélyezte a Depository Trust & Clearing Corp...

MA 12:01

Az Egyesült Államokban járvány fenyeget: rohamosan terjed a kanyaró

😷 Az idei évben már több mint 1 900 embert, főként gyerekeket betegített meg a kanyaró az Egyesült Államokban, ezzel az ország ismét a járvány küszöbére került...

MA 11:49

Az MI-gigászok csatája: Google kontra OpenAI

🥨 A Google bemutatta eddigi legfejlettebb mesterségesintelligencia-kutató ügynökét, a Gemini Deep Research újragondolt változatát, amely immár a Gemini 3 Pro modellre épül...

MA 11:33

Az olcsó VMware-csomagnak több országban nyoma vész

A Broadcom néhány EMEA (Európa, Közel-Kelet, Afrika) országban megszüntette a VMware vSphere Foundation csomag értékesítését...

MA 11:17

A stresszes patkányok gyorsabban válnak függővé a kannabisztól

🐼 A stresszes patkányok sokkal hajlamosabbak újra és újra kannabiszt fogyasztani, mint kevésbé ideges társaik...

MA 11:02

A Control folytatása sarkaiból fordítja ki Manhattant

🧙 A Remedy Entertainment végre leleplezte a régóta várt Control: Resonánst (Control: Resonant), amely a 2019-ben megjelent, nagy sikert aratott paranormális akciójáték folytatása lesz...