Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést
Ez az MI-társ nem csupán jó, hanem hátborzongatóan pontosan utánozza az emberi beszédet, éppen azoknak a tökéletlenségeknek köszönhetően, amiket imitál.

Mi is valójában a Sesame?

A Sesame teljesen különbözik a már ismert MI-hangoktól, mint a Gemini, vagy a Siri és Alexa korai változatai. A Sesame úgy van tervezve, hogy az emberi hibákat is utánozza, nem pedig tökéletes ügyfélszolgálati ügynökként viselkedik. Az MI beszéde folyékony, kifejező és kiszámíthatatlanul emberi. Röviden felkacag, amikor valami enyhén vicceset mond, hezitál, mielőtt válaszolna egy kérdésre, sőt, úgy tűnik, mintha mondatközben “meggondolná magát”, szünetet tart és új mondatot kezd. Nemcsak engedi, hogy félbeszakítsam, de ő is félbeszakíthat engem, amiért aztán képes elnézést is kérni.

A titkos összetevő

A Sesame titka a Conversational Speech Model (CSM), amely a szöveget és a hangot egyetlen folyamatba olvasztja, vagyis nem egyszerűen generál egy mondatot, amit aztán felolvas. Ehelyett úgy alkotja meg a beszédet, ahogy az emberek valójában beszélnek – szünetekkel, hümmögésekkel, hangszínváltásokkal együtt. A ChatGPT és a Gemini hangopciói, bár lenyűgözőek, még mindig strukturált módon működnek: először szöveget generálnak, majd azt alakítják beszéddé. A Sesame ezzel szemben úgy beszél, mintha gondolkodna, így a válaszai hihetetlenül természetesnek tűnnek.

Tesztelés a gyakorlatban

Nagyon egyszeru tesztelni, a website-jukon levo feluleten ugy lehet beszeltgetni vele, mintha telefonon beszelnenk. Egy képzeletbeli, de realisztikusan nehéz forgatókönyvel teszteltük: “Nagy lehetőség adódott a munkahelyemen, de ideges vagyok, hogy elrontom.”

Ahelyett, hogy azonnal általános biztatásba kezdett volna, a Sesame szünetet tartott. Csak egy apró pillanatig, de elég volt ahhoz, hogy természetesnek hasson, aztán mesterséges együttérzéssel teli hangon válaszolt: “Ez teljesen normális. A nagy lehetőségek néha nyomasztónak tűnhetnek. Mi az, ami a leginkább idegesít ezzel kapcsolatban?”

Nem feltételezett semmit, és először megpróbált bekapcsolódni, mielőtt bármilyen sablonos tanácsot adott volna. A Sesame javasolta: “Gyakoroltál már egy barátod előtt, vagy felvetted magadat? Néha, ha visszahallgatod magadat, segíthet finomítani az előadásmódodon.” A hang nem tökéletesen meggyőző, a habozások és egyéb furcsaságok kissé kimértnek tűntek, de összességében lenyűgöző teljesítmény volt.

 

Egyelőre természetesen angolul beszél, rövidesen 20 másik nyelven is elérhető lesz, és a nyílt forráskódot is közzé szándékoznak tenni.

További részletek itt. (Link a weboldalra)

  • Mit gondolsz arról, hogy egy MI így utánozza az emberi beszédhibákat?
  • Te mit tettél volna, ha egy hasonló MI-vel találkozol, amely ennyire emberi módon kommunikál?
  • Szerinted mennyire etikus az, hogy egy MI mesterségesen próbál emberi érzelmeket kifejezni a kommunikációban?



Legfrissebb posztok

MA 18:30

Veszélyes Windows-hibák az októberi frissítésben, frissíts mielőbb

⚠ A Microsoft legújabb, októberi Patch Tuesday-je igazi rémálom a rendszergazdáknak: több mint 175 biztonsági hibát javítottak, amelyek közül hármat jelenleg is kihasználnak, további hármat pedig már nyilvánosan ismernek...

MA 18:26

Az MI már a naptáradban is időpontot egyeztet

📅 A Google egy új MI-alapú eszközt vezet be, amely megkönnyíti a Gmailt és a Google Naptárt használóknak a találkozók megszervezését...

MA 18:00

Nobel-díjas tudósok járják be a világot, elismerés mindenhol

🎓 A tudomány legkiemelkedőbb teljesítményeit díjazó Nobel-díjak történetében újra és újra szembetűnik, hogy a tudósok útja ritkán egyenes – sőt, sokszor egész kontinenseket szelnek át, mire rangos elismerésben részesülnek...

MA 17:30

Az Office ikonok, amelyeket a Microsoft soha nem mert bevezetni

🛠 A Microsoft legújabb Office-ikonjai világszerte megjelennek a felhasználók képernyőin, de csak kevesen tudják, hány különös és szokatlan tervet utasított el a vállalat, mire megszületett a végleges dizájn...

MA 17:00

Így szúrd ki, ha Sora 2 videója át akar verni

👀 A Sora 2, az OpenAI fejlett szövegből videót készítő modellje mérföldkő a mesterséges intelligencia fejlődésében...

MA 16:29

Az MI-modellek tudáshiányos világa: óriási az elmaradás

A nagy nyelvi MI-modellek fejlődését beárnyékolja, hogy sok lényeges emberi tudás kimarad a képzésükből...

MA 16:02

Lehet, hogy a tévéd már a mesterséges intelligencia arcoddal hirdet?

🤔 A DirecTV 2026-tól radikális újdonsággal készül a Gemini streaming eszközein: érkeznek az MI által generált reklámképernyők, amelyeken akár a te arcod is főszerepet kaphat...

MA 15:59

Most már flörtölnek a mesterséges intelligenciák, és pénzt is termelnek

😉 Az OpenAI vezérigazgatója, Sam Altman nemrégiben bejelentette, hogy a ChatGPT hamarosan képes lesz felnőtt felhasználók számára erotikus tartalmakat is létrehozni, miután a vállalat szerinte már orvosolta a mesterséges intelligenciával folytatott beszélgetések okozta mentális egészségi kockázatokat...

MA 15:30

A CDC elbocsátásai veszélybe sodorhatják az egész országot

Az Egyesült Államok Járványügyi Központjánál (CDC) az elmúlt hétvégén tömeges elbocsátások zajlottak le, amelyek alapjaiban rengették meg a közegészségügyi rendszer működését...

MA 15:01

Tényleg fiatalabb lesz az immunrendszerünk, ha edzünk?

💪 Az egész életen át tartó állóképességi sportolás nemcsak az izmokat, hanem az immunrendszert is folyamatosan edzésben tartja, így az fiatalosan és hatékonyan működik...

MA 14:59

Az égen feltűnt legfurcsább rádiókarika titka

👀 A világ legerősebb és legtávolabbi rádiókarikájára (furcsa rádiókarika, ORC – odd radio circle) bukkant rá egy nemzetközi csillagászcsapat, amelyben lelkes amatőrök is részt vettek...

MA 14:31

Soha nem látott gamma-kitörés, fekete lyuk nyelte el a hatalmas csillagot

💫 2025. július 2-án az amerikai NASA Fermi Gamma-ray Burst Monitor (Fermi-GBM) közel három órán át észlelt jeleket ugyanabból a forrásból...

MA 14:02

Tévedtünk a holdkráterrel kapcsolatban, de most már tisztábban látunk

A Hold legnagyobb és legősibb kráteréről, a Déli-sark–Aitken (South Pole–Aitken) medencéről csak most derült ki, mennyire másként keletkezett, mint eddig gondoltuk...

MA 13:59

Az asztali minigép, amellyel a MI beköltözik az irodába

💻 Az Nvidia új, mindössze 1,2 kg súlyú számítógépe, a DGX Spark, 128 GB egyesített memóriával és egy petaflops számítási teljesítménnyel érkezik, mindezt egy 15 x 15 x 5 cm-es dobozban...

MA 13:45

Az MI-vel évente 36 milliárdot spórol a Salesforce

A Salesforce ügyfélszolgálati folyamatai MI-alapú eszközökkel működnek, amelyek évente körülbelül 36 milliárd forint megtakarítást hoznak a cégnek...

MA 10:32

Átírhatják az ősi aranysziklák az élet történetét

Évmilliárdokkal ezelőtt, amikor a Földet még sűrű, oxigénhiányos tengerek borították, aligha gondolnánk, hogy ekkor is rejtőzhettek már komplex élőlények...

MA 10:22

Az új Samsung Moohan szemüveg mindent felforgathat

👀 A Samsung hivatalosan is bejelentette, hogy október 21-én este 10 órakor bemutatja a régóta várt Project Moohan vegyes valóság szemüveget...

MA 10:16

Polgárok próbálják visszaszerezni az irányítást a mesterséges intelligencia felett

Tíz jelentős amerikai filantróp szervezet fogott össze, hogy ne csak néhány technológiai milliárdos döntsön arról, mire használják a mesterséges intelligenciát, hanem a hétköznapi emberek érdekei is érvényesüljenek...

MA 10:08

A Google szégyene: füstölgő Pixel 10 Pro Fold a hajlításteszten

🔥 A Google legújabb csúcsmobilja, a Pixel 10 Pro Fold igazán drámai bukást produkált a híres JerryRigEverything YouTube-csatorna hajlítástesztjén...