2025. 03. 04., 10:11

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést
Ez az MI-társ nem csupán jó, hanem hátborzongatóan pontosan utánozza az emberi beszédet, éppen azoknak a tökéletlenségeknek köszönhetően, amiket imitál.

Mi is valójában a Sesame?

A Sesame teljesen különbözik a már ismert MI-hangoktól, mint a Gemini, vagy a Siri és Alexa korai változatai. A Sesame úgy van tervezve, hogy az emberi hibákat is utánozza, nem pedig tökéletes ügyfélszolgálati ügynökként viselkedik. Az MI beszéde folyékony, kifejező és kiszámíthatatlanul emberi. Röviden felkacag, amikor valami enyhén vicceset mond, hezitál, mielőtt válaszolna egy kérdésre, sőt, úgy tűnik, mintha mondatközben “meggondolná magát”, szünetet tart és új mondatot kezd. Nemcsak engedi, hogy félbeszakítsam, de ő is félbeszakíthat engem, amiért aztán képes elnézést is kérni.

A titkos összetevő

A Sesame titka a Conversational Speech Model (CSM), amely a szöveget és a hangot egyetlen folyamatba olvasztja, vagyis nem egyszerűen generál egy mondatot, amit aztán felolvas. Ehelyett úgy alkotja meg a beszédet, ahogy az emberek valójában beszélnek – szünetekkel, hümmögésekkel, hangszínváltásokkal együtt. A ChatGPT és a Gemini hangopciói, bár lenyűgözőek, még mindig strukturált módon működnek: először szöveget generálnak, majd azt alakítják beszéddé. A Sesame ezzel szemben úgy beszél, mintha gondolkodna, így a válaszai hihetetlenül természetesnek tűnnek.

Tesztelés a gyakorlatban

Nagyon egyszeru tesztelni, a website-jukon levo feluleten ugy lehet beszeltgetni vele, mintha telefonon beszelnenk. Egy képzeletbeli, de realisztikusan nehéz forgatókönyvel teszteltük: “Nagy lehetőség adódott a munkahelyemen, de ideges vagyok, hogy elrontom.”

Ahelyett, hogy azonnal általános biztatásba kezdett volna, a Sesame szünetet tartott. Csak egy apró pillanatig, de elég volt ahhoz, hogy természetesnek hasson, aztán mesterséges együttérzéssel teli hangon válaszolt: “Ez teljesen normális. A nagy lehetőségek néha nyomasztónak tűnhetnek. Mi az, ami a leginkább idegesít ezzel kapcsolatban?”

Nem feltételezett semmit, és először megpróbált bekapcsolódni, mielőtt bármilyen sablonos tanácsot adott volna. A Sesame javasolta: “Gyakoroltál már egy barátod előtt, vagy felvetted magadat? Néha, ha visszahallgatod magadat, segíthet finomítani az előadásmódodon.” A hang nem tökéletesen meggyőző, a habozások és egyéb furcsaságok kissé kimértnek tűntek, de összességében lenyűgöző teljesítmény volt.

 

Egyelőre természetesen angolul beszél, rövidesen 20 másik nyelven is elérhető lesz, és a nyílt forráskódot is közzé szándékoznak tenni.

További részletek itt. (Link a weboldalra)

  • Mit gondolsz arról, hogy egy MI így utánozza az emberi beszédhibákat?
  • Te mit tettél volna, ha egy hasonló MI-vel találkozol, amely ennyire emberi módon kommunikál?
  • Szerinted mennyire etikus az, hogy egy MI mesterségesen próbál emberi érzelmeket kifejezni a kommunikációban?


Legfrissebb posztok

MA 14:56

Az új Galaxy Z TriFold: telefonhoz óriás, tablethez törpe

A hajlítható kijelzős telefonokban gyerekkori izgatottságomat érzem visszaköszönni. A közel egy évtizeddel ezelőtt bemutatott első Galaxy Foldnál lenyűgözött, hogy egy táblagép méretű kijelző elfért a zsebemben...

MA 14:37

Az első 32 TB-os HDD-k megérkeztek: a Seagate ismét nagyot lép

💻 A Seagate bejelentette, hogy megkezdte a 32TB kapacitású merevlemezek szállítását, melyek a vállalat új generációs, hőasszisztált mágneses rögzítési (HAMR) technológiájára épülnek...

MA 14:19

Az emberiség visszatér a Holdra: itt a NASA új óriásrakétája

A NASA történelmi pillanatra készül: 1972 óta először indíthat újra űrhajósokat a Holdhoz...

MA 14:01

A lángoló Amerika tanulságai, amelyeket mindenkinek tudnia kell

🔥 Egy évvel a pusztító Los Angeles-i erdőtüzek után nehéz elfelejteni, milyen gyorsan és könyörtelenül csapott le a tűz a városra...

MA 13:55

A rajongók kezébe kerül az Ed Sheeran-turné setlistje

Ed Sheeran teljesen új élményt kínál ausztráliai és új-zélandi koncertjein: a rajongók maguk dönthetik el, mely dalok csendülnek fel az est során...

MA 13:38

Az álmatlanság elleni titkos fegyver: három jógapóz lefekvés előtt

Lényeges, hogy az alvásproblémák rengeteg ember életét keserítik meg, és gyakran sem a gyógynövények, sem az altatók nem hoznak valódi megoldást...

MA 13:20

Az igazi biztonság ott kezdődik, amikor te töröd fel a saját rendszered

🔒 A modern digitális korban a biztonság nem arról szól, hogy valamit örökre sebezhetetlenné teszünk, hanem arról, hogy pontosan megértsük, miként lehet mégis áttörni a védelmet...

MA 13:03

A tökéletes timelapse-kamera: a Tikee 4 mindent visz

📸 Fontos kérdés, hogy létezik-e tökéletes timelapse kamera, amely nemcsak rövid, de akár több hónapos vagy éves projekteknél is megbízhatóan működik, ráadásul még távoli helyszíneken is...

MA 12:55

Az univerzum eltűnt csillagai egy lélegzetelállító fotón

A James Webb űrteleszkóp új, lélegzetelállító fotóján por- és gázfelhők narancsos és barna árnyalatai között szikrázó csillaghalmaz ragyog...

MA 12:37

A világ leggyorsabb drónja 657 km/órával döntött rekordot

🚀 Az elmúlt években egy baráti, de annál intenzívebb verseny folyt a drónsebesség-világcsúcsért...

MA 12:20

Az iPhone rejtett kameravezérlője: így hozd ki a maximumot

Az iPhone 16 Pro és iPhone 16 Pro Max megjelenésekor az Apple egy új Kameravezérlő gombbal (amit a cég következetesen csak vezérlőnek, nem gombnak nevez) lepte meg a felhasználókat...

MA 12:01

A megosztottságon túl: így enyhíthető a társadalmi feszültség

A társadalmi véleménykülönbségek gyakran okoznak feszültséget, ezért sokan erőltetnék a konszenzust...

MA 11:55

Az emberi teljesítmény csúcsa 35 évesen jön – aztán visszaesés?

💪 Egy 47 évig tartó svéd kutatás feltárta, mikor kezd hanyatlani az erőnlét és az izomerő...

MA 11:36

A mesterséges intelligencia már-már úgy működik, mint az emberi agy

Az MI-modellek és az emberi agy működése közötti párhuzamokra mutatott rá egy új kutatás, amelyet svájci (EPFL), amerikai (MIT) és georgiai (Georgia Tech) egyetemek tudósai végeztek...

MA 11:19

A mesterséges intelligencia mindent lát rólad a munkahelyeden?

Az MI eddig háttérsegítőként működött az irodában: összegezte a megbeszéléseket, javaslatokat tett, válaszolt a kérdésekre...

MA 11:02

A mikroműanyag veszélybe sodorja az óceánok klímavédő szerepét

🌊 A mikroműanyagok mára nemcsak az élővilágot fenyegetik, hanem az óceánok globális éghajlatszabályozó szerepét is veszélybe sodorják...

MA 10:58

A RAM-válság elérte az okostelefonokat: tényleg jön a trükközés?

💻 Erre utal többek között az is, hogy az idei évben a RAM ára minden eddiginél magasabbra szökik, ami a teljes technológiai iparágra nagy hatással van...

MA 10:49

A NeurIPS 2025 legnagyobb MI-áttörései: innen indul a jövő

🚀 A mesterséges intelligencia fejlődése új irányt vett: már nem pusztán a modellek mérete számít, hanem sokkal inkább az architektúra, a tanítási dinamika és az értékelési stratégia határozza meg, milyen rendszerek születnek...

MA 10:41

A következő nagy dobás: nátriumion-akkuk és új űrállomások

2026-ban az áttörő technológiák új korszaka kezdődik. A nátriumion-akkumulátorokat már óriáscégek fejlesztik, és ezeket az olcsó, hőálló és hosszú élettartamú energiatárolókat hamarosan széles körben bevethetik...