Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést
Ez az MI-társ nem csupán jó, hanem hátborzongatóan pontosan utánozza az emberi beszédet, éppen azoknak a tökéletlenségeknek köszönhetően, amiket imitál.

Mi is valójában a Sesame?

A Sesame teljesen különbözik a már ismert MI-hangoktól, mint a Gemini, vagy a Siri és Alexa korai változatai. A Sesame úgy van tervezve, hogy az emberi hibákat is utánozza, nem pedig tökéletes ügyfélszolgálati ügynökként viselkedik. Az MI beszéde folyékony, kifejező és kiszámíthatatlanul emberi. Röviden felkacag, amikor valami enyhén vicceset mond, hezitál, mielőtt válaszolna egy kérdésre, sőt, úgy tűnik, mintha mondatközben “meggondolná magát”, szünetet tart és új mondatot kezd. Nemcsak engedi, hogy félbeszakítsam, de ő is félbeszakíthat engem, amiért aztán képes elnézést is kérni.

A titkos összetevő

A Sesame titka a Conversational Speech Model (CSM), amely a szöveget és a hangot egyetlen folyamatba olvasztja, vagyis nem egyszerűen generál egy mondatot, amit aztán felolvas. Ehelyett úgy alkotja meg a beszédet, ahogy az emberek valójában beszélnek – szünetekkel, hümmögésekkel, hangszínváltásokkal együtt. A ChatGPT és a Gemini hangopciói, bár lenyűgözőek, még mindig strukturált módon működnek: először szöveget generálnak, majd azt alakítják beszéddé. A Sesame ezzel szemben úgy beszél, mintha gondolkodna, így a válaszai hihetetlenül természetesnek tűnnek.

Tesztelés a gyakorlatban

Nagyon egyszeru tesztelni, a website-jukon levo feluleten ugy lehet beszeltgetni vele, mintha telefonon beszelnenk. Egy képzeletbeli, de realisztikusan nehéz forgatókönyvel teszteltük: “Nagy lehetőség adódott a munkahelyemen, de ideges vagyok, hogy elrontom.”

Ahelyett, hogy azonnal általános biztatásba kezdett volna, a Sesame szünetet tartott. Csak egy apró pillanatig, de elég volt ahhoz, hogy természetesnek hasson, aztán mesterséges együttérzéssel teli hangon válaszolt: “Ez teljesen normális. A nagy lehetőségek néha nyomasztónak tűnhetnek. Mi az, ami a leginkább idegesít ezzel kapcsolatban?”

Nem feltételezett semmit, és először megpróbált bekapcsolódni, mielőtt bármilyen sablonos tanácsot adott volna. A Sesame javasolta: “Gyakoroltál már egy barátod előtt, vagy felvetted magadat? Néha, ha visszahallgatod magadat, segíthet finomítani az előadásmódodon.” A hang nem tökéletesen meggyőző, a habozások és egyéb furcsaságok kissé kimértnek tűntek, de összességében lenyűgöző teljesítmény volt.

 

Egyelőre természetesen angolul beszél, rövidesen 20 másik nyelven is elérhető lesz, és a nyílt forráskódot is közzé szándékoznak tenni.

További részletek itt. (Link a weboldalra)

  • Mit gondolsz arról, hogy egy MI így utánozza az emberi beszédhibákat?
  • Te mit tettél volna, ha egy hasonló MI-vel találkozol, amely ennyire emberi módon kommunikál?
  • Szerinted mennyire etikus az, hogy egy MI mesterségesen próbál emberi érzelmeket kifejezni a kommunikációban?


Legfrissebb posztok

MA 15:33

A Google Fotók végre megérkezik a Samsung okostévékre

Jövőre a Samsung okostévék egy igazán várt újítással bővülnek, ugyanis 2026 márciusától elérhetővé válik rajtuk a Google Photos...

MA 15:02

A steril űr csak mítosz: mikrobák virulnak a NASA tiszta szobáiban

Hiába számítanak a világ egyik legtisztább helyének a NASA űreszköz-összeszerelő tisztaszobái, a makacs mikrobák még itt is megtalálják az élethez vezető kiskapukat...

MA 14:50

A 2026-os kozmikus csodák éve: a Nap és a Hold tarol

Érdemes megvizsgálni, milyen látványos égi események várják 2026-ban azokat, akik ébren maradnak egy-egy hosszú éjszakán...

MA 14:36

Az olcsó Google Pixel Buds 2a meglepően jó, mégsem hibátlan

A Google hangkiegészítői eddig nem tudtak igazán nagyot villantani a fülhallgatók piacán, de a Pixel Buds 2a végre egy olyan vezeték nélküli fülhallgató, amely használható alternatívát kínál – ha nem is ver le mindenkit a pályáról...

MA 14:18

Az új Samsung hangszórók a Sonos trónjára pályáznak

🎧 Lényeges, hogy a Samsung az idei CES előtt mutatta be vadonatúj Music Studio hangszóróit, amelyek formaterve és tudása egyértelműen a Sonos népszerű Era modelljeire jelentenek közvetlen kihívást...

MA 13:50

Az idősek MI-társat keresnek, miközben Kína tiltaná a családklónozást

👨‍🦺 Érdemes megvizsgálni, hogy Kína ismét szigorú szabályokat tervez: most azt tiltanák be, hogy saját magukból vagy rokonaikból MI-társalkodót készítsenek idősebb hozzátartozóik kedvéért...

MA 13:34

Az analóg hangzás reneszánsza: Bluetooth-os kazettás átalakító házilag

🎧 Elfelejthetjük a nagyfelbontású streaminget, most a lo-fi, azaz az alacsony hanghűség a menő...

MA 13:16

A digitális euró küszöbön: mi lesz a készpénzzel?

2029. január 1-jén elindul a digitális euró, amely teljesen átalakítja a mindennapi fizetést...

MA 12:33

A gigantikus Samsung-akkura még vár a világ

🔋 A Samsung a pletykák szerint egy elképesztően nagy, 20 000 mAh kapacitású okostelefonos akkumulátoron dolgozik, amely négyszerese a jelenlegi Galaxy S24 Ultra 5 000 mAh-s akkumulátorának...

MA 12:18

A Samsung új csúcshangprojektorai szembeszállnak a Sonos Arc Ultrával

Érdemes megvizsgálni, hogy a Samsung már a CES 2026 előtt bemutatta két vadonatúj, Dolby Atmos-kompatibilis csúcskategóriás hangprojektorát...

MA 10:58

Az MI-chatbotok jövőjét Kína új szabályai diktálják

🌐 Kínában a kibertérért felelős hatóság új szabályokat tervez, amelyek korlátoznák a mesterséges intelligenciával működő chatrobotok érzelmi befolyását, különös tekintettel az öngyilkosság, az önsértés és a szerencsejáték témájára...

MA 10:43

A legjobb ingyenes eszközök, hogy új zenékre találj online

Hangjegyek, klasszikus zenei kották mindig kéznél – élmény, amiért sokan rajonganak...

MA 10:36

A MI-csevegők sötét oldala: kiválthatnak pszichózist?

Egy kaliforniai pszichiáter már több mint egy tucat betegnél diagnosztizált MI-okozta pszichózist, közülük tizenkettő kórházi kezelést igényelt, három pedig ambuláns ellátásra szorult...

MA 10:23

A négy techrészvény, amely lepipálhatja az összes kriptót

💰 Lényeges szempont, hogy a kriptovalutákat sokan hatalmas növekedési potenciáljuk miatt imádják, de ez a piac rendkívül volatilis és legtöbbször kiszámíthatatlan...

MA 10:15

Az Ubisoft bakija: 5 milliárd R6 Credit, jön az offline hétvége

A Tom Clancy: Rainbow Six – Ostrom (Tom Clancy’s Rainbow Six Siege) váratlanul több mint 24 órára elérhetetlenné vált, miután hackerek betörtek a szerverekre, és a játékosok számláit valós pénzben 4,7 milliárd forint értékű (2 milliárd R6 Credit, kb...

MA 10:02

Az ADHD-gyógyszerek máshogy hatnak, mint eddig gondoltuk

🧠 Egy lényeges szempont, hogy az ADHD kezelésére használt stimuláns gyógyszerekről, mint a Ritalin vagy az Adderall, hosszú ideje az a kép él, hogy közvetlenül javítják a figyelmet és a koncentrációt...

MA 09:58

A jövő adatközpontja: föld alatt, az űrben vagy szaunában?

Az MI fejlődése többek között minden eddiginél nagyobb energiát kíván a digitális világtól...

MA 09:37

Az őslakosok döntik el a klímamodellek jövőjét

🌎 Külön említést érdemel, hogy a fejlett számítógépes éghajlati modellek már nem csupán áramlatok, növényzet és tűzveszély előrejelzésére szolgálnak: kidolgoztak egy módszert, amely lehetővé teszi az őslakos közösségek értékes visszajelzéseinek beépítését is...

MA 09:29

A zseni, aki feltalálta a nanotechnológiát: Feynman legendás előadása

1959. december 29-én Richard Feynman, a fizika fenegyereke, egy rövid, szórakoztató előadáson a Caltechen olyan jövőképet vázolt fel, amely évtizedekkel megelőzte a nanotechnológia fogalmának megszületését...