Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést
Ez az MI-társ nem csupán jó, hanem hátborzongatóan pontosan utánozza az emberi beszédet, éppen azoknak a tökéletlenségeknek köszönhetően, amiket imitál.

Mi is valójában a Sesame?

A Sesame teljesen különbözik a már ismert MI-hangoktól, mint a Gemini, vagy a Siri és Alexa korai változatai. A Sesame úgy van tervezve, hogy az emberi hibákat is utánozza, nem pedig tökéletes ügyfélszolgálati ügynökként viselkedik. Az MI beszéde folyékony, kifejező és kiszámíthatatlanul emberi. Röviden felkacag, amikor valami enyhén vicceset mond, hezitál, mielőtt válaszolna egy kérdésre, sőt, úgy tűnik, mintha mondatközben “meggondolná magát”, szünetet tart és új mondatot kezd. Nemcsak engedi, hogy félbeszakítsam, de ő is félbeszakíthat engem, amiért aztán képes elnézést is kérni.

A titkos összetevő

A Sesame titka a Conversational Speech Model (CSM), amely a szöveget és a hangot egyetlen folyamatba olvasztja, vagyis nem egyszerűen generál egy mondatot, amit aztán felolvas. Ehelyett úgy alkotja meg a beszédet, ahogy az emberek valójában beszélnek – szünetekkel, hümmögésekkel, hangszínváltásokkal együtt. A ChatGPT és a Gemini hangopciói, bár lenyűgözőek, még mindig strukturált módon működnek: először szöveget generálnak, majd azt alakítják beszéddé. A Sesame ezzel szemben úgy beszél, mintha gondolkodna, így a válaszai hihetetlenül természetesnek tűnnek.

Tesztelés a gyakorlatban

Nagyon egyszeru tesztelni, a website-jukon levo feluleten ugy lehet beszeltgetni vele, mintha telefonon beszelnenk. Egy képzeletbeli, de realisztikusan nehéz forgatókönyvel teszteltük: “Nagy lehetőség adódott a munkahelyemen, de ideges vagyok, hogy elrontom.”

Ahelyett, hogy azonnal általános biztatásba kezdett volna, a Sesame szünetet tartott. Csak egy apró pillanatig, de elég volt ahhoz, hogy természetesnek hasson, aztán mesterséges együttérzéssel teli hangon válaszolt: “Ez teljesen normális. A nagy lehetőségek néha nyomasztónak tűnhetnek. Mi az, ami a leginkább idegesít ezzel kapcsolatban?”

Nem feltételezett semmit, és először megpróbált bekapcsolódni, mielőtt bármilyen sablonos tanácsot adott volna. A Sesame javasolta: “Gyakoroltál már egy barátod előtt, vagy felvetted magadat? Néha, ha visszahallgatod magadat, segíthet finomítani az előadásmódodon.” A hang nem tökéletesen meggyőző, a habozások és egyéb furcsaságok kissé kimértnek tűntek, de összességében lenyűgöző teljesítmény volt.

 

Egyelőre természetesen angolul beszél, rövidesen 20 másik nyelven is elérhető lesz, és a nyílt forráskódot is közzé szándékoznak tenni.

További részletek itt. (Link a weboldalra)

  • Mit gondolsz arról, hogy egy MI így utánozza az emberi beszédhibákat?
  • Te mit tettél volna, ha egy hasonló MI-vel találkozol, amely ennyire emberi módon kommunikál?
  • Szerinted mennyire etikus az, hogy egy MI mesterségesen próbál emberi érzelmeket kifejezni a kommunikációban?


Legfrissebb posztok

MA 18:33

Az önzetlenség tényleg fiatalít: évekkel fiatalabb lehet az agy

💪 Segíteni másokon hetente néhány órán át nemcsak jó érzés, hanem úgy tűnik, évekkel lassíthatja az agy öregedését...

MA 18:17

Az UEFI-hiba alaplapok millióit veszélyezteti

Számos ASUS, Gigabyte, MSI és ASRock alaplap UEFI firmware-je új, kritikus biztonsági hibával küzd, amely lehetővé teszi a támadók számára, hogy fizikai hozzáféréssel, még a gép indulása előtt, megtámadják a rendszert...

MA 17:49

Az amerikaiak kezébe kerül a TikTok irányítása

A TikTok megegyezett abban, hogy jelentős tulajdonrészt enged át amerikai befektetőknek amerikai üzletágában, véget vetve ezzel egy évek óta húzódó vitának, amelyben a kormányzat rendszeresen szorgalmazta a platform szétválasztását...

MA 17:01

Az Ursidák éjszakája: csillaghullás a téli napfordulón

✨ Ha december 21–22. éjszakáján fent maradsz, érdemes kifeküdni az éjszakai ég alá, mert ekkor tetőzik az éves Ursidák meteorraj...

MA 16:50

Az Instacart-botrány ára: 21 milliárdos visszatérítés

💳 Az Instacart, Észak-Amerika egyik legnagyobb online élelmiszer-kiszállító szolgáltatása, 21 milliárd forintot (60 millió amerikai dollárt) fizet vissza ügyfeleinek, miután a Szövetségi Kereskedelmi Bizottság (FTC) megállapította, hogy a cég megtévesztő előfizetési gyakorlatokat alkalmazott...

MA 16:33

Az amerikai TikTok végre új gazdára talál

Az USA-ban használt TikTok hamarosan új kezekbe kerül: a kínai ByteDance eladja az üzlet jelentős részét, hogy megfeleljen az amerikai kormány elvárásainak...

MA 16:17

A világűrben robbant fel egy Starlink műhold?

Egy Starlink-műhold váratlan meghibásodás miatt hirtelen magasságot vesztett, miközben törmelékfelhőt hagyott maga után a Föld körüli pályán...

MA 16:01

A Starlink-műhold felrobbant, űrszemétté vált darabok keringenek

🛰 A SpaceX egyik Starlink-műholdja váratlanul felrobbant, ami nyomon követhető törmeléket hagyott maga után az űrben...

MA 15:50

A japán szuperlézer fémet olvaszt, drónokat vadászik

🔥 Japán egy forradalmian új, nagy teljesítményű lézerfegyvert tesztel tengerészeti körülmények között, amely 100 kilowattos lézernyalábbal képes átvágni a fémet, és lelőni a drónokat akár repülés közben is...

MA 15:34

A fák évgyűrűi feltárhatják a víztakarékosság jövőjét

Erre utal többek között az, hogy a fák évgyűrűi sokkal többről árulkodnak, mint gondolnánk: képesek betekintést nyújtani a bolygó múltjába, így akár Ohio elrejtett környezeti történetének hiányzó részeit is segíthetnek feltárni...

MA 15:18

Az Android 16 emodzsiözönt hoz – íme a részletek

Android 16 már most elérhetővé teszi a 163 vadonatúj emodzsit azoknak, akik a legfrissebb QPR3 bétát használják...

MA 15:02

Az orosz hekkerek már a dán ivóvizet is célba vették

Dániában az orosz államhoz köthető hackercsoportok hajtottak végre több pusztító kibertámadást, amelyek a kritikus infrastruktúrát célozták, különösen a vízellátó rendszert...

MA 14:50

Az amatőr madarászok adatai felpörgetik a madárvédelmet

🐟 Nehéz elhinni, de az évtizedek óta csökkenő madárállományok megmentésében most olyan adatbázok játszanak kulcsszerepet, amelyek madármegfigyelők önkéntes munkájára épülnek...

MA 14:18

Az új Lenovo Legion Go 2 és a feltekerhető gamer laptop berobbant

🔥 A Lenovo két vadonatúj eszközének részletei szivárogtak ki, amelyek várhatóan 2026-ban, a CES-en debütálnak: az egyik a SteamOS-t futtató Legion Go 2 kézikonzol, a másik pedig a Legion Pro Rollable, egy különleges, tekercselhető, OLED-kijelzős gamer laptop...

MA 14:01

Az elmaradt árvízriasztás tragédiát hozott egy texasi táborban

🚨 Július 4-én a texasi Camp Mystic területén pusztító árvíz következtében 27 ember, köztük 25 gyermek vesztette életét...

MA 13:49

A mesterséges intelligencia bedarálja a gasztrobloggerek megélhetését

Az MI-alapú összefoglalók és „Frankenstein”-receptek egyre inkább elárasztják az internetet, sokszor szakácsok és gasztrobloggerek évek alatt kidolgozott munkáját felhasználva, gyakran forrásmegjelölés nélkül és kiforgatott formában...

MA 13:33

Az Apple mostantól behajtóként kopogtat a fejlesztőknél

Az Apple frissítette fejlesztői szerződését, amely lehetővé teszi számára, hogy automatikusan levonja a tartozásokat – például elmaradt jutalékokat vagy díjakat – a fejlesztők alkalmazáson belüli vásárlásokból származó bevételeiből, egyebek mellett...

MA 13:18

Az internet szíve: így működik egy MI-adatközpont belülről

💻 Felmerül a kérdés, mit jelent, amikor azt mondjuk: egy épület központi szerepet játszik az internet életében...

MA 13:02

Az adatközpontokban építési láz tombol: új csúcsok felé száguldunk

Érdemes megvizsgálni, hogy az adatközpont-piacra eddig soha nem látott pénz áramlik: 2025-ben már több mint 61 milliárd dollár, vagyis közel 22 ezer milliárd forint forog a szektorban...