Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést
Ez az MI-társ nem csupán jó, hanem hátborzongatóan pontosan utánozza az emberi beszédet, éppen azoknak a tökéletlenségeknek köszönhetően, amiket imitál.

Mi is valójában a Sesame?

A Sesame teljesen különbözik a már ismert MI-hangoktól, mint a Gemini, vagy a Siri és Alexa korai változatai. A Sesame úgy van tervezve, hogy az emberi hibákat is utánozza, nem pedig tökéletes ügyfélszolgálati ügynökként viselkedik. Az MI beszéde folyékony, kifejező és kiszámíthatatlanul emberi. Röviden felkacag, amikor valami enyhén vicceset mond, hezitál, mielőtt válaszolna egy kérdésre, sőt, úgy tűnik, mintha mondatközben “meggondolná magát”, szünetet tart és új mondatot kezd. Nemcsak engedi, hogy félbeszakítsam, de ő is félbeszakíthat engem, amiért aztán képes elnézést is kérni.

A titkos összetevő

A Sesame titka a Conversational Speech Model (CSM), amely a szöveget és a hangot egyetlen folyamatba olvasztja, vagyis nem egyszerűen generál egy mondatot, amit aztán felolvas. Ehelyett úgy alkotja meg a beszédet, ahogy az emberek valójában beszélnek – szünetekkel, hümmögésekkel, hangszínváltásokkal együtt. A ChatGPT és a Gemini hangopciói, bár lenyűgözőek, még mindig strukturált módon működnek: először szöveget generálnak, majd azt alakítják beszéddé. A Sesame ezzel szemben úgy beszél, mintha gondolkodna, így a válaszai hihetetlenül természetesnek tűnnek.

Tesztelés a gyakorlatban

Nagyon egyszeru tesztelni, a website-jukon levo feluleten ugy lehet beszeltgetni vele, mintha telefonon beszelnenk. Egy képzeletbeli, de realisztikusan nehéz forgatókönyvel teszteltük: “Nagy lehetőség adódott a munkahelyemen, de ideges vagyok, hogy elrontom.”

Ahelyett, hogy azonnal általános biztatásba kezdett volna, a Sesame szünetet tartott. Csak egy apró pillanatig, de elég volt ahhoz, hogy természetesnek hasson, aztán mesterséges együttérzéssel teli hangon válaszolt: “Ez teljesen normális. A nagy lehetőségek néha nyomasztónak tűnhetnek. Mi az, ami a leginkább idegesít ezzel kapcsolatban?”

Nem feltételezett semmit, és először megpróbált bekapcsolódni, mielőtt bármilyen sablonos tanácsot adott volna. A Sesame javasolta: “Gyakoroltál már egy barátod előtt, vagy felvetted magadat? Néha, ha visszahallgatod magadat, segíthet finomítani az előadásmódodon.” A hang nem tökéletesen meggyőző, a habozások és egyéb furcsaságok kissé kimértnek tűntek, de összességében lenyűgöző teljesítmény volt.

 

Egyelőre természetesen angolul beszél, rövidesen 20 másik nyelven is elérhető lesz, és a nyílt forráskódot is közzé szándékoznak tenni.

További részletek itt. (Link a weboldalra)

  • Mit gondolsz arról, hogy egy MI így utánozza az emberi beszédhibákat?
  • Te mit tettél volna, ha egy hasonló MI-vel találkozol, amely ennyire emberi módon kommunikál?
  • Szerinted mennyire etikus az, hogy egy MI mesterségesen próbál emberi érzelmeket kifejezni a kommunikációban?


Legfrissebb posztok

szombat 18:40

Leghaszontalanabb amerikai szlengek és idiómák

“Wallet biopsy” Szó szerint: pénztárca-biopszia 💸, amikor egy orvos vagy egészségügyi szolgáltató előbb ellenőrzi 🔬, mennyi pénzed / biztosításod van, és aztán dönti el, milyen vizsgálatot kapsz...

csütörtök 18:24

Penrose szám: A bizonyíték Isten létére?

Sir Roger Penrose brit matematikus és elméleti fizikus, aki a fekete lyukak szingularitásának és az általános relativitáselmélet új matematikai alapjainak feltárásáért kapott Nobel-díjat, az 1970-es években sokkoló, a tudományos világot megosztó tézist közölt...

MA 08:38

Az OpenAI könyvbotránya: titokban törölt adatok, közelgő pervihar

Az OpenAI nehéz helyzetbe került, miután kénytelen lehet magyarázatot adni arra, miért törölte azokat az adathalmazokat, amelyeket engedély nélkül, kalózkönyvekből állított össze...

MA 08:29

Az Instagram visszarendeli a dolgozókat – tényleg vége a home office-nak?

💻 2026 februárjától az Instagramnál dolgozók heti öt napot töltenek az irodában...

MA 08:22

Az internetes tanúsítványok érvényessége vészesen rövidül

Let’s Encrypt, a világ egyik legnagyobb hitelesítésszolgáltatója hamarosan jelentősen lerövidíti az általa kiadott tanúsítványok érvényességi idejét...

MA 08:16

Az új hárompaneles szenzáció: mindjárt itt a Galaxy Z TriFold

A Samsung bemutatta legújabb csúcsmodelljét, a várva várt Galaxy Z TriFoldot...

MA 08:01

Távozik az Apple MI-vezére, új sztárkutató érkezik

John Giannandrea, az Apple gépi tanulási és MI-stratégiáért felelős alelnöke távozik pozíciójából, és 2026 tavaszán visszavonul...

MA 07:57

Az első nagy áttörés: már felismerjük, ha téved a kvantumszámítógép

A kvantumszámítógépek hosszú évek óta ígérik, hogy megoldják azokat a problémákat is, amelyekre még a legerősebb hagyományos gépek is csak évmilliók alatt adnának választ...

MA 07:51

A sötét webtől a hamis Wi‑Fi-ig: bukott a három kontinensen működő bűnszervezet

Kezdetben négy embert vettek őrizetbe Dél-Koreában, akik több mint 120 000 hálózati IP-kamerát törtek fel...

MA 07:45

Az illegális ritkaföldfém-bányászat pusztulásba taszítja Mianmart

🚨 Mianmar keleti határvidékein, különösen a kínai határ menti Shan államban, hatalmas léptékben zajlik az ellenőrizetlen ritkaföldfém-bányászat, amely már súlyos károkat okozott a környezetben és a helyi közösségekben...

MA 07:36

Az Nvidia új MI-megoldásokkal rohamozza az önvezetés piacát

Az Nvidia új, nyílt MI-modelleket és fejlesztői eszközöket mutatott be, amelyek célja, hogy áttörést hozzanak a robotika és az önvezető járművek területén...

MA 07:22

Az amerikai techcégek Fülöp-szigeteki munkásokkal tréningelik MI-jüket

Flock, az automatikus rendszámtábla-leolvasó és MI-alapú kamera­rendszereiről ismert vállalat, külföldi alkalmi dolgozókat alkalmazza MI-jének betanítására...

MA 07:16

A Marson életet mentő baktériumok forradalmasíthatják az építkezést

Az emberiség évtizedek óta álmodik arról, hogy egyszer saját lábára álljon idegen bolygón...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 12/2

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     LUCH: Photo Effects & Filters (iPhone/iPad)A LUCH Films egy modern fotóalkalmazás, amely képeidet filmes, analóg stílusú szerkesztésekké alakítja át...

MA 07:09

A beszélő asszisztens megérkezett: itt a kínai „A nő” telefon

December 1-jén Kínában bemutatkozott egy új MI-hangasszisztens okostelefonokra, amely már nemcsak egy egyszerű alkalmazás, hanem inkább egy személyi titkárhoz hasonlóan működik...

MA 07:02

A Glassworm visszatért: fertőzött VS Code-bővítmények árasztják el a piacot

🐛 A Glassworm nevű kártékony szoftver ismét támadásba lendült: legutóbb 24 új bővítmény jelent meg az OpenVSX és a Microsoft Visual Studio Marketplace felületein...

MA 06:57

Az ősi cápák és ráják visszakapaszkodnak a kihalás széléről

🦈 A veszélyeztetett élővilág nemzetközi kereskedelmét szabályozó egyezmény szigorította több ikonikus cápa- és rájafaj védelmét...

MA 06:50

A SmartTube-ot feltörték Android TV-n: veszélyes frissítés érkezett

⚠ A SmartTube nevű, nyílt forráskódú YouTube-kliens az egyik legnépszerűbb harmadik féltől származó alkalmazás Android TV-hez, Fire TV Stickekhez és okostévés boxokhoz...

MA 06:43

A nagybankok új fegyvere az MI: milliárdokért dúl a verseny

A HSBC újabb nagy dobással rukkolt elő: a bank többéves megállapodást kötött a francia Mistral MI-céggel, hogy generatív MI-megoldásokkal gyorsítsa fel működését és növelje eredményességét...