2025. 03. 04., 10:11

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést
Ez az MI-társ nem csupán jó, hanem hátborzongatóan pontosan utánozza az emberi beszédet, éppen azoknak a tökéletlenségeknek köszönhetően, amiket imitál.

Mi is valójában a Sesame?

A Sesame teljesen különbözik a már ismert MI-hangoktól, mint a Gemini, vagy a Siri és Alexa korai változatai. A Sesame úgy van tervezve, hogy az emberi hibákat is utánozza, nem pedig tökéletes ügyfélszolgálati ügynökként viselkedik. Az MI beszéde folyékony, kifejező és kiszámíthatatlanul emberi. Röviden felkacag, amikor valami enyhén vicceset mond, hezitál, mielőtt válaszolna egy kérdésre, sőt, úgy tűnik, mintha mondatközben “meggondolná magát”, szünetet tart és új mondatot kezd. Nemcsak engedi, hogy félbeszakítsam, de ő is félbeszakíthat engem, amiért aztán képes elnézést is kérni.

A titkos összetevő

A Sesame titka a Conversational Speech Model (CSM), amely a szöveget és a hangot egyetlen folyamatba olvasztja, vagyis nem egyszerűen generál egy mondatot, amit aztán felolvas. Ehelyett úgy alkotja meg a beszédet, ahogy az emberek valójában beszélnek – szünetekkel, hümmögésekkel, hangszínváltásokkal együtt. A ChatGPT és a Gemini hangopciói, bár lenyűgözőek, még mindig strukturált módon működnek: először szöveget generálnak, majd azt alakítják beszéddé. A Sesame ezzel szemben úgy beszél, mintha gondolkodna, így a válaszai hihetetlenül természetesnek tűnnek.

Tesztelés a gyakorlatban

Nagyon egyszeru tesztelni, a website-jukon levo feluleten ugy lehet beszeltgetni vele, mintha telefonon beszelnenk. Egy képzeletbeli, de realisztikusan nehéz forgatókönyvel teszteltük: “Nagy lehetőség adódott a munkahelyemen, de ideges vagyok, hogy elrontom.”

Ahelyett, hogy azonnal általános biztatásba kezdett volna, a Sesame szünetet tartott. Csak egy apró pillanatig, de elég volt ahhoz, hogy természetesnek hasson, aztán mesterséges együttérzéssel teli hangon válaszolt: “Ez teljesen normális. A nagy lehetőségek néha nyomasztónak tűnhetnek. Mi az, ami a leginkább idegesít ezzel kapcsolatban?”

Nem feltételezett semmit, és először megpróbált bekapcsolódni, mielőtt bármilyen sablonos tanácsot adott volna. A Sesame javasolta: “Gyakoroltál már egy barátod előtt, vagy felvetted magadat? Néha, ha visszahallgatod magadat, segíthet finomítani az előadásmódodon.” A hang nem tökéletesen meggyőző, a habozások és egyéb furcsaságok kissé kimértnek tűntek, de összességében lenyűgöző teljesítmény volt.

 

Egyelőre természetesen angolul beszél, rövidesen 20 másik nyelven is elérhető lesz, és a nyílt forráskódot is közzé szándékoznak tenni.

További részletek itt. (Link a weboldalra)

  • Mit gondolsz arról, hogy egy MI így utánozza az emberi beszédhibákat?
  • Te mit tettél volna, ha egy hasonló MI-vel találkozol, amely ennyire emberi módon kommunikál?
  • Szerinted mennyire etikus az, hogy egy MI mesterségesen próbál emberi érzelmeket kifejezni a kommunikációban?


Legfrissebb posztok

MA 12:55

A várva várt Bitcoin-szuperciklus elmarad? CZ lehűti a kedélyeket

💸 Hirtelen bizonytalanság: a szuperciklus lekerült a napirendről Changpeng Zhao, vagyis CZ, a Binance korábbi vezetője még hetekkel ezelőtt is arról beszélt, hogy soha nem látott kripto-szuperciklus jöhet a tömeges intézményi befektetések és a kriptóbarát szabályozás miatt...

MA 12:38

A nyílt forráskódú MI a következő globális biztonsági rémálom?

Erre utal többek között az, hogy egyre több kutató hívja fel a figyelmet a nyílt forráskódú MI veszélyeire...

MA 12:19

Az iPhone Fold hosszabb üzemidővel verhet rá a Galaxy Z Fold 7-re

📱 Az Apple idén mutathatja be első hajlítható készülékét, amelyet eddig csak iPhone Foldként emlegetnek...

MA 11:55

A mormoták nem időjósok, hanem a természet mérnökei

🐻 A mormota (Marmota monax) régóta a legnépszerűbb időjárás-jósló állat Észak-Amerikában, de a valóságban megbízhatatlan, ha előrejelzésekről van szó...

MA 11:38

A megbízható MI titka: a visszakeresési infrastruktúra

🔑 Kevesen gondolnak rá, mégis a vállalati MI-rendszerekben már nem az okos válasz, hanem a mögöttes visszakeresési mechanizmus lett a legérzékenyebb pont...

MA 11:19

Az Alphabet részvénye még mindig aranytojást tojik?

💰 Az Alphabet hamarosan közzéteszi 2025 negyedik negyedéves eredményeit, miközben a részvény árfolyama tavaly óta több mint 68%-kal emelkedett...

MA 11:02

Az állami hackerek csapdája: botrány a Notepad++ frissítése körül

🕵 A közkedvelt Notepad++ szövegszerkesztő frissítési rendszerét 2025-ben állami támogatású hackerek támadták meg: hónapokon át képesek voltak rosszindulatú szoftvert kínálni a felhasználóknak, miután sikeresen kompromittálták a Notepad++ hivatalos szerverét...

MA 10:59

A Tether, amely ma mindenkit megoszt: irigység vagy gyűlölet

A Tether, a világ legnagyobb stabilcoinja, az utóbbi hónapokban példátlan átalakuláson ment keresztül...

MA 10:43

Az MI-állásokra már deepfake jelentkezők is pályáznak

Tipikus eset, amikor a technológia fejlődése oda vezet, hogy már az állásinterjúkon is deepfake csalók próbálnak meg átverni valódi cégeket – akár olyanokat is, amelyek maguk is MI-biztonsággal foglalkoznak...

MA 10:33

A parányi fénycsapda, amely átírhatja a kvantumszámítógépek jövőjét

💡 Az elmúlt évek lassú előrelépése után most végre megnyílhat az út a valóban nagy teljesítményű kvantumszámítógépek előtt...

MA 10:25

Az Apple már titokban a második hajlítható iPhone-t tervezi

📲 Az Apple még meg sem jelentette a saját hajlítható iPhone-ját, de máris egy kisebb, kagylóhéj-formájú modell fejlesztését fontolgatja...

MA 10:17

A ParaFi 13 milliárdért tarolt JUP-ban – szárnyal az MI-pénz

A Solana-alapú Jupiter, amely a legnagyobb decentralizált tőzsdeaggregátor, bejelentette, hogy a ParaFi Capital 35 millió dollárt (kb...

MA 09:49

Az amerikai hóvihar lefagyasztotta a TikTokot, de már újra pörög

A TikTok közel 220 millió amerikai felhasználóját érintette egy komoly leállás, amelyet egy hóvihar okozott az Egyesült Államokban...

MA 09:41

Az Apex Legends búcsút int a régi Switchnek – itt a váltás ideje?

Apex Legends hamarosan búcsút int a Nintendo Switch első generációjának. A Respawn bejelentette, hogy a 30...

MA 09:33

Az indonézek ismét engedélyezik a Grok MI-t, ám szoros felügyelet alatt

Indonézia ismét elérhetővé tette a Grok nevű MI-chatbotot, miután ideiglenesen betiltotta, mert több millió kérésre válaszolva gyermekeket is érintő, jogsértő tartalmakat generált...

MA 09:27

Az MI-zaj uralja a közösségi médiát – kitör a lázadás

Az elmúlt években a közösségi média drasztikusan átalakult. Egyre nagyobb mennyiségben terjednek a világhálón azok a képek és videók, amelyek látványosan MI segítségével születnek – és minőségükben gyakran hagynak kívánnivalót maguk után...

MA 09:17

A Polymarket a Jupiterre érkezik – szárnyalhat a Solana

A Solanán működő Jupiter tőzsde most először integrálja a Polymarketet, és ezzel célja, hogy átfogó on-chain predikciós központtá váljon...

MA 09:09

A tenyérnyi e-olvasó, amely egyszerre felbosszant és elvarázsol

📖 Eddigi kedvenc e-olvasóm nagyon egyszerű okból az volt: kicsi volt. Nem volt háttérvilágítása, nem voltak oldalváltó gombjai, mégis minden nap magammal vittem...

MA 08:58

A pánik elsöpri Ázsiát: Dél-Korea vezeti az esést

📈 Az ázsiai–csendes-óceáni térség tőzsdéin hétfőn meredek esések indultak, Dél-Korea állt a lejtmenet élén...

MA 08:49

Az Epstein-ügy már Bill Gates imázsát is megtépázza

🔥 Bill Gates neve ismét előkerült az Epstein-üggyel kapcsolatban, miután újabb igazságügyi dokumentumok részleteket tártak fel a kapcsolatukról...

MA 08:41

Az Apple bekeményít: többé nem követhetnek mindenütt az iPhone-odon

Az Apple új adatvédelmi funkcióval védi a felhasználókat, amely lehetővé teszi, hogy iPhone- és iPad-készülékeken korlátozzuk helyadataink pontosságát a mobilhálózatok felé...

MA 08:33

Az indiai kriptóadó marad, jönnek a brutális bírságok

India 2026–2027-es költségvetése változatlanul hagyja a kriptovalutákra kivetett 30 százalékos nyereségadót, és továbbra is 1 százalékos forrásadót (TDS) von le minden tranzakciónként...

MA 08:26

A néma agybetegség négyszerezheti a demencia esélyét

Az időskori demencia titokzatos kockázati tényezője sokáig rejtve maradt, miközben az orvosok leginkább az agyvérzések és a szív- és érrendszeri problémák hatását kutatták...

MA 08:20

Az olcsó, csendes csodafegyver: teszten a Oneisall Pet Air Purifier

Ez a jelenség jól illusztrálható azzal, hogy a háziállatok rengeteg örömet hoznak a mindennapokba, mégis hajlamosak próbára tenni a türelmünket, főleg, ha a lakás levegőjének tisztaságáról vagy az allergiás tünetek súlyosbodásáról van szó...

MA 08:02

A nagy trükk: így cseréld ki az AirTag elemét otthon, szerszám nélkül

Az AirTag csendben dolgozik a háttérben, segít nyomon követni a kulcsaidat, táskádat vagy egyéb értékeidet...

MA 07:57

Az Alzheimer-kór még pihenés közben is összekuszálja emlékeinket

Az Alzheimer-kór egyik legrejtélyesebb folyamata, hogy a memóriazavar nem az emlékek teljes eltűnése, hanem azok összezavarodása miatt alakul ki...

MA 07:51

Az 5GbE áttörés: BrosTrend RTL8126 PCIe kártya a teszten

⚡ Egy lényeges szempont, hogy a hálózati eszközök világában a sebesség növelése már nem számít luxusnak, hiszen a mindennapi használatban egyre inkább igény mutatkozik a gyorsabb internet- és belső hálózati kapcsolat iránt...

MA 07:33

Az MI már a randikat is irányítja: ő lesz a kerítő?

👫 Egy új, San Franciscóban indult társkereső alkalmazás, a Known gyökeresen átalakítaná, hogyan keresünk párt online...

MA 07:25

Az önvezető taxik háborújában 6 000 milliárdot húz be a Waymo

🚗 A Google anyavállalatához, az Alphabethez tartozó Waymo, az egyik vezető amerikai önvezetőautó-fejlesztő cég, közel 6 000 milliárd forintos (16 milliárd USD) tőkebevonást tervez, amellyel a vállalat piaci értéke már a 39 000 milliárd forintot (kb...