2025. 03. 04., 10:11

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést

Döbbenetes, ahogy ez az MI utánozza az emberi beszélgetést
Ez az MI-társ nem csupán jó, hanem hátborzongatóan pontosan utánozza az emberi beszédet, éppen azoknak a tökéletlenségeknek köszönhetően, amiket imitál.

Mi is valójában a Sesame?

A Sesame teljesen különbözik a már ismert MI-hangoktól, mint a Gemini, vagy a Siri és Alexa korai változatai. A Sesame úgy van tervezve, hogy az emberi hibákat is utánozza, nem pedig tökéletes ügyfélszolgálati ügynökként viselkedik. Az MI beszéde folyékony, kifejező és kiszámíthatatlanul emberi. Röviden felkacag, amikor valami enyhén vicceset mond, hezitál, mielőtt válaszolna egy kérdésre, sőt, úgy tűnik, mintha mondatközben “meggondolná magát”, szünetet tart és új mondatot kezd. Nemcsak engedi, hogy félbeszakítsam, de ő is félbeszakíthat engem, amiért aztán képes elnézést is kérni.

A titkos összetevő

A Sesame titka a Conversational Speech Model (CSM), amely a szöveget és a hangot egyetlen folyamatba olvasztja, vagyis nem egyszerűen generál egy mondatot, amit aztán felolvas. Ehelyett úgy alkotja meg a beszédet, ahogy az emberek valójában beszélnek – szünetekkel, hümmögésekkel, hangszínváltásokkal együtt. A ChatGPT és a Gemini hangopciói, bár lenyűgözőek, még mindig strukturált módon működnek: először szöveget generálnak, majd azt alakítják beszéddé. A Sesame ezzel szemben úgy beszél, mintha gondolkodna, így a válaszai hihetetlenül természetesnek tűnnek.

Tesztelés a gyakorlatban

Nagyon egyszeru tesztelni, a website-jukon levo feluleten ugy lehet beszeltgetni vele, mintha telefonon beszelnenk. Egy képzeletbeli, de realisztikusan nehéz forgatókönyvel teszteltük: “Nagy lehetőség adódott a munkahelyemen, de ideges vagyok, hogy elrontom.”

Ahelyett, hogy azonnal általános biztatásba kezdett volna, a Sesame szünetet tartott. Csak egy apró pillanatig, de elég volt ahhoz, hogy természetesnek hasson, aztán mesterséges együttérzéssel teli hangon válaszolt: “Ez teljesen normális. A nagy lehetőségek néha nyomasztónak tűnhetnek. Mi az, ami a leginkább idegesít ezzel kapcsolatban?”

Nem feltételezett semmit, és először megpróbált bekapcsolódni, mielőtt bármilyen sablonos tanácsot adott volna. A Sesame javasolta: “Gyakoroltál már egy barátod előtt, vagy felvetted magadat? Néha, ha visszahallgatod magadat, segíthet finomítani az előadásmódodon.” A hang nem tökéletesen meggyőző, a habozások és egyéb furcsaságok kissé kimértnek tűntek, de összességében lenyűgöző teljesítmény volt.

 

Egyelőre természetesen angolul beszél, rövidesen 20 másik nyelven is elérhető lesz, és a nyílt forráskódot is közzé szándékoznak tenni.

További részletek itt. (Link a weboldalra)

  • Mit gondolsz arról, hogy egy MI így utánozza az emberi beszédhibákat?
  • Te mit tettél volna, ha egy hasonló MI-vel találkozol, amely ennyire emberi módon kommunikál?
  • Szerinted mennyire etikus az, hogy egy MI mesterségesen próbál emberi érzelmeket kifejezni a kommunikációban?


Legfrissebb posztok

MA 18:19

Az új AirTag messzebbre hallatszik, hangosabb és okosabb, mint valaha

Az Apple meglepetésfrissítéssel rukkolt elő: a népszerű AirTag mostantól nagyobb hatótávval és erősebb hangszóróval érkezik, vadonatúj külső nélkül, de jelentős technikai előrelépésekkel...

MA 17:57

A nappalidból igazi mozi: ezektől tényleg prémium lesz

🎥 Érdekes felvetés, hogy a tökéletesen összeállított otthoni mozi nemcsak egy nagy tévéről szól...

MA 17:38

Tényleg eltűnnek az adataid? Amit a törlőszolgáltatásokról tudnod kell

Személyes adataink számos adatkereskedőnél és embereket kereső oldalakon megtalálhatók – nemcsak a legismertebbeknél, hanem több ezer más helyen is...

MA 17:19

Az ingyenes MI is aranybánya lehet a Google-nek

A legtöbb MI-felhasználó továbbra is az ingyenes eszközöket választja, vagyis hatalmas bevételi lehetőségek maradnak kiaknázatlanul...

MA 17:02

A friss VMware-sebezhetőséget már gőzerővel támadják

⚠️ Az amerikai Kiberbiztonsági és Infrastruktúra-biztonsági Ügynökség (CISA) sürgős figyelmeztetést adott ki egy kritikus súlyosságú VMware vCenter Server sebezhetőségről, amelyet támadók már aktívan kihasználnak...

MA 16:55

A 2026-os Windows 11 első frissítése totális káoszt okozott

💥 Az év első Windows 11-frissítése igazi katasztrófát okozott a Microsoftnál. Először leállásokat jelentettek egyes gépeken a januári javítás telepítése után, ezért a Microsoft gyors sürgősségi javítást adott ki...

MA 16:38

Az Nvidia letaszítja az Apple-t a félvezetők trónjáról

Az idei évben teljesen új fejezet nyílik a globális félvezetőiparban: az Nvidia várhatóan felülmúlja az Apple-t, és a világ legnagyobb szerződéses chipgyártójának, a tajvani TSMC-nek a legnagyobb ügyfelévé válik...

MA 16:19

A történelmi nukleáris béke pillanata elérkezett

Több mint nyolc éve nem robbantottak fel atomfegyvert a világon – ez új rekord az atombomba korának kezdete óta...

MA 16:01

Az MI-forradalom átírja, mit jelent ma a karriersiker

Az idei davosi Világgazdasági Fórumon Jensen Huang, az Nvidia vezetője meghökkentő gondolatot fogalmazott meg: az MI várhatóan a fizikai munkát igénylő pozíciók számát növeli...

MA 15:57

A nano-hidroxiapatit letaszítja a fluoridot a trónról?

Érdekes felvetés, hogy a fluorid körüli vita egyre hevesebb, miközben egyre többen keresnek alternatívát a hagyományos fogkrémek helyett...

MA 15:38

A sós tavaszi óceán megduplázza az El Niño szélsőségeit

🌊 A nyugati Csendes-óceán tavaszi felszíni vizeinek szokatlanul magas sótartalma drámai módon növeli az El Niño rendkívül erős, időjárást felforgató eseményeinek esélyét...

MA 15:19

Az FBI simán megszerezheti a BitLocker-kulcsaidat

A Microsoft megerősítette, hogy hivatalos jogi megkeresés esetén kiadja a felhasználók BitLocker-titkosítási kulcsait az FBI-nak...

MA 15:02

Az új Proton VPN: Linuxon végre igazi élmény mindenkinek

A svájci Proton VPN nagy bejelentéssel rázta fel a Linux világát: óriási megújuláson megy át mind a grafikus felületű (GUI), mind a parancssoros (CLI) alkalmazása...

MA 14:56

A dollár szabadesésben, aranyláz söpör végig a piacon

💲 Érdemes látni, hogy az amerikai dollár hirtelen zuhanása pénteken vette kezdetét, miután kiderült: a New York-i Fed valóságos ritkaságnak számító „rate check”-et (árfolyam-ellenőrzést) végzett a dollár/jen árfolyamon...

MA 14:37

Az újabb bitcoin-zuhanás: jön a negyedik vesztes hónap?

A bitcoin árfolyama már negyedik egymást követő hónapban lehet veszteséges, amire utoljára 2018-ban volt példa...

MA 14:19

Az otthon sem mindig biztonságos: így védd magad egyedül

A hosszabb időt egyedül otthon töltők számára sok fejfájást okozhat a biztonság kérdése...

MA 14:02

A Brax Open Slate: tablet, amely fittyet hány a Big Technek

A Brax Technologies újabb merész lépést tesz a független okoseszközök piacán: bemutatta Open Slate nevű 2 az 1-ben táblagépét, amely egyszerre szolgál fogyasztói táblagépként és teljes értékű, ARM-alapú Linux munkaállomásként...

MA 13:55

A sci-fi világában tényleg nincs helye az MI-nek?

🤖 Az utóbbi hónapokban egyre több népszerű sci-fi szerző és kulturális rendezvény áll ki az MI-vel generált alkotások ellen...

MA 13:37

A rekord bitcoinnyereség szárnyakat ad a Metaplanetnek

A Metaplanet jelentős változásokon ment keresztül 2025 végén, amikor több mint 100 milliárd jen összegű számviteli veszteséget volt kénytelen elszámolni a bitcoin árfolyamának ingadozása miatt...

MA 13:19

A narancssárga bányavíz húzza ki Amerikát a válságból?

Az Appalache-hegységben, különösen Pennsylvaniában és Nyugat-Virginiában, savas, rozsdaszínű víz szivárog a bányákból, narancssárgára színezve a köveket és fémmel borítva a patakmedreket...

MA 13:02

Az amerikai TikTok-tulajdonosok hétvégéje totális káoszba torkollott

💥 Az első hétvégén, amióta amerikai kézbe került, a TikTok váratlan technikai problémákat hozott...

MA 12:55

Az Ark Invest rárepült a zuhanó kriptórészvényekre

Az Ark Invest pénteken összesen 21,5 millió dollár, vagyis nagyjából 7,5 milliárd forint értékben vásárolt részvényeket három jelentős kriptovállalat részvényeiből, miközben a bitcoin árfolyama a 90 000 dollár (kb...

MA 12:39

Az Apple Siri-je a Gemini erejével kihívja az Androidot

🤖 Megemlíthető továbbá, hogy a hangalapú asszisztensek területén évek óta áthidalhatatlan a szakadék az Android- és az Apple-eszközök között...

MA 12:01

A mesterséges intelligencia már lapot szerkeszt – Mi lesz velünk?

Egy újabb botrányos MI-megoldás jelent meg: most már komplett újságot képesek előállítani, minimális emberi beavatkozással...

MA 11:57

Az óceán mélye még mindig rejtély: szinte semmit sem tudunk

🐚 A Sulawesi-sziget melletti mélységekben két kupolás tengeralattjáró ereszkedik alá Indonézia partjainál, akár 1 000 méter mélyre is...

MA 11:37

A szerverhűtés űrkorszakba lép

Egy kaliforniai startup, a Karman Industries merőben új módszerrel hűti a szerverközpontokat: a SpaceX rakétamotorjainak technológiáját vetette be, hogy kevesebb árammal, víz nélkül, ráadásul sokkal kisebb helyigénnyel működjön a rendszer...

MA 11:20

A sima séta tényleg felér egy edzéssel?

A modern életmódban egyre többen keresik az egyszerű, de hatékony mozgásformákat...

MA 10:59

Az MI nem érti az ügyfeleket, az intenció‑első megközelítés viszont igen

Hihetetlen, de mégis igaz, hogy a hagyományos beszélgető MI-rendszerek gyakran félreértik a felhasználók szándékait...

MA 10:50

A nettó zéró illúziója óriásfák nélkül – tévúton a szabályozás

🌳 A világ vezetői már 2015-ben elköteleződtek a nettó zéró kibocsátás mellett, azonban a cél közel sem olyan könnyen elérhető, mint sok ország remélte – még ott sem, ahol hatalmas erdőterületek vannak, amelyek elvileg elnyelik a szén-dioxidot, ha megállítják az erdőirtást...