Kezdőlap

Friss hírek

Fontos hírek

Felkapott

Menü

AKTUÁLIS

AKTUÁLIS

Már a legapróbb részletekig képes a hangutánzásra a mesterséges intelligencia

Már a legapróbb részletekig képes a hangutánzásra a mesterséges intelligencia

Már a legapróbb részletekig képes a hangutánzásra a mesterséges intelligencia
Fotó: unsplash | illusztráció

Akár az akcentust vagy a tájszólást is tökéletesen utánozza az MI.

A mesterséges intelligencia napjainkban már képes olyan élethű emberi hangok generálására, ami a megtévesztésig hasonlíthat akár egy híresség jellegzetes orgánumára is. De mégis hogy lehetséges ez, és miként lehet megakadályozni, hogy visszaéljenek ezzel?

A cikk a videó után folytatódik

Az MI mostanra már képes az emberi beszéd finomabb árnyalatait is reprodukálni, ehhez azonban hatalmas mennyiségű hangmintát kell feldolgoznia. Ennek során képes a beszéd ritmusát, hangsúlyát, valamint a kiejtést (akár az akcentust) is tökéletesen elsajátítani.

A második lépés a hangmodell készítése, ahol az MI algoritmusok elemzik a begyűjtött hangmintákat, hogy digitális változatot alkossanak a hangokról. Itt jön képbe a mélytanulás, amely segít modellezni a beszéd apró, finom változásait.

A Google WaveNet technológia például a hanghullámok közvetlen elemzésére épít (nem csupán fonetikai szabályokra), így képes pontosabban visszaadni még a beszédhang természetes ingadozásait is, ami teljesen élethűvé teszi azt – írja a Cybernews.

De mégis hogy lehet elkerülni, hogy másokat megtévesszenek vele? Léteznek MI-hangfelismerők, melyek képesek nagy pontossággal meghatározni, hogy generált hangról van-e szó. Emellett különböző programokkal is elemezhetjük a hangmintát, melyek bizonyos részei ismétlődhetnek, vagy más mintákból kölcsönözhették őket, ezáltal szintén megállapítható, hogy manipulált hanggal van dolgunk.