Már a legapróbb részletekig képes a hangutánzásra a mesterséges intelligencia
Akár az akcentust vagy a tájszólást is tökéletesen utánozza az MI.
A mesterséges intelligencia napjainkban már képes olyan élethű emberi hangok generálására, ami a megtévesztésig hasonlíthat akár egy híresség jellegzetes orgánumára is. De mégis hogy lehetséges ez, és miként lehet megakadályozni, hogy visszaéljenek ezzel?
Az MI mostanra már képes az emberi beszéd finomabb árnyalatait is reprodukálni, ehhez azonban hatalmas mennyiségű hangmintát kell feldolgoznia. Ennek során képes a beszéd ritmusát, hangsúlyát, valamint a kiejtést (akár az akcentust) is tökéletesen elsajátítani.
A második lépés a hangmodell készítése, ahol az MI algoritmusok elemzik a begyűjtött hangmintákat, hogy digitális változatot alkossanak a hangokról. Itt jön képbe a mélytanulás, amely segít modellezni a beszéd apró, finom változásait.
A Google WaveNet technológia például a hanghullámok közvetlen elemzésére épít (nem csupán fonetikai szabályokra), így képes pontosabban visszaadni még a beszédhang természetes ingadozásait is, ami teljesen élethűvé teszi azt – írja a Cybernews.
NE HAGYD KI
De mégis hogy lehet elkerülni, hogy másokat megtévesszenek vele? Léteznek MI-hangfelismerők, melyek képesek nagy pontossággal meghatározni, hogy generált hangról van-e szó. Emellett különböző programokkal is elemezhetjük a hangmintát, melyek bizonyos részei ismétlődhetnek, vagy más mintákból kölcsönözhették őket, ezáltal szintén megállapítható, hogy manipulált hanggal van dolgunk.