A Google új AI-technológiája teljesen átírhatja a szinkronizálás világát
Pixelekből és szövegrészletekből készít hangsávot, hozzárendelve a megfelelő jelenetekhez.
A DeepMind nem kevesebbet ígér, mint hogy a felhasználók realisztikus hangeffektekkel színesíthetik videóikat, valamint az abban szereplő karakterekhez illő párbeszédeket hozhatnak létre.
Ezzel a mesterséges intelligencia által generált videók már megszólalni is képesek lesznek, de akármilyen hangot képesek vele utánozni. A DeepMind szerint az eszköz „korlátlan” számú hangsávot képes generálni a videókhoz, így a felhasználók végtelen számú hangvariációból választhatnak.
A fejlesztésnek ugyanakkor még vannak korlátai, a DeepMind ugyanis még nem képes tökéletesen szinkronizálni az ajakmozgást a hangsávval. Ez függ a videó minőségétől is, minél rosszabb a felbontás, annál kevésbé lesz jó a végeredmény – írja a TheVerge.
A DeepMind egyelőre még nem érhető el nyilvánosan, ugyanis szigorú biztonsági teszteket kell végrehajtani rajta. Biztonsági megoldásként a hangfájlból kinyerhető adat lesz, hogy a mesterséges intelligencia által generált.
Minden bizonnyal ezzel is igyekeznek megakadályozni, hogy visszaéljenek a technológiával, más kérdés, hogy még így is legalább akkora hatása lehet majd, mint a deepfake videóknak, a manipulált párbeszédek előállítására pedig minden eddiginél nagyobb lehetőség nyílik majd.