DesignMusical

L'actualité du marketing sonore & de l'audio branding

Retrouvez-nous sur

L'actualité du marketing sonore
& de l'audio branding

Synthèse vocale : le saut en avant technologique de Google SoundStorm

Synthèse vocale : le saut en avant technologique de Google SoundStorm

Partagez >

Facebook
Twitter
LinkedIn
La synthèse vocale vient de faire un grand saut technologique avec SoundStorm. Le système a été développé pour synthétiser des dialogues de haute qualité et naturels... jusqu'à la fraude.

Google Soundstorm : technologie de fraude audio ?

SoundStorm est un modèle permettant de générer efficacement des représentations audio dérivées de codecs neuronaux (à l’exemple de celui de Meta/Facebook), offrant ainsi une qualité sonore élevée. Dans l’étude présentée, les auteurs affirment pouvoir contrôler de manière fiable les caractéristiques des locuteurs grâce à des sollicitations spécifiques.

La capacité à imiter une voix peut avoir de nombreuses applications malveillantes

Car c’est bien de cela dont il est question : générer un voiceover à partir d’un texte pouvant aller jusqu’à l’usurpation d’identité sonore ou vocale. A cette fin, et comme garde fou, les auteurs de cette étude et technologie annoncent vouloir mettre en place des mesures de précaution contre toute utilisation abusive potentielle.

Cette parole synthétisée doit reste détectable par une AI.

À l’avenir, le concepteurs souhaitent même explorer d’autres approches pour détecter la parole synthétisée, telles que le tatouage audio, afin que toute utilisation potentielle de cette technologie soit strictement conforme à nos principes d’IA responsable.

A lire aussi, cette analyse plus technologique du potentiel de SoundStorm.

Sommaire
A la une