Elle s’appelle WaveNet… C’est la voix quasi humaine inventée par DeepMind, la filiale de Google en intelligence artificielle. Ce programme de synthèse reproduit la parole de manière très naturelle. La voix 100% synthétique WaveNet prend en compte le souffle ou les bruits produits par la diction. Cette voix a un échantillonnage d’avance sur tous les assistants vocaux connus à ce jour. La voix de Google fait appel à la technologie du deep learning, basée sur les réseaux neuronaux. Le programme WaveNet s’est nourri de dizaines d’heures de discours prononcés par une centaine de participants. Tous les éléments sonores sont analysés, décortiqués avant d’être reproduits échantillon par échantillon. Une prouesse de la synthèse vocale lorsque l’on sait que 16.000 échantillons/secondes peuvent être distingués dans la voix humaine. Les chercheurs DeepMind ne comptent pas s’arrêter en si bon chemin avec leur imitateur de génie. La suite : c’est une voix synthétique dotée d’accents, voire même chargée d’émotions… une voix humaine artificielle plus vraie que nature !
Ecoutez la voix de WaveNet
Plus d’infos