Biométrie Vocale : du signal audio à l’identité de la personne

 

Encadrant(s): Anthony Larcher
Equipe d’accueil : LIUM – LST
Lieu : Le Mans
Contexte : Un étudiant du parcours ATAL sera plus à même de réaliser ce stage sans toutefois exclure les étudiants du parcours AFD.
Contact : Anthony.Larcher(at)univ-lemans.fr,

 

 
Sujet :

La biométrie vocale ou reconnaissance du locuteur consiste à déterminer l’identité de la personne qui parle. Les systèmes actuels utilisent des réseaux de neurones profonds mais nécessitent un prétraitement du signal audio (transformée de Fourier, analyse fréquentielle).Le but de ce stage est d’implémenter un système de reconnaissance du locuteur end-to-end, acceptant en entrée le signal audio brut et retournant en sortie l’identité du locuteur.
Ce travail s’inspirera des travaux récents dans le domaine et notamment du système RawNet [1] et sera réalisé dans le cadre d’un projet de recherche nationale (Extensor) en collaboration avec le laboratoire d’EURECOM.

 
Bibliographie :

[1] Jung, J. W., Heo, H. S., Kim, J. H., Shim, H. J., & Yu, H. J. (2019). RawNet: Advanced end-to-end deep neural network using raw waveforms for text-independent speaker verification. arXiv preprint arXiv:1904.08104.