Construction de Sound Zones par apprentissage automatique sur un large jeu de données

Niveau : Master 2

Encadrants: Théo Mariotte (LIUM), Manuel Melon (LAUM), Marie Tahon (LIUM)
Equipes d’accueil : Laboratoire d’Informatique de l’Université du Mans (LIUM) – Laboratoire d’Acoustique de l’Université du Mans (LAUM). Le stage se déroulera en présentiel.
Lieu : Le Mans Université
Début du stage : Entre janvier et mars 2025
Contact : Théo Mariotte, Manuel Melon et Marie Tahon (prénom.nom@univ-lemans.fr)

 

Candidature : Envoyer votre CV, une lettre de motivation adaptée au sujet proposé (possibilité de joindre un avis ou des lettres de recommandations) à Théo Mariotte, avant le 15 décembre 2024

 
 

Descriptif : Le stage vise à mettre en œuvre des systèmes d’apprentissage automatique pour la construction de zones d’écoute différenciées (Sound zones).

 

Contexte : La mise en place de zones d’écoute différenciées (Sound zones) [1] trouve des applications dans de nombreux contextes tels que la diffusion de contenu audio personnalisé dans les habitacles de véhicules. Ces méthodes permettent de contrôler le niveau acoustique émis dans des zones définies de l’espace, dénommées claire et sombre. Dans la première, le niveau acoustique est rehaussé pour permettre à transmission du signal utile. Dans la seconde, le niveau est atténué afin de restreindre le signal acoustique transmis à la zone claire. La construction de ces zones est possible à l’aide d’un réseau de haut-parleurs et de microphones.

Les méthodes de la littérature permettant la mise en œuvre de zones d’écoute différenciées exploitent l’optimisation sous contrainte (ex: Acoustic Contrast Control (ACC), Pressure Matching (PM). Plus récemment, les travaux de Pepe et al. [4] ont proposé une approche utilisant les réseaux de neurones profonds. D’autre part, des jeux de données ont été publiés pour la reconstruction de champ acoustique (ISOBEL [2]) et la reproduction de sound zones (Zhao et al. [3]). Ces deux considérations ouvrent la voie à l’utilisation de méthodes neuronales pour la construction de sound zones.

 

Objectifs : Le stage proposé vise dans un premier temps à reproduire une méthode de la littérature et de l’appliquer sur des jeux de données publics. Dans un second temps, il sera envisagé d’améliorer cette approche et d’évaluer sa robustesse selon différents critères (environnement acoustique, position du sujet…).

Phase 1 :
• Étude de la bibliographie et prise en main des approches classiques pour les sound zones.
• Reproduire la méthode de l’article de Pepe et al. [4]
• Prendre en main les jeux de données publics ISOBEL [2] et Zhao et al. [3]
• Évaluer la méthode sur ces jeux de données
• Comparer cette approche avec les méthodes classiques de construction de sound zones

Phase 2 :
• Étudier la robustesse de la méthode neuronale selon différents critères (environnement
acoustique, position du sujet)
• Améliorer la robustesse de l’approche neuronale selon ces critères

Il est également envisagé de concevoir un démonstrateur permettant à deux utilisateur·ices partageant le même espace d’écouter un texte lu dans deux langues différentes. Ce démonstrateur pourrait être présenté à la prochaine Biennale Le Mans Sonore en 2026.

 

Laboratoires :
Le Laboratoire d’Acoustique de l’Université du Mans (LAUM) possède une grande expertise sur les méthodes de reproduction et de contrôle du champ acoustique. Manuel Melon a mené et encadré de nombreux travaux autour de la thématique des sound zones.

Le Laboratoire d’Informatique de l’Université du Mans (LIUM) est historiquement orienté vers les thématiques de traitement automatique de la parole avec une forte dominante pour les approches d’apprentissage automatique profond. Marie Tahon travaille notamment sur des méthodes neuronales pour la reconnaissance des émotions et la synthèse parole avec un intérêt pour l’interprétabilité. Théo Mariotte travaille sur des méthodes de traitement audio à l’aide de réseaux de neurones, et développe notamment des méthodes utilisant des antennes de microphones.

Le stagiaire bénéficiera de l’expertise des deux laboratoires tant sur la dimension acoustique (LAUM) que sur la dimension informatique et apprentissage automatique (LIUM).

Profil recherché : Candidat·e motivé·e par l’intelligence artificielle et les méthodes de reproduction de champ acoustique, inscrit·e en master informatique ou acoustique.

 

Bibliographie

[1] T. Betlehem, W. Zhang, M. A. Poletti, et T. D. Abhayapala, « Personal Sound Zones: Delivering interface-free audio to multiple listeners », IEEE Signal Process. Mag., vol. 32, no 2, p. 81‐91, mars 2015, doi: 10.1109/MSP.2014.2360707.

[2] M. S. Kristoffersen, M. B. Møller, P. Martínez-Nuevo, et J. Østergaard, « Deep Sound Field Reconstruction in Real Rooms: Introducing the ISOBEL Sound Field Dataset », 12 février 2021, arXiv: arXiv:2102.06455.

[3] S. Zhao, Q. Zhu, E. Cheng, et I. S. Burnett, « A room impulse response database for multizone sound field reproduction (L) », The Journal of the Acoustical Society of America, vol. 152, no 4, p. 2505‐2512, oct. 2022, doi: 10.1121/10.0014958.

[4] G. Pepe, L. Gabrielli, S. Squartini, L. Cattani, et C. Tripodi, « Deep Learning for Individual Listening Zone », in 2020 IEEE 22nd International Workshop on Multimedia Signal Processing (MMSP), Tampere, Finland: IEEE