Sound Zones adaptatives par apprentissage automatique sur un large jeu de données
Niveau : Master 1
Encadrement : Théo Mariotte (LIUM), Manuel Melon (LAUM), Marie Tahon (LIUM)
Equipe d’accueil : Laboratoire d’Informatique de l’Université du Mans (LIUM), Laboratoire d’Acoustique de l’Université du Mans (LAUM)
Lieu : Le Mans
Début du stage : entre janvier et mars 2026
Descriptif : Le stage vise à mettre en œuvre des systèmes d’apprentissage automatique pour la construction de zones d’écoute différenciées robustes aux changements de position de la zone d’écoute.
Contact : Théo Mariotte (prénom.nom@univ-lemans.fr)
Candidature : Envoyer votre CV, une lettre de motivation adaptée au sujet proposé, possibilité de joindre un avis ou des lettres de recommandations. à Théo Mariotte, avant le 1er décembre 2025
Contexte et objectifs
La mise en place de zones d’écoute différenciées (Sound zones) [1] trouve des applications dans de nombreux contextes tels que la diffusion de contenu audio personnalisé dans les habitacles de véhicules. Ces méthodes permettent de contrôler le niveau acoustique émis dans des zones définies de l’espace, dénommées claire et sombre. Dans la première, le niveau acoustique est rehaussé pour permettre à transmission du signal utile. Dans la seconde, le niveau est atténué afin de restreindre le signal acoustique transmis à la zone claire. La construction de ces zones est possible à l’aide d’un réseau de haut-parleurs et de microphones
Les méthodes de la littérature permettant la mise en œuvre de zones d’écoute différenciées exploitent l’optimisation sous contrainte (ex: Acoustic Contrast Control (ACC), Pressure Matching (PM)). Ces méthodes ne permettent pas d’adapter les zones aux mouvements du sujet. Des méthodes adaptatives ont donc été développées pour pallier cette limite en utilisant notamment des approches de contrôle actif.
Dans le cadre de ce stage, il est envisagé d’exploiter les réseaux de neurones profonds pour adapter les sound zones aux mouvements du sujet. Un premier stage a permis de mettre en œuvres des modèles dans le cas de zones statiques. L’objectif est donc d’étendre les méthodes existantes au cas adaptatif. Quelques travaux existent sur le sujet [2] et sur l’utilisation des réseaux de neurones pour les sound zones [4].
Phase 1 :
- Étude de la bibliographie et prise en main de la base de code disponible pour l’apprentissage des modèles (Python, PyTorch)
- Amélioration de la simulation de données pour simuler des petits mouvements du sujet
- Évaluer les modèles existants et les méthodes classiques dans le contexte d’un sujet pouvant se déplacer.
Phase 2 :
- Proposer de nouvelles approches neurones pour améliorer la qualité de la reproduction en cas de déplacement de la zone d’écoute (voir [2])
- Possibilité d’explorer plusieurs architectures et/ou formulations du problème
- Évaluation sur des données réelles (Zhao [3]). Prise de mesures possible également.
Laboratoires et équipe encadrante
Le Laboratoire d’Acoustique de l’Université du Mans (LAUM) est reconnu pour ses travaux en acoustique et possède une grande expertise sur les méthodes de reproduction et de contrôle du champ. Manuel Melon a mené et encadré de nombreux travaux autour de la thématique des sound zones.
Le Laboratoire d’Informatique de l’Université du Mans (LIUM) est historiquement orienté vers les thématiques de traitement automatique de la parole avec une forte dominante pour les approches d’apprentissage profond (deep learning). Marie Tahon travaille notamment sur des méthodes neuronales pour la reconnaissance des émotions et la synthèse parole avec un intérêt pour l’interprétabilité. Théo Mariotte travaille sur des méthodes de traitement audio à l’aide de réseaux de neurones, et développe notamment des méthodes utilisant des antennes de microphones.
Le ou la stagiaire bénéficiera de l’expertise des deux laboratoires tant sur la dimension acoustique (LAUM) que sur la dimension informatique et apprentissage automatique (LIUM).
Profil recherché
Candidat·e motivé·e par l’intelligence artificielle et les méthodes de reproduction de champ acoustique, inscrit·e en master informatique ou acoustique.
References
[1]. T. Betlehem, W. Zhang, M. A. Poletti, et T. D. Abhayapala, « Personal Sound Zones: Delivering interface-free audio to multiple listeners », IEEE Signal Process. Mag., vol. 32, no 2, p. 81‑91, mars 2015, doi: 10.1109/MSP.2014.2360707.
[2]. Qiao, Y., & Choueiri, E. (2025). SANN-PSZ: Spatially Adaptive Neural Network for Head-Tracked Personal Sound Zones. IEEE Transactions on Audio, Speech and Language Processing.
[3]. S. Zhao, Q. Zhu, E. Cheng, et I. S. Burnett, « A room impulse response database for multizone sound fieldreproduction (L) », The Journal of the Acoustical Society of America, vol. 152, no 4, p. 2505‑2512, oct. 2022, doi: 10.1121/10.0014958.
[4]. G. Pepe, L. Gabrielli, S. Squartini, L. Cattani, et C. Tripodi, « Deep Learning for Individual Listening Zone », in 2020 IEEE 22nd International Workshop on Multimedia Signal Processing (MMSP), Tampere, Finland: IEEE