Soutenance de thèse, Antoine Caubrière
Date : 29/01/2021
Heure : 14h00
Lieu : bâtiment IC2, LIUM, Université du Mans, visio-conférence
Titre : Du signal au concept : Réseaux de neurones profonds appliqués à la compréhension de la parole
Composition du jury :
- Mme Irina ILLINA, Maîtresse de conférence – HDR, Université de Lorraine – LORIA / INRIA, Rapporteure
- M. Benoit FAVRE, Maître de conférence – HDR, Aix-Marseille Université – LIS, Rapporteur
- M. François PORTET Professeur, Université Grenoble Alpes – LIG, Examinateur
- M. Yannick ESTEVE, Professeur, Université d’Avignon, Directeur de thèse
- M. Emmanuel MORIN Professeur, Université de Nantes – LS2N, Co-directeur de thèse
- M. Antoine LAURENT, Maître de conférences, Le Mans Université, Co-encadrant
- Mme Sophie ROSSET Directrice de recherche, LIMSI, CNRS, Université Paris-Sud, Invitée
Résumé :
Cette thèse s’inscrit dans le cadre de l’apprentissage profond appliqué à la compréhension de la parole. Jusqu’à présent, cette tâche était réalisée par l’intermédiaire d’une chaîne de composants mettant en oeuvre, par exemple, un système de reconnaissance de la parole, puis différents traitements du langage naturel, avant d’impliquer un système de compréhension du langage sur les transcriptions automatiques enrichies. Récemment, des travaux dans le domaine de la reconnaissance de la parole ont montré qu’il était possible de produire une séquence de mots directement à partir du signal acoustique. Dans le cadre de cette thèse, il est question d’exploiter ces avancées et de les étendre pour concevoir un système composé d’un seul modèle neuronal entièrement optimisé pour la tâche de compréhension de la parole, du signal au concept.
Tout d’abord, nous présentons un état de l’art décrivant les principes de l’apprentissage neuronal profond, de la reconnaissance de la parole, et de la compréhension de la parole. Nous décrivons ensuite les contributions réalisées selon trois axes principaux. Nous proposons un premier système répondant à la problématique posée et l’appliquons à une tâche de reconnaissance des entités nommées. Puis, nous proposons une stratégie de transfert d’apprentissage guidée par une approche de type curriculum learning. Cette stratégie s’appuie sur les connaissances génériques apprises afin d’améliorer les performances d’un système neuronal sur une tâche d’extraction de concepts sémantiques. Ensuite, nous effectuons une analyse des erreurs produites par notre approche, tout en étudiant le fonctionnement de l’architecture neuronale proposée. Enfin, nous mettons en place une mesure de confiance permettant d’évaluer la fiabilité d’une hypothèse produite par notre système.
Mots clés :
Compréhension de la parole, Réseaux de neurones profonds, Du signal au concept, Reconnaissance d’entités nommées, Extraction de concepts sémantiques, Analyse d’erreurs, Mesure de confiance