Soutenance de thèse, Manon Macary

Date : 24/06/2022
Heure : 14h00
Lieu : IC2, salle des conseils et visio-conférence
 

Titre : Analyse de données massives en temps réel pour l’extraction d’informations sémantiques et émotionnelles de la parole
 

Composition du jury :

  • Mme Martine ADDA-DECKER, Directrice de Recherche, LPP – CNRS-Sorbonne Nouvelle, Rapporteure
  • M. Denis JOUVET, Directeur de recherche, INRIA-LORIA – Université de Lorraine, Rapporteur
  • M. Fabien RINGEVAL, Maître de Conférences, LIG – Université Grenoble Alpes, CNRS, Examinateur
  • M. Damien LOLIVE, Directeur, ENSSAT – Université de Rennes, Examinateur
  • M. Yannick ESTÈVE, Professeur, LIA, Avignon Université, Directeur de thèse
  • Mme. Marie TAHON , Maître de Conférence, LIUM – Le Mans Université, Co-encadrante
  • M. Merouane ATIG, Directeur technique , Allo-Média, Invité

 

Résumé :

Les centres d’appels reçoivent tous les jours des milliers de coups de téléphone permettant de faire le lien entre des clients et des conseillers. Ainsi, de nombreuses informations peuvent être extraites de ces conversations, dont l’aspect émotionnel.

Cette thèse CIFRE a été réalisée en collaboration avec l’entreprise Allo-Media qui est spécialisée dans l’analyse automatique de conversations téléphoniques de centre d’appels. Concrètement, elle met en place des relevés d’information sur différents aspects de la conversation en indexant ces informations pour permettre un traitement automatique des données. L’entreprise cherche à enrichir ses annotations avec une solution innovante permettant de rajouter un aspect émotionnel en adéquation avec le contexte de la relation clientèle afin d’alerter sur les points saillants de la conversation.

Cette thèse tente donc de répondre à plusieurs problématiques : (i) tout d’abord la définition de l’émotion de satisfaction et de frustration dans la parole, (ii) la mise en place d’une reconnaissance automatique de ces émotions de façon continue tout au long de la conversation et (iii) des méthodes d’évaluation de ces systèmes automatiques.

Les contributions de cette thèse sont : (i) la construction d’un corpus à partir de données réelles, annoté de façon continue en satisfaction et frustration, (ii) la mise en place de différentes stratégies pour construire un système de reconnaissance automatique utilisant des réseaux de neurones profonds en nous comparant à l’état de l’art, (iii) l’exploration de la dissociation des aspects acoustique et linguistique des conversations afin d’améliorer nos systèmes de reconnaissance et enfin (iv) la mise en place d’une évaluation nuancée de ces systèmes.

 

Mots clés :

Reconnaissance de l’émotion continue ; Création de Corpus ; Satisfaction et Frustration ; Embeddings pré-appris