Segmentation thématique de transcriptions automatiques et appariement de documents pédagogiques dans un contexte de cours magistral
Débuté le : 23/01/2017
Doctorant : Salima Mdhaffar
Directeur(s) de Thèse : Yannick Estève (LIUM, LST)
Co-encadrant(s) de Thèse : Antoine Laurent (LIUM, LST), Nicolas Hernandez (LS2N), Solen Quiniou (LS2N)
Financement : ANR Projet PASTEL
Cette thèse s’inscrit dans le cadre du projet PASTEL (Performing Automated Speech Transcription for Enhancing Learning), qui vise à explorer le potentiel de la transcription automatique en temps réel pour l’instrumentation de situations pédagogiques mixtes, où les modalités d’interaction sont présentielles ou à distance, synchrones ou asynchrones.
Plus particulièrement, cette thèse visera les domaines de l’adaptation automatique des modèles de langage, de la segmentation thématique et de l’enrichissement de documents pédagogiques.
Dans un contexte de cours magistral, en exploitant si possible les sources d’informations a minima fournies par l’enseignant, il s’agira de segmenter à la volée, c’est à dire en direct au fur et à mesure de la transcription automatique en temps réel, les sorties d’un système de reconnaissance automatique de la parole appliqué sur le discours de l’enseignant.
Cette segmentation sera de type thématique : il s’agira de détecter les frontières de zones homogènes au niveau du contenu, et qu’il faudra caractériser afin de le lier avec des documents pédagogiques disponibles dans une base de connaissances extérieure.