Compréhension automatique de la parole multilingue pour les langues d'Afrique subsaharienne

Débuté le : 09/12/2025
Doctorant : Lu Zuo
Directeur(s) de Thèse : Marie Tahon (LIUM)
Co-encadrant(s) de Thèse : Élodie Gauthier (Orange), Lina ROJAS (Orange), Aghilas Sini (LIUM),
Financement : Cifre - ANRT

Le but de travail de thèse est d’étudier et de développer des solutions pour la compréhension de la parole en utilisant des approches faiblement supervisées ou non supervisées, afin d’exploiter efficacement les données disponibles et de rendre les systèmes robustes face à la variabilité acoustique et linguistique. Il s’agit également de distribuer des corpus et des modèles en accès ouvert, afin que la communauté scientifique et les acteurs locaux puissent les réutiliser, favorisant ainsi la collaboration, l’innovation et l’adaptation aux contextes spécifiques. L’objectif final est de faire progresser ces technologies dans un cadre éthique, inclusif et durable.

Les enjeux financiers et d’usage liés au développement des technologies pour les langues africaines sont multiples et déterminants pour leur adoption par les utilisateurs. Il est notamment essentiel de rendre ces initiatives plus accessibles et durables dans des contextes où les ressources sont limitées. La réduction des coûts de développement constitue un défi majeur, qui passe par la recherche de frugalité dans l’apprentissage des modèles. Par ailleurs, l’ouverture de nouveaux marchés pour les technologies vocales en Afrique représente une opportunité économique importante, permettant d’étendre l’usage de ces solutions à un large public.

Enfin, l’impact social de ces innovations est considérable : elles favorisent l’inclusion numérique, facilitent l’accès à l’information et contribuent à la valorisation des langues et des cultures locales, renforçant ainsi leur vitalité et leur transmission.