L’équipe LST développe ses activités de recherche dans le domaine du traitement automatique du langage et de la parole autour de trois axes. Si historiquement nous avons travaillé avec des approches guidées par les données, l'équipe est spécialisée dans le deep learning appliqué au traitement du langage.

Reconnaissance de la parole

La reconnaissance de la parole consiste à transformer un signal en une suite de mots. A partir de la suite de mots de nombreux informations peuvent être extraite comme la détection d'opinion, de concepts applicatifs, d'entités nommées, de speech analytics...

Caractérisation du locuteur

La la caractérisation du locuteur couvre plusieurs tâche autour de la voix des locuteurs. Nous nous intéressons à
la segmentation et regroupement en locuteur (découpage en locuteur d'un enregistrements audio), l'identification et la vérification du locuteur (trouver l'identité d'un locuteur), l'identification de la langue et à la détection des émotions.

Traduction automatique

La traduction automatique consiste à traduire (passer d'une langue à une autre) avec un programme informatique un texte ou un enregistrement sonore, sans l'aide d'un humain.

LST - Membres Permanents

Loïc BarraultLoïc Barrault
Maître de Conférences
Fethi BougaresFethi Bougares
Maître de Conférences
Nathalie CamelinNathalie Camelin
Maître de Conférences
Paul DeléglisePaul Deléglise
Professeur Émérite
Nicolas DuguéNicolas Dugué
Maître de Conférences
Yannick EstèveYannick Estève
Professeur
Bruno JacobBruno Jacob
Maître de Conférences
Anthony LarcherAnthony Larcher
Maître de Conférences
Antoine LaurentAntoine Laurent
Maître de Conférences
Jérôme LehuenJérôme Lehuen
Maître de Conférences
Daniel LuzzatiDaniel Luzzati
Professeur Émérite
Sylvain MeignierSylvain Meignier
Professeur
Simon PetitrenaudSimon Petitrenaud
Maître de Conférences
Marie TahonMarie Tahon
Maître de Conférences
Jane WottawaJane Wottawa
Maître de Conférences

LST - Membres Temporaires

Adrien BardetAdrien Bardet
Doctorant
Amira BarhoumiAmira Barhoumi
Doctorant
Emmanuelle BillardEmmanuelle Billard
Ingénieur
Pierre-Alexandre BrouxPierre-Alexandre Broux
Doctorant
Ozan CaglayanOzan Caglayan
Doctorant
Antoine CaubrièreAntoine Caubrière
Doctorant
Victor ConnesVictor Connes
Stagiaire
Florent DesnousFlorent Desnous
Doctorant
Salima MdhaffarSalima Mdhaffar
Doctorant
Manon PinelManon Pinel
Doctorant
Yevhenii ProkopaloYevhenii Prokopalo
Doctorant
Edwin SimonnetEdwin Simonnet
Doctorant
Natalia TomashenkoNatalia Tomashenko
Post-Doctorant
Kévin VythelingumKévin Vythelingum
Doctorant

Projets LST

Projets en cours

SIMPÆX

Projet : Segmentation et Identification Multi-locuteur de PArole EXpressive
Date : 02/2018 - 03/2020
Financement : RFI AltanStic 2020
Appel : Amorçage, Défis scientifique 2017
Auteur(s) : Marie Tahon
URL : https://lium.univ-lemans.fr/simpaex/

Le projet SIMPÆX a pour objectif la segmentation et l’identification automatiques de styles expressifs et de locuteurs dans un corpus de parole. En effet, l’extraction d’éléments concernant le locuteur, son état émotionnel et le contexte social, offre des indices très pertinents pour diverses applications comme l’indexation audio, la reconnaissance automatique de parole, la synthèse de parole ou les interactions humain-machine. ► Lire la suite

Néo

Projet : Observatoire de la néologie
Date : 02/2018 - 01/2020
Financement : RFI AltanStic 2020
Appel : Amorçage, Défis scientifique 2017
Partenaires : Laboratoire ERIC (France), CRTT (France)
Auteur(s) : Nicolas Dugué, Nathalie Camelin, Yannick Estève
URL : https://lium.univ-lemans.fr/neo/

Néo est un projet de recherche interdisciplinaire relevant des humanités numériques dont l’objectif est la détection semi-automatique de la néologie contemporaine et son analyse. Il résulte de la convergence des nouvelles pratiques langagières du web moderne (création de nouveaux mots ou émergence de nouveaux sens) et des récentes avancées en matière de traitement automatique des langues, notamment via les méthodes de plongements lexicographiques. Ce projet allie les compétences en fouille de textes de chercheurs en informatique et l’expérience de l’étude des néologismes de chercheurs en linguistique appliquée. ► Lire la suite

News.bridge

Projet : News.bridge
Date : 01/2018 - 06/2019
Financement : Google
Appel : Digital News Innovation Funding
Partenaires : Deutsche Welle, Latvian News Agency, Priberam
Auteur(s) : Sahar Ghannay, Natalia Tomashenko, Yannick Estève
URL : https://lium.univ-lemans.fr/news-bridge/

Le projet NEWS-BRIDGE a pour but de construire un ensemble d’outils exploitables commercialement utilisant les technologies de la langue pour faciliter et améliorer la production d’informations multilingues. Cet outil fournit un système complet de traduction de nouvelles, rendant les contenus existants audio, vidéo et texte dans toutes les langues supportées par les différents outils externes pour la transcription, la traduction, la synthèse vocale. ► Lire la suite

ALLIES

Projet : Atounomous Lifelong Learning IntelligEnt Systems
Date : 12/2017 - 11/2020
Financement : EU H2020
Appel : chist-era
Partenaires : IDIAP (Suisse), UPC (Espagne), LNE (France)
Auteur(s) : Anthony Larcher, Loïc Barrault, Fethi Bougares, Sylvain Meignier
URL : https://projets-lium.univ-lemans.fr/allies

L’objectif du projet ALLIES est d’encourager et de démontrer le développement de systèmes autonomes, capables de maintenir une performance durable dans le temps selon un scénario d’apprentissage donné. Un scénario d’apprentissage définit l’importance accordée à la performance sur les données « passées » et « présentes » dans le processus d’optimisation (ou d’évaluation). En définissant le scénario d’apprentissage, un superviseur humain (SH) permet ou interdit au système d’oublier. Dans ALLIES, un système autonome est totalement non supervisé et adapte progressivement ses modèles ainsi que leur structure, afin d’apprendre ou d’oublier des événements en fonction du scénario d’apprentissage donné et des données qu’il collecte automatiquement dans le temps. ► Lire la suite

Antract

Projet : Transdisciplinary Analysis of French Newsreels (1945-1969)
Date : 10/2017 - 09/2020
Financement : ANR
Appel : Generic
Partenaires : INA (France), EURECOM (France), Voxolab (France), CHS (France)
Auteur(s) : Simon Petitrenaud, Antoine Laurent, Sylvain Meignier
URL : https://lium.univ-lemans.fr/antract/

The general objective of the ANTRACT project is the analysis of the images and sounds produced weekly in the framework of an independent company created in 1945, les Actualités françaises (French News), over twenty five years. This major cinematographic vector, already partially worked, has never been the subject of a systematic analysis. ► Lire la suite

MAGMAT

Projet : Méthodologie et Architecture Générique de développement Multilingue Accéléré pour la Traduction parole-parole
Date : 10/2016 - 10/2019
Financement : DGA/DGF
Appel : Rapid
Partenaires : Airbus D&S (France), Voxygen (France)
URL : https://lium.univ-lemans.fr/magmat/

Le projet MAGMAT vise à définir et mettre en œuvre une méthodologie agile et incrémentale de développement en temps contraint d’un système de traduction le la parole vers la parole. Sur le plan du développement de langues, deux objectifs principaux sont à considérer. Le premier objectif est de mutualiser drastiquement les développements de la synthèse, de la transcription et de la traduction avec une mise commun les ressources linguistiques. Le second objectif est de définir une méthodologie rendant le processus de développement de langue adapté au contexte visé. ► Lire la suite

PASTEL

Projet : Transcription Automatique de la Parole pour l'Apprentissage et la Formation
Date : 10/2016 - 04/2020
Financement : ANR
Appel : Interactions, Robotique, Contenus / Automatique, signal 2016
Partenaires : Orange Lab (France), cren (France), LS2N (France)
Auteur(s) : Yannick Estève, Nathalie Camelin, Lahcen Oubahssi, Madeth May, Vincent Bettenfeld, Christophe Choquet, Salima Mdhaffar, Christophe Després, Claudine Piau-Toffolon
URL : https://projets-lium.univ-lemans.fr/pastel

Le projet PASTEL a pour objectif d’explorer le potentiel de la transcription automatique en temps réel pour l’instrumentation de situations pédagogiques mixtes, où les modalités d’interaction sont présentielles ou à distance, synchrones ou asynchrones. Les technologies de reconnaissance de la parole approchent d’un niveau de maturité suffisant qui permet d’envisager de nouvelles possibilités au niveau de l’instrumentation des pratiques pédagogiques et générer de nouveaux usages. ► Lire la suite

M2CR

Projet : Multilingual Multimodal Continuous Representation for Human Language Understanding
Date : 06/2015 - 06/2019
Financement : Autres
Appel : Chistera
Partenaires : MILA (Canada), CVC (Espagne)
Auteur(s) : Loïc Barrault, Fethi Bougares, Nathalie Camelin, Yannick Estève, Mercedes García Martínez, Sahar Ghannay, Adrien Bardet
URL : https://projets-lium.univ-lemans.fr/m2cr

Le projet M2CR vise à développer une approche révolutionnaire pour combiner plusieurs modalités de la communication humaine et leurs tâches respectives dans une architecture unifiée, basée sur des réseaux neuronaux profonds, en incluant à la fois une composante discriminante et une composante générative grâce à plusieurs niveaux de représentation. Notre système s’appuiera conjointement sur les ressources dans plusieurs modalités, y compris, mais sans s’y limiter, le texte de plusieurs langues (européennes, chinoises et arabes), la parole et les images. Ce faisant, le système connaîtra une représentation sémantique commune de l’information sous-jacente, à la fois à un niveau spécifique de la modalité et à un niveau supérieur indépendant de celle-ci. ► Lire la suite

Liste de projets passés

Projets passés

Blackcompass

Projet : Développement d'une solution logicielle pour valoriser le contenu des échanges téléphoniques entre consommateurs et marques
Date : 04/2016 - 04/2018
Financement : Région Pays de la Loire
Appel : Fonds Pays de la Loire Territoires d'Innovation
Partenaires : Dictanova (France), Ville de Nantes (France)
Auteur(s) : Sylvain Meignier, Antoine Laurent
URL : https://lium.univ-lemans.fr/blackcompass/

L'bjectif du projet est de développer une solution logicielle pour valoriser le contenu de ces échanges téléphoniques entre consommateurs et marques en analysant le contenu des conversations. ► Lire la suite

EUMSSI

Projet : Event Understanding through Multimodal Social
Date : 11/2013 - 10/2016
Financement : EU FP7
Appel : ICT-2013.4.1 Content analytics and language technologies
Partenaires : UPF (Espagne), L3S (Allemagne), VSN (Espagne), GFaI (Allemagne), IDIAP (Suisse)
Auteur(s) : Yannick Estève, Vincent Jousse, Sylvain Meignier, Paul Deléglise
URL : https://www.eumssi.eu/

L’objectif principal de EUMSSI est de développer des technologies d’identification et d’agrégation d’informations non structurées provenant de sources de nature très différente (vidéo, image, audio, texte) et de différentes langues (anglais, allemand, espagnol et français). Je suis responsable de l’analyse en locuteur et nous développons conjointement avec l’IDAP un système d’identification multimodale des personnes. ► Lire la suite