L’équipe LST développe ses activités de recherche dans le domaine du traitement automatique des langues naturelles sous forme de texte et de parole. Nous travaillons avec des approches guidées par les données mais l'équipe est également spécialisée dans le deep learning appliqué au traitement du langage.
Reconnaissance de la parole
La reconnaissance de la parole consiste à transformer un signal en une suite de mots. A partir de la suite de mots, de nombreuses informations peuvent être extraites telles que la détection d'opinion, de concepts applicatifs, d'entités nommées, de speech analytics...
Caractérisation du locuteur
La caractérisation du locuteur couvre plusieurs tâches autour de la voix des locuteurs. Nous nous intéressons à : la segmentation et le regroupement en locuteurs (découpage en locuteurs d'un enregistrements audio), l'identification et la vérification du locuteur (trouver l'identité d'un locuteur), l'identification de la langue et la détection des émotions.
Traduction automatique
La traduction automatique consiste à traduire (passer d'une langue à une autre) un texte ou un enregistrement sonore grâce à un programme informatique, sans intervention humaine.
Modélisation interprétable de la langue
Les modèles de langage neuronaux ont connu d'immenses progrès récemment. Nous travaillons à la prise de recul sur ces avancées technologiques en explorant leur usage sur des corpus de spécialité, dans le cadre de la transcription de la parole, et en développant des alternatives interprétables et peu coûteuses en temps de calcul.
Extraction de connaissances issues de la langue
À partir du signal audio ou de données textuelles, nous travaillons à transformer les données brutes en connaissances exploitables. Dans ce cadre, nous mettons en oeuvre des techniques d'apprentissage automatique et de deep learning pour l'analyse d'opinion ou l'extraction d'informations sémantiques.
LST - Membres
Projets LST
Projets en cours
TV2M-E
Projet : Traduction Vocale Multilingue Multimodale — Expressive
Date : 06/2024 - 06/2026
Financement : Région Pays de la Loire
Appel : PULSAR
Auteur(s) : Aghilas Sini
URL : https://lium.univ-lemans.fr/tv2m-e/
Un locuteur bilingue ou polyglotte possède la capacité de communiquer de manière cohérente dans plusieurs langues, s'adaptant aux différents contextes. Transposer cette compétence aux machines pourrait contribuer à la préservation du patrimoine culturel en maintenant les langues moins privilégiées, faciliter les interactions entre personnes de cultures et langues diverses, et renforcer les mesures de sécurité. ► Lire la suite
CHICA-AI
Projet : Training CHIldren reading Comprehension skills with Adapted Artificial Intelligence
Date : 03/2024 - 04/2028
Financement : ANR
Appel : AAPG2023
Partenaires : Lalilo (Toulouse), IRIT (Toulouse), EMC (Lyon)
Auteur(s) : Nathalie Camelin, Antoine Laurent, Emmanuelle Billard, Aghilas Sini
URL : https://lium.univ-lemans.fr/chica-ai/
Nous proposons de créer un environnement informatique pour l'apprentissage humain (EIAH) entraînant les enfants du cycle 3 à produire des résumés oraux qualitatifs, en analysant automatiquement leur production et en fournissant un retour différencié. ► Lire la suite
COMMUTE
Projet : Plateforme d'assistance à la communication multilingue en ligne
Date : 12/2022 - 11/2025
Financement : Autres
Appel : DUALE-RAPID
Partenaires : SYSTRAN (France)
Auteur(s) : Antoine Laurent, Anthony Larcher, Mohammad Mohammadamini
URL : https://lium.univ-lemans.fr/projet-commute/
Notre projet vise à intégrer la production de reconnaissance et traduction vocale dans un outil de communication en ligne, ce qui permettra de créer une véritable plateforme de communication sans barrières. Le projet se concentrera sur la production de traductions en français et anglais à partir d'une source vocale en arabe et anglais.
► Lire la suiteDIGING
Projet : Dynamic and Interpretable Graph-based word embeddINGs
Date : 01/2022 - 12/2025
Financement : ANR
Appel : ANR JCJC
Auteur(s) : Nicolas Dugué, Nathalie Camelin, Sylvain Meignier, Jane Wottawa, Simon Guillot, Anna Béranger
URL : https://lium.univ-lemans.fr/diging/
Les approches récentes d’apprentissage de plongements lexicaux ont mis l’accent sur les résultats, souvent au détriment de l’interprétabilité et de la complexité algorithmique. Pourtant, l’interprétabilité est un pré-requis nécessaire à la mise en œuvre de telles technologies lorsqu’elles sont au service de domaines sensibles comme le domaine juridique ou la médecine. Par ailleurs, les impératifs écologiques créent une urgence à réfléchir à des systèmes performants et économes en calculs. Nous proposons avec DIGING une nouvelle approche performante et économe en calculs pour la construction de plongements lexicaux interprétables basée sur la théorie des réseaux complexes. Avec cette approche originale, l’objectif est de construire des vecteurs intégrant la polysémie nativement en plongeant les mots dans un espace aux dimensions interprétables.
► Lire la suiteESPERANTO
Projet : Exchanges for SPEech ReseArch aNd TechnOlogies
Date : 01/2021 - 12/2025
Financement : EU H2020
Appel : H2020-MSCA-RISE-2020
Partenaires :
academic (MS): Université du Mans, Universidad de Zaragoza, The University of Sheffield, Brno University of Technology, Laboratoire national de métrologie et d’essais (LNE), Université Grenoble Alpes, Avignon Université, University of Yaounde, Consejo Nacional de Investigaciones cientificas y tecnicas, Universidad de Chile, Centro de Aplicaciones de Tecnologías Avanzada, Universiti Malaysia Sarawak, Universiti Sains Malaysia, Johns Hopkins University, Montreal Institute for Learning Algorithms
Non academic: Allo-média, Elyadata, Omilia, Phonexia, National Institute of Standard and Technologies (NIST)
Auteur(s) : Anthony Larcher, Loïc Barrault, Fethi Bougares, Antoine Laurent, Meysam Shamsi, Marie Tahon, Jane Wottawa, Grégor Dupuy, Emmanuelle Billard, Martin Lebourdais, Théo Mariotte, Thibault Gaudier, Thomas Thebaud, Valentin Pelloin
URL : http://esperanto.univ-lemans.fr/en/index.html
ESPERANTO est un programme de recherche collaboratif incluant 15 partenaires académiques et 4 partenaires non académiques provenant de 11 pays sur 4 continents. Centré sur le traitement automatique de la parole, ESPERANTO contribuera au développement de la prochaine génération d’IA; des IA interagissant avec leurs utilisateurs pour un apprentissage plus performant mais également des systèmes explicables : dont les décisions sont compréhensibles par les humains. Afin de rendre ces technologies accessibles au plus grand nombre, ESPERANTO traitera des applications disposant de ressources limitées dans le domaine des langues rares, de la robotique ou de l’éducation. ► Lire la suite
Projets passés
PereFRALL
Projet : Penser les relations FRanco-ALLemandes
Date : 09/2023 - 08/2024
Financement : Autres
Appel : Amorçage interdisciplinaire MSH Ange-Guépin
Partenaires : Centre de Recherche sur les identités, les Nations et l’Interculturalité (CRINI) (France)
Auteur(s) : Jane Wottawa
URL : https://lium.univ-lemans.fr/perefrall/
Lorsque l’on pense aux relations franco-allemandes, force est de constater que ce ne sont pas les mêmes termes qui les désignent de part et d’autre du Rhin. Tandis que la figure du « couple » domine la perception de la coopération franco-allemande en France, celle-ci est perçue en Allemagne par le biais du « tandem ». En étudiant les notions, métaphores et schémas de perception qui servent à penser les relations franco-allemandes, ce projet se donne pour but d’identifier les points communs et les différences dans le regard que portent les Français et les Allemands sur les relations entre leurs pays. En fin de compte, il s’agit de savoir s’il existe un imaginaire commun franco-allemand. ► Lire la suite
DIETS
Projet : Diagnostic automatique des erreurs des systèmes de transcription de parole end-to-end à partir de leur réception par les utilisateurs
Date : 02/2021 - 08/2024
Financement : ANR
Appel : AAPG2020 - JCJC
Partenaires : LIA (porteur) (France), LPC (France)
Auteur(s) : Jane Wottawa, Antoine Tholly
URL : https://lium.univ-lemans.fr/diets/
Le projet DIETS propose de se focaliser sur la problématique du diagnostic/évaluation des systèmes de reconnaissance automatique automatique (RAP) end-to-end en intégrant la réception humaine des erreurs de transcription d'un point-de-vue cognitif. Le défi est double: 1) analyser finement les erreurs de RAP par rapport à une réception humaine et 2) comprendre et détecter comment ces erreurs se manifestent dans un cadre de RAP end-to-end, dont le travail s’inspire du cerveau humain.
► Lire la suiteSpeechBrain
Projet : SpeechBrain
Date : 09/2019 - 12/2021
Financement : Autres
Appel :
Partenaires : Mila (Canada), LIA (France), PyTorch, IBM Research AI, fluent.ai (Canada)
Auteur(s) : Anthony Larcher, Sylvain Meignier
URL : https://speechbrain.github.io
SpeechBrain est un toolkit de traitement de la parole open-source et tout-en-un qui s'appuie sur PyTorch. L'objectif est de créer un toolkit unique, flexible et convivial qui peut être utilisé pour développer facilement des technologies de traitement de la parole à l'état de l'art, y compris des systèmes de reconnaissance vocale (end-to-end et HMM-DNN), de reconnaissance du locuteur, de séparation vocale, de traitement de signal multi-microphone (par exemple, la formation de faisceaux), d'apprentissage supervisé et non supervisé, de contamination / augmentation vocale, et beaucoup plus. ► Lire la suite
GEM
Projet : Gender Equality Monitor
Date : 01/2020 - 06/2024
Financement : ANR
Appel : AAPG2019
Partenaires : INA, LIMSI, Carism, Deezer, LERASS, ENS Lyon
Auteur(s) : Antoine Laurent, Anthony Larcher, Nathalie Camelin, Nicolas Dugué, Sylvain Meignier, Marie Tahon, Martin Lebourdais
URL : https://lium.univ-lemans.fr/gem/
Médias et société entretiennent des rapports complexes. Descriptifs, les médias sont également prescriptifs et contribuent à façonner notre représentation du monde. Le projet GEM vise à décrire les différences de représentation et de traitement existant entre les femmes et les hommes dans les médias, en se fondantsur l’analyse automatique de gros volumes de données en langue française contenus dans les collections de l’INA et de Deezer : TV, radio, presse écrite et collections musicales. ► Lire la suite
CapDiff
Projet : Captation Différentielle
Date : 06/2019 - 12/2020
Financement : Autres
Appel : BPI
Partenaires : LAUM (France), HAAPIE (France), VOXPASS (France)
Auteur(s) : Anthony Larcher, Justine Carpentier, Sylvain Meignier
URL : https://lium.univ-lemans.fr/capdiff/
Le projet Capdiff a pour objectif la mise au point d’un système de captation audio, dit différentiel. Il doit permettre de capter précisément la voix de chaque locuteur positionné autour d’une table, typiquement dans le cadre d’une réunion. ► Lire la suite
AISSPER
Projet : Intelligence artificielle pour une compréhension de la parole contrôlée par la sémantique
Date : 01/2020 - 10/2024
Financement : ANR
Appel : AAPG2019
Partenaires : LIA (France), Orkis (France)
Auteur(s) : Nathalie Camelin, Sylvain Meignier, Antoine Laurent, Valentin Pelloin
URL : https://lium.univ-lemans.fr/aissper/
La modélisation efficace des variabilités contenues à différents niveaux (prosodique, acoustique, lexical, ...) dans la parole reste un problème de recherche important pour la reconnaissance et la compréhension de la langue parlée. AISSPER vise à développer de nouveaux paradigmes modélisant conjointement informations acoustiques et sémantiques pour l’analyse sémantique de documents oraux. AISSPER proposera de nouveaux algorithmes neuronaux qui combineront ces informations multi-niveaux. Pour cela, AISSPER rassemble des chercheurs reconnus dans le domaine de l'intelligence artificielle et du traitement automatique du langage. ► Lire la suite
EXTENSOR
Projet : End-To-end Evolutive Neural Networks for Speaker Recognition
Date : 01/2020 - 06/2022
Financement : ANR
Appel : AAPG2019
Partenaires : Eurecom (France)
Auteur(s) : Anthony Larcher, Antoine Laurent, Marie Tahon, Sylvain Meignier, Ambuj Mehrish
URL : https://lium.univ-lemans.fr/extensor/
ExTENSoR proposes fundamental research that aims to explore the potential of using end-to-end and automatically learned / evolving articial neural networks in order to overcome the limitations of hand-crafted features and network topologies that characterise the current state of the art in many fields of speech processing. ExTENSoR also aims to bring new insights to what information in speech signals is being used in order to arrive at the scores or decisions produced by the network. ExTENSoR will pursue its objectives within the context of automatic speaker recognition and anti-spoofing, two fields of speech processing research showing burgeoning interest in end-to-end, evolutive learning. ► Lire la suite
ASSC
Projet : Analyse fine d’opinions dans des corpus de satisfaction clients
Date : 10/2019 - 02/2023
Financement : Autres
Appel : MMA
Partenaires : MMA (France)
Auteur(s) : Nathalie Camelin, Nicolas Dugué, Sylvain Meignier, Rémi Bouvet, Mohamed Ettaleb
URL : https://lium.univ-lemans.fr/assc
MMA, premier acteur de l’assurance en IARD sur le territoire français, est très investi dans l'analyse des parcours clients. Dans une stratégie de relation client, MMA souhaite déterminer les facteurs de satisfaction, d'engagement et de recommandation. Son service marketing diffuse des enquêtes de satisfaction permettant de collecter de nombreux retours textuels des clients. Le volume recueilli est tel qu'il est impossible de traiter manuellement la totalité de ces données. Le groupe MMA a fait appel aux connaissances du LIUM afin d’analyser automatiquement les informations d’opinions. ► Lire la suite
PolysEmY
Projet : Polysemic Embeddings for Industry
Date : 01/2020 - 07/2021
Financement : RFI AltanStic 2020
Appel :
Partenaires : SNCF (France)
Auteur(s) : Nathalie Camelin, Nicolas Dugué, Jane Wottawa, Gaëtan Caillaut
URL : https://lium.univ-lemans.fr/polysemy
Les ressources lexicales de la documentation technique SNCF sont le témoignage de la richesse et des spécificités du vocabulaire métier utilisé au sein d’entreprises telles que SNCF. Ce vocabulaire est parfois peu fréquent dans les corpus mais d’après les experts très important pour caractériser les documents. ► Lire la suite
C3LS
Projet : Clustering et Classification sur un Corpus en Langue de Spécialité
Date : 11/2017 - 10/2019
Financement : Autres
Appel : SNCF
Partenaires : SNCF (France)
Auteur(s) : Nathalie Camelin, Nicolas Dugué
URL : https://lium.univ-lemans.fr/c3ls
Le groupe SNCF connaît actuellement une transformation digitale et se tourne de plus en plus vers des technologies susceptibles de faire appel à de l’intelligence artificielle appliquée au traitement d’informations écrites ou orales. La documentation métier est aujourd’hui en pleine mutation, avec des métiers qui se digitalisent, plus mobiles et de nouveaux modes de consommation de l’information. ► Lire la suite
ON-TRAC
Projet : Outils Neuronaux End-to-End pour la TRAduction des Communications
Date : 01/2019 - 03/2023
Financement : ANR
Appel : Generic
Partenaires : LIA (Avignon) (France), LIG (Grenoble) (France), Airbus (France)
Auteur(s) : Fethi Bougares, Antoine Laurent, Anthony Larcher, Loïc Barrault
URL : https://lium.univ-lemans.fr/on-trac/
Le projet ON-TRAC propose de changer radicalement les architectures utilisées en traduction de parole actuellement. Il s’appuie sur les modèles neuronaux de type end-to-end pour la traduction automatique et vise plus particulièrement les applications légères et portatives de traduction de la parole. Les systèmes de traduction de la parole actuels sont constitués du séquençage de deux modules : le premier effectue la reconnaissance de la parole (parole vers texte en langue source) et le second traduit automatiquement les sorties (sous forme de chaînes ou de graphes de mots en langue source) du premier module vers un texte en langue cible. ON-TRAC propose d’adapter et d’évaluer des architectures end-to-end pour la traduction directe de la parole. ► Lire la suite
DEEP-PRIVACY
Projet : DEEP-PRIVACY
Date : 01/2019 - 12/2022
Financement : ANR
Appel : generic
Partenaires : Multispeech (France), LIA (France), Magnet (France)
Auteur(s) : Anthony Larcher, Antoine Laurent, Marie Tahon, Pierre Champion
URL : https://lium.univ-lemans.fr/deep-privacy/
DEEP-PRIVACY propose un nouveau paradigme basé sur une approche distribuée, personnalisée et respectueuse de la vie privée pour le traitement de la parole, se focalisant sur les algorithmes d'apprentissage automatique pour la reconnaissance de la parole. Pour ce faire, nous proposons une approche hybride : l'appareil de chaque utilisateur ne partage pas ses données vocales brutes et exécute certains calculs privés en local, tandis que certains calculs inter-utilisateurs se font via un serveur (ou un réseau peer-to-peer). Pour satisfaire aux exigences de confidentialité au niveau acoustique, les données communiquées au serveur ne doivent pas fournir d'informations sensibles sur les locuteurs. Le projet aborde ces défis d'un point de vue théorique, méthodologique et empirique à travers deux objectifs scientifiques majeurs. ► Lire la suite
SIMPÆX
Projet : Segmentation et Identification Multi-locuteur de PArole EXpressive
Date : 02/2018 - 09/2020
Financement : RFI AltanStic 2020
Appel : Amorçage, Défis scientifique 2017
Auteur(s) : Marie Tahon
URL : https://lium.univ-lemans.fr/simpaex/
Le projet SIMPÆX a pour objectif la segmentation et l’identification automatiques de styles expressifs et de locuteurs dans un corpus de parole. En effet, l’extraction d’éléments concernant le locuteur, son état émotionnel et le contexte social, offre des indices très pertinents pour diverses applications comme l’indexation audio, la reconnaissance automatique de parole, la synthèse de parole ou les interactions humain-machine. ► Lire la suite
Néo
Projet : Observatoire de la néologie
Date : 02/2018 - 01/2020
Financement : RFI AltanStic 2020
Appel : Amorçage, Défis scientifique 2017
Partenaires : Laboratoire ERIC (France), CRTT (France)
Auteur(s) : Nicolas Dugué, Nathalie Camelin
URL : https://lium.univ-lemans.fr/neo/
Néo est un projet de recherche interdisciplinaire relevant des humanités numériques dont l’objectif est la détection semi-automatique de la néologie contemporaine et son analyse. Il résulte de la convergence des nouvelles pratiques langagières du web moderne (création de nouveaux mots ou émergence de nouveaux sens) et des récentes avancées en matière de traitement automatique des langues, notamment via les méthodes de plongements lexicographiques. Ce projet allie les compétences en fouille de textes de chercheurs en informatique et l’expérience de l’étude des néologismes de chercheurs en linguistique appliquée. ► Lire la suite
News.bridge
Projet : News.bridge
Date : 01/2018 - 06/2019
Financement : Google
Appel : Digital News Innovation Funding
Partenaires : Deutsche Welle, Latvian News Agency, Priberam
Auteur(s) : Sahar Ghannay, Natalia Tomashenko, Yannick Estève
URL : https://lium.univ-lemans.fr/news-bridge/
Le projet NEWS-BRIDGE a pour but de construire un ensemble d’outils exploitables commercialement utilisant les technologies de la langue pour faciliter et améliorer la production d’informations multilingues. Cet outil fournit un système complet de traduction de nouvelles, rendant les contenus existants audio, vidéo et texte dans toutes les langues supportées par les différents outils externes pour la transcription, la traduction, la synthèse vocale. ► Lire la suite
ALLIES
Projet : Autonomous Lifelong Learning IntelligEnt Systems
Date : 12/2017 - 03/2022
Financement : EU H2020
Appel : chist-era
Partenaires : IDIAP (Suisse), UPC (Espagne), LNE (France)
Auteur(s) : Anthony Larcher, Loïc Barrault, Fethi Bougares, Sylvain Meignier, Yevhenii Prokopalo, Meysam Shamsi
URL : https://projets-lium.univ-lemans.fr/allies
L’objectif du projet ALLIES est d’encourager et de démontrer le développement de systèmes autonomes, capables de maintenir une performance durable dans le temps selon un scénario d’apprentissage donné. Un scénario d’apprentissage définit l’importance accordée à la performance sur les données « passées » et « présentes » dans le processus d’optimisation (ou d’évaluation). En définissant le scénario d’apprentissage, un superviseur humain (SH) permet ou interdit au système d’oublier. Dans ALLIES, un système autonome est totalement non supervisé et adapte progressivement ses modèles ainsi que leur structure, afin d’apprendre ou d’oublier des événements en fonction du scénario d’apprentissage donné et des données qu’il collecte automatiquement dans le temps. ► Lire la suite
RAPACE
Projet : Réseaux de neurones profonds pour le traitement de la langue orale et écrite
Date : 10/2017 - 09/2020
Financement : RFI AltanStic 2020
Appel : Défis scientifiques 2016
Partenaires : LINA (France)
Auteur(s) : Antoine Caubrière, Antoine Laurent, Yannick Estève
URL : https://lium.univ-lemans.fr/rapace/
Le projet RAPACE ambitionne de porter dans le domaine du traitement automatique de la langue orale comme écrite les dernières avancées issues du domaine de l'apprentissage automatique et qui concernent les réseaux de neurones profonds ► Lire la suite
Antract
Projet : Transdisciplinary Analysis of French Newsreels (1945-1969)
Date : 10/2017 - 03/2022
Financement : ANR
Appel : Generic
Partenaires : INA (France), EURECOM (France), Voxolab (France), CHS (France)
Auteur(s) : Simon Petitrenaud, Antoine Laurent, Sylvain Meignier, Pierre-Alexandre Broux
URL : https://lium.univ-lemans.fr/antract/
The general objective of the ANTRACT project is the analysis of the images and sounds produced weekly in the framework of an independent company created in 1945, les Actualités françaises (French News), over twenty five years. This major cinematographic vector, already partially worked, has never been the subject of a systematic analysis. ► Lire la suite
MAGMAT
Projet : Méthodologie et Architecture Générique de développement Multilingue Accéléré pour la Traduction parole-parole
Date : 10/2016 - 10/2019
Financement : DGA/DGF
Appel : Rapid
Partenaires : Airbus D&S (France), Voxygen (France)
Auteur(s) : Loïc Barrault, Walid Aransa
URL : https://lium.univ-lemans.fr/magmat/
Le projet MAGMAT vise à définir et mettre en œuvre une méthodologie agile et incrémentale de développement en temps contraint d’un système de traduction le la parole vers la parole. Sur le plan du développement de langues, deux objectifs principaux sont à considérer. Le premier objectif est de mutualiser drastiquement les développements de la synthèse, de la transcription et de la traduction avec une mise commun les ressources linguistiques. Le second objectif est de définir une méthodologie rendant le processus de développement de langue adapté au contexte visé. ► Lire la suite
PASTEL
Projet : Transcription Automatique de la Parole pour l'Apprentissage et la Formation
Date : 10/2016 - 04/2021
Financement : ANR
Appel : Interactions, Robotique, Contenus / Automatique, signal 2016
Partenaires : Orange Lab (France), cren (France), LS2N (France)
Auteur(s) : Christophe Choquet, Antoine Laurent, Vincent Bettenfeld, Nathalie Camelin, Christophe Després, Madeth May, Salima Mdhaffar, Lahcen Oubahssi, Claudine Piau-Toffolon, Asmaa Darouich, Rémi Venant
URL : https://projets-lium.univ-lemans.fr/pastel
Le projet PASTEL a pour objectif d’explorer le potentiel de la transcription automatique en temps réel pour l’instrumentation de situations pédagogiques mixtes, où les modalités d’interaction sont présentielles ou à distance, synchrones ou asynchrones. Les technologies de reconnaissance de la parole approchent d’un niveau de maturité suffisant qui permet d’envisager de nouvelles possibilités au niveau de l’instrumentation des pratiques pédagogiques et générer de nouveaux usages. ► Lire la suite
Blackcompass
Projet : Développement d'une solution logicielle pour valoriser le contenu des échanges téléphoniques entre consommateurs et marques
Date : 04/2016 - 04/2018
Financement : Région Pays de la Loire
Appel : Fonds Pays de la Loire Territoires d'Innovation
Partenaires : Dictanova (France), Ville de Nantes (France)
Auteur(s) : Sylvain Meignier, Antoine Laurent
URL : https://lium.univ-lemans.fr/blackcompass/
L'bjectif du projet est de développer une solution logicielle pour valoriser le contenu de ces échanges téléphoniques entre consommateurs et marques en analysant le contenu des conversations. ► Lire la suite
M2CR
Projet : Multilingual Multimodal Continuous Representation for Human Language Understanding
Date : 06/2015 - 06/2019
Financement : Autres
Appel : Chistera
Partenaires : MILA (Canada), CVC (Espagne)
Auteur(s) : Loïc Barrault, Fethi Bougares, Nathalie Camelin, Yannick Estève, Mercedes García Martínez, Sahar Ghannay, Adrien Bardet, Ozan Caglayan
URL : https://projets-lium.univ-lemans.fr/m2cr
Le projet M2CR vise à développer une approche révolutionnaire pour combiner plusieurs modalités de la communication humaine et leurs tâches respectives dans une architecture unifiée, basée sur des réseaux neuronaux profonds, en incluant à la fois une composante discriminante et une composante générative grâce à plusieurs niveaux de représentation. Notre système s’appuiera conjointement sur les ressources dans plusieurs modalités, y compris, mais sans s’y limiter, le texte de plusieurs langues (européennes, chinoises et arabes), la parole et les images. Ce faisant, le système connaîtra une représentation sémantique commune de l’information sous-jacente, à la fois à un niveau spécifique de la modalité et à un niveau supérieur indépendant de celle-ci. ► Lire la suite
JOKER
Projet : Rire et empathie d'un Robot/ECA: vers des relations sociales et affectives avec un robot
Date : 01/2014 - 07/2017
Financement : EU H2020
Appel : CHIST-ERA 2012
Partenaires : LIMSI (coordinateur) (France), UCD (Irlande), UMONS (Belgique), KOC University (Turquie)
Auteur(s) : Yannick Estève, Nathalie Camelin, Simon Petitrenaud, Sylvain Meignier, Daniel Luzzati
URL : https://lium.univ-lemans.fr/joker/
Ce projet consiste à créer et à développer JOKER, une interface utilisateur générique intelligente fournissant un système de dialogue multimodal avec des compétences en communication sociale, notamment l'humour, l'empathie, la compassion, le charme et d'autres comportements informels à orientation sociale. ► Lire la suite
EUMSSI
Projet : Event Understanding through Multimodal Social
Date : 11/2013 - 10/2016
Financement : EU FP7
Appel : ICT-2013.4.1 Content analytics and language technologies
Partenaires : UPF (Espagne), L3S (Allemagne), VSN (Espagne), GFaI (Allemagne), IDIAP (Suisse)
Auteur(s) : Yannick Estève, Vincent Jousse, Sylvain Meignier, Paul Deléglise, Nathalie Camelin
URL : https://www.eumssi.eu/
L’objectif principal de EUMSSI est de développer des technologies d’identification et d’agrégation d’informations non structurées provenant de sources de nature très différente (vidéo, image, audio, texte) et de différentes langues (anglais, allemand, espagnol et français). Je suis responsable de l’analyse en locuteur et nous développons conjointement avec l’IDAP un système d’identification multimodale des personnes. ► Lire la suite
VERA
Projet : Technologies de la parole et des langues pour des applications de sécurité
Date : 01/2013 - 01/2016
Financement : ANR
Appel : Blanc
Partenaires : LNE (France), LPP (France), LIMSI (France)
Auteur(s) : Nathalie Camelin, Daniel Luzzati, Paul Deléglise, Sylvain Meignier, Yannick Estève
URL : https://lium.univ-lemans.fr/vera/
Le projet VERA vise à développer des outils de diagnostic, de localisation et de mesure des erreurs de transcription automatique. Ce projet s'appuie sur un consortium d'acteurs académiques de premier plan dans ce domaine. L'objectif est d'étudier en détail les erreurs (au niveau perceptif, acoustico-phonétique, lexical et syntaxique) afin de diagnostiquer précisément les éventuelles lacunes des modèles classiques actuels sur certaines classes de phénomènes linguistiques. ► Lire la suite