Sahar Ghannay

Étude sur les représentations continues de mots appliquées à la détection automatique des erreurs de reconnaissance de la parole.Débuté le : 01/10/2014Doctorant : Sahar GhannayDirecteur(s) de Thèse : Yannick Estève (LIUM – LST)Co-encadrant(s) de Thèse : Nathalie Camelin (LIUM – LST)Financement : Région Pays de la Loire, EUMSSI (Event Understanding through Multimodal Social Stream Interpretation)Nous […]

Gaël Le Lan

Analyse en locuteurs de collections de documents multimédia.Débuté le : 01/04/2014Doctorant : Gaël Le LanDirecteur(s) de Thèse : Sylvain Meignier (LIUM – LST)Co-encadrant(s) de Thèse : Anthony Larcher (LIUM – LST)Financement : Orange La segmentation et regroupement en locuteurs (SRL) de collection cherche à répondre à la question « qui parle quand ? » dans […]

Ozan Caglayan

Traduction Automatique Multimodale NeuronaleDébuté le : 30/10/2014Doctorant : Ozan CaglayanDirecteur(s) de Thèse : Paul Deléglise (LIUM, LST)Co-encadrant(s) de Thèse : Loïc Barrault (LIUM, LST) & Fethi Bougares (LIUM, LST)Financement : Projet M2CRCette thèse a pour but de développer des architectures neuronales pour la traduction automatique intégrant différents types d’informations afin d’améliorer la qualité des traductions […]

EUMSSI

Event Understanding through Multimodal Social (EUMSSI)Date : 11/2013 – 10/2016Financement : EU FP7Appel : ICT-2013.4.1 Content analytics and language technologiesPartenaires : UPF (Espagne), L3S (Allemagne), VSN (Espagne), GFaI (Allemagne), IDIAP (Suisse)URL : https://www.eumssi.eu/LIUM Participant(s) : Yannick EstèveVincent JousseSylvain MeignierPaul DelégliseNathalie CamelinL’objectif principal de EUMSSI est de développer des technologies d’identification et d’agrégation d’informations non structurées […]

Abdessalam Bouchekif

Structuration automatique de documents audioDébuté le : 01/10/2012Doctorant : Abdessalam BouchekifDirecteur(s) de Thèse : Yannick EstèveCo-encadrant(s) de Thèse : Nathalie CamelinFinancement : Contrat Orange LabsLa structuration en thèmes est un domaine de recherche très prisé dans le traitement automatique du langage naturel car elle est le point de départ de plusieurs applications comme la recherche […]

VERA

Technologies de la parole et des langues pour des applications de sécurité (VERA)Date : 01/2013 – 01/2016Financement : ANRAppel : BlancPartenaires : LNE (France), LPP (France), LIMSI (France)URL : https://lium.univ-lemans.fr/vera/LIUM Participant(s) : Nathalie CamelinDaniel LuzzatiPaul DelégliseSylvain MeignierYannick EstèveThe VERA project aims at developing tools for diagnostic, localization, and measurements of automatic transcription errors. This project […]

CSLM

Logiciel : Continuous Space Language Model toolkit (CSLM)GitHub : https://git-lium.univ-lemans.fr/barrault/cslmURL : https://git-lium.univ-lemans.fr/barrault/cslm/-/archive/master/cslm-master.tar.gzAuteur(s) : Holger SchwenkCSLM toolkit is open-source software which implements the so-called continuous space language model. The basic idea of this approach is to project the word indices onto a continuous space and to use a probability estimator operating on this space. Since the […]

MANY

Corpus : MANYLicences : GNU GPL v3URL : https://code.google.com/archive/p/many/Many un logiciel de combinaison de systèmes de traduction automatique statistique dont l’architecture est décrite dans le schéma suivant :     La combinaison se décompose en 3 étapes Les meilleures hypothèses des M systèmes sont alignées de manière incrémentale afin de générer M réseaux de confusion […]