Traduction Automatique Multimodale NeuronaleDébuté le : 30/10/2014Doctorant : Ozan CaglayanDirecteur(s) de Thèse : Paul Deléglise (LIUM, LST)Co-encadrant(s) de Thèse : Loïc Barrault (LIUM, LST) & Fethi Bougares (LIUM, LST)Financement : Projet M2CRCette thèse a pour but de développer des architectures neuronales pour la traduction automatique intégrant différents types d’informations afin d’améliorer la qualité des traductions […]


Event Understanding through Multimodal Social (EUMSSI)Date : 11/2013 – 10/2016Financement : EU FP7Appel : ICT-2013.4.1 Content analytics and language technologiesPartenaires : UPF (Espagne), L3S (Allemagne), VSN (Espagne), GFaI (Allemagne), IDIAP (Suisse)URL : https://www.eumssi.eu/LIUM Participant(s) : Yannick EstèveVincent JousseSylvain MeignierPaul DelégliseNathalie CamelinL’objectif principal de EUMSSI est de développer des technologies d’identification et d’agrégation d’informations non structurées […]

Structuration automatique de documents audioDébuté le : 01/10/2012Doctorant : Abdessalam BouchekifDirecteur(s) de Thèse : Yannick EstèveCo-encadrant(s) de Thèse : Nathalie CamelinFinancement : Contrat Orange LabsLa structuration en thèmes est un domaine de recherche très prisé dans le traitement automatique du langage naturel car elle est le point de départ de plusieurs applications comme la recherche […]


Technologies de la parole et des langues pour des applications de sécurité (VERA)Date : 01/2013 – 01/2016Financement : ANRAppel : BlancPartenaires : LNE (France), LPP (France), LIMSI (France)URL : https://lium.univ-lemans.fr/vera/LIUM Participant(s) : Nathalie CamelinDaniel LuzzatiPaul DelégliseSylvain MeignierYannick EstèveThe VERA project aims at developing tools for diagnostic, localization, and measurements of automatic transcription errors. This project […]


Logiciel : Continuous Space Language Model toolkit (CSLM)GitHub : https://git-lium.univ-lemans.fr/barrault/cslmURL : https://git-lium.univ-lemans.fr/barrault/cslm/-/archive/master/cslm-master.tar.gzAuteur(s) : Holger SchwenkCSLM toolkit is open-source software which implements the so-called continuous space language model. The basic idea of this approach is to project the word indices onto a continuous space and to use a probability estimator operating on this space. Since the […]


Corpus : MANYLicences : GNU GPL v3URL : https://code.google.com/archive/p/many/Many un logiciel de combinaison de systèmes de traduction automatique statistique dont l’architecture est décrite dans le schéma suivant :     La combinaison se décompose en 3 étapes Les meilleures hypothèses des M systèmes sont alignées de manière incrémentale afin de générer M réseaux de confusion […]