FrNewsLink

Corpus : Segmentation Thématique (FrNewsLink)URL : https://hal.archives-ouvertes.fr/hal-01741177Le package FrNewsLink comprend un ensemble de ressources permettant d’évaluer des tâches de segmentation thématique et titrage sur un corpus varié de journaux télévisés français. En raison de droits de diffusions, ce package ne contient ni les vidéos, ni les audios des journaux télévisés. Le corpus propose à la […]

Gaël Le Lan

Soutenance de thèse, Gaël LE LAN Titre : Analyse en locuteurs de collections de documents multimédia. Composition du jury : Guillaume GRAVIER, DR CNRS, IRISA, Président, Claude BARRAS, MCF HDR, Paris XI, Rapporteur, Jean-François BONASTRE, PR, Université d’Avignon, Rapporteur Corrine FREDOUILLE, MCF HDR, Université d’Avignon, Sylvain MEIGNIER, Le Mans Université, Directeur de thèse, Delphine CHARLET, […]

Sahar Ghannay

Soutenance de thèse, Sahar GHANNAY Titre : Étude sur les représentations continues de mots appliquées à la détection automatique des erreurs de reconnaissance de la parole. Composition du jury : Présidente : Martine Adda-Decker, Rapporteurs : Sophie Rosset, Frédéric Béchet, Examinateurs : Benoit Favre, Benjamin Lecouteux, Directeur de thèse : Yannick Estève Co-encadrante de thèse […]

Antoine Caubrière

Réseaux de neurones profonds pour le traitement de la langue orale et écriteDébuté le : 04/09/2017Doctorant : Antoine CaubrièreDirecteur(s) de Thèse : Yannick Estève (LIUM, LST)Co-encadrant(s) de Thèse : Antoine Laurent (LIUM, LST) & Emmanuel Morin (LS2N)Financement : Projet RAPACEL’objectif de cette thèse est de développer un système de détection d’entités nommées dans un flux […]

Amira Barhoumi

Vers une approche hybride pour l’analyse d’opinions en arabeDébuté le : 03/10/2016Doctorant : Amira BarhoumiDirecteur(s) de Thèse : Yannick Estève (LIUM, LST)Co-encadrant(s) de Thèse : Nathalie Camelin (LIUM, LST) & Lamia Hadrich Belguith (MIRACL, Tunisie)Financement : Convention de cotutelle (LIUM, LST) & (MIRACL, Tunisie)L’analyse d’opinions est un domaine de recherche en plein essor et a […]

TED-LIUM Release 3

Corpus : TED-LIUM Release 3Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)Auteur(s) : François FernandezVincent NguyenSahar GhannayNatalia TomashenkoYannick EstèveThis is the TED-LIUM corpus release 3, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en).   All talks and text are property of TED Conferences LLC.   This new TED-LIUM release was made through a collaboration between the Ubiqus […]

TED-LIUM Release 1

Corpus : TED-LIUM Release 1Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)Auteur(s) : Anthony RousseauPaul DelégliseYannick EstèveThis is the TED-LIUM corpus release 1, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en).   The TED-LIUM corpus is English-language TED talks, with transcriptions, sampled at 16kHz. It contains about 118 hours of speech.   More details are given in […]

NMTPYTORCH

Logiciel : NMTPYTORCHLicences : MIT LicenseGitHub : https://github.com/lium-lst/nmtpytorch/URL : https://arxiv.org/abs/1706.00457Auteur(s) : Ozan CaglayanMercedes García MartínezAdrien BardetWalid AransaFethi BougaresLoïc BarraultThis is the PyTorch fork of nmtpy, a sequence-to-sequence framework which was originally a fork of dl4mt-tutorial.

SIDEKIT

Logiciel : SIDEKITLicences : LGPLGitHub : https://git-lium.univ-lemans.fr/Larcher/sidekitURL : https://projets-lium.univ-lemans.fr/sidekit/Auteur(s) : Anthony LarcherKong Aik LeeSylvain Meignier Welcome to SIDEKIT documentation! SIDEKIT is an open source package for Speaker and Language recognition. The aim of SIDEKIT is to provide an educational and efficient toolkit for speaker/language recognition including the whole chain of treatment that goes from the […]

s4d

Logiciel : SIDEKIT for diarization (s4d)Licences : LGPLGitHub : https://git-lium.univ-lemans.fr/Meignier/s4dURL : https://projets-lium.univ-lemans.fr/s4d/Auteur(s) : Pierre-Alexandre BrouxFlorent DesnousAnthony LarcherSylvain Meignier Welcome to SIDEKIT for diarization documentation! SIDEKIT for diarization (s4d as short name) is an open source package extension of SIDEKIT for Speaker diarization . The aim of S4D is to provide an educational and efficient toolkit […]