TED-LIUM Release 1

Corpus : TED-LIUM Release 1Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)Auteur(s) : Anthony RousseauPaul DelégliseYannick EstèveThis is the TED-LIUM corpus release 1, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en).   The TED-LIUM corpus is English-language TED talks, with transcriptions, sampled at 16kHz. It contains about 118 hours of speech.   More details are given in […]

NMTPY

Logiciel : NMTPYLicences : MIT LicenseGitHub : https://github.com/lium-lst/nmtpyURL : https://arxiv.org/abs/1706.00457Auteur(s) : Ozan CaglayanMercedes García MartínezAdrien BardetWalid AransaLoïc BarraultFethi Bougaresnmtpy is a suite of Python tools, primarily based on the starter code provided in dl4mt-tutorial for training neural machine translation networks using Theano. The basic motivation behind forking dl4mt-tutorial was to create a framework where it […]

NMTPYTORCH

Logiciel : NMTPYTORCHLicences : MIT LicenseGitHub : https://github.com/lium-lst/nmtpytorch/URL : https://arxiv.org/abs/1706.00457Auteur(s) : Ozan CaglayanMercedes García MartínezAdrien BardetWalid AransaFethi BougaresLoïc BarraultThis is the PyTorch fork of nmtpy, a sequence-to-sequence framework which was originally a fork of dl4mt-tutorial.

LIUM Speaker Diarization

Logiciel : LIUM Speaker DiarizationLicences : GPLURL : https://projets-lium.univ-lemans.fr/spkdiarization/Outil de segmentation et regroupement locuteur (Speaker diarization) en java.

SIDEKIT

Logiciel : SIDEKITLicences : LGPLGitHub : https://git-lium.univ-lemans.fr/Larcher/sidekitURL : https://projets-lium.univ-lemans.fr/sidekit/Auteur(s) : Anthony LarcherKong Aik LeeSylvain Meignier Welcome to SIDEKIT documentation! SIDEKIT is an open source package for Speaker and Language recognition. The aim of SIDEKIT is to provide an educational and efficient toolkit for speaker/language recognition including the whole chain of treatment that goes from the […]

s4d

Logiciel : SIDEKIT for diarization (s4d)Licences : LGPLGitHub : https://git-lium.univ-lemans.fr/Meignier/s4dURL : https://projets-lium.univ-lemans.fr/s4d/Auteur(s) : Pierre-Alexandre BrouxFlorent DesnousAnthony LarcherSylvain Meignier Welcome to SIDEKIT for diarization documentation! SIDEKIT for diarization (s4d as short name) is an open source package extension of SIDEKIT for Speaker diarization . The aim of S4D is to provide an educational and efficient toolkit […]

Hop3x

Logiciel : Hop3xURL : http://hop3x.univ-lemans.frTélécharger la base de données eXist et l’installer en suivant les instructions données sur le site http://exist.sourceforge.net/download.html. Puis télécharger le fichier Hop3x.zip et le décompresser dans un répertoire nommé Hop3x. Les instructions de démarrage sont données dans le fichier Procedure_de_demarrage_d_Hop3x et Procedure_d_installation_d_Hop3x.

CSLM

Logiciel : Continuous Space Language Model toolkit (CSLM)GitHub : https://git-lium.univ-lemans.fr/barrault/cslmURL : https://git-lium.univ-lemans.fr/barrault/cslm/-/archive/master/cslm-master.tar.gzAuteur(s) : Holger SchwenkCSLM toolkit is open-source software which implements the so-called continuous space language model. The basic idea of this approach is to project the word indices onto a continuous space and to use a probability estimator operating on this space. Since the […]

MANY

Corpus : MANYLicences : GNU GPL v3URL : https://code.google.com/archive/p/many/Many un logiciel de combinaison de systèmes de traduction automatique statistique dont l’architecture est décrite dans le schéma suivant :     La combinaison se décompose en 3 étapes Les meilleures hypothèses des M systèmes sont alignées de manière incrémentale afin de générer M réseaux de confusion […]