ArSentimentAnalysis

Corpus : ArSentimentAnalysis (ArSentimentAnalysis)GitHub : https://github.com/amirabaroumi/ArSentimentAnalysis Auteur(s) : Amira BarhoumiNathalie CamelinYannick EstèveLe package ArSentimentAnalysis comprend un ensemble de ressources permettant de concevoir et évaluer un système d’analyse d’opinions en arabe. Le package contient: Des ensembles d’embeddings spécifiques à l’arabe pré-entrainés Le lexique polarisé ArSentLex   1/ Ensembles d’embeddings spécifiques à l’arabe : Les embeddings pré-entrainés […]

AlloSat

Corpus : AlloSat (AlloSat)Licences : creative CommonsAuteur(s) : Manon MacaryMarie TahonAnthony RousseauYannick EstèveThe corpus, named AlloSat, is composed of real-life call center conversations in French and is continuously annotated in frustration and satisfaction. This corpus has been set up to develop new systems able to model the continuous aspect of semantic and paralinguistic information at […]

Multi30k

Corpus : Multi30k Dataset (Multi30k)Licences : Attribution-NonCommercial-ShareAlike 4.0 InternationalGitHub : https://github.com/multi30kAuteur(s) : Loïc BarraultOzan CaglayanFethi BougaresLa base de données Flickr30K contient 31 014 images provenant de sites Web de partage de photos en ligne (Young et al., 2014). Chaque image est associée à cinq descriptions en anglais, recueillies auprès d’Amazon Mechanical Turk2. Le jeu de […]

TSAC

Corpus : Tunisian Sentiment Analysis Corpus. (TSAC)Licences : GNU Lesser General Public License v3.0GitHub : https://github.com/fbougares/TSACAuteur(s) : Fethi BougaresSalima MdhaffarYannick EstèveAbout 17k user comments manually annotated to positive and negative polarities. This corpus is collected from Facebook users comments written on official pages of Tunisian radios and TV channels namely Mosaique FM, JawhraFM, Shemes FM, […]

TGRIS-tool

Logiciel : TGRIS-toolAuteur(s) : Iza Marfisi TGRIS : Teacher-Guided Realistic Interview Simulator   TGRIS est un outil de Réalité Virtuelle pour simuler des entretiens, porteurs de charge émotionnelle.   Le CP (Conseiller Pédagogique) formé est assis et parle directement à l’ACA (Agent Conversationnel Animé) via un casque de RV (Réalité Virtuelle). Grace à un casque […]

FrNewsLink

Corpus : Segmentation Thématique (FrNewsLink)URL : https://hal.archives-ouvertes.fr/hal-01741177Le package FrNewsLink comprend un ensemble de ressources permettant d’évaluer des tâches de segmentation thématique et titrage sur un corpus varié de journaux télévisés français. En raison de droits de diffusions, ce package ne contient ni les vidéos, ni les audios des journaux télévisés. Le corpus propose à la […]

TED-LIUM Release 3

Corpus : TED-LIUM Release 3Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)Auteur(s) : François FernandezVincent NguyenSahar GhannayNatalia TomashenkoYannick EstèveThis is the TED-LIUM corpus release 3, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en).   All talks and text are property of TED Conferences LLC.   This new TED-LIUM release was made through a collaboration between the Ubiqus […]

TED-LIUM Release 2

Corpus : TED-LIUM Release 2Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)Auteur(s) : Anthony RousseauPaul DelégliseYannick EstèveThis is the TED-LIUM corpus release 2, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en).   The TED-LIUM corpus was made from audio talks and their transcriptions available on the TED website. We have prepared and filtered these data in order […]

TED-LIUM Release 1

Corpus : TED-LIUM Release 1Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)Auteur(s) : Anthony RousseauPaul DelégliseYannick EstèveThis is the TED-LIUM corpus release 1, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en).   The TED-LIUM corpus is English-language TED talks, with transcriptions, sampled at 16kHz. It contains about 118 hours of speech.   More details are given in […]

NMTPY

Logiciel : NMTPYLicences : MIT LicenseGitHub : https://github.com/lium-lst/nmtpyURL : https://arxiv.org/abs/1706.00457Auteur(s) : Ozan CaglayanMercedes García MartínezAdrien BardetWalid AransaLoïc BarraultFethi Bougaresnmtpy is a suite of Python tools, primarily based on the starter code provided in dl4mt-tutorial for training neural machine translation networks using Theano. The basic motivation behind forking dl4mt-tutorial was to create a framework where it […]