ESPERANTO logo

ESPERANTO

Exchanges for SPEech ReseArch aNd TechnOlogies (ESPERANTO)Date : 01/2021 – 12/2025Financement : EU H2020Appel : H2020-MSCA-RISE-2020Partenaires : academic (MS): Université du Mans, Universidad de Zaragoza, The University of Sheffield, Brno University of Technology, Laboratoire national de métrologie et d’essais (LNE), Université Grenoble Alpes, Avignon Université, University of Yaounde, Consejo Nacional de Investigaciones cientificas y tecnicas, […]

Théo Mariotte

Traitement automatique de la parole en réunion par dissémination de capteursDébuté le : 01/10/2020Doctorant : Théo MariotteDirecteur(s) de Thèse : Jean-Hugh Thomas (LAUM), Anthony Larcher (LIUM)Co-encadrant(s) de Thèse : Silvio Montresor (LAUM)Financement : RFI Le Mans acoustiqueLe sujet est porté par deux laboratoires de Le Mans Université : le laboratoire d’Acoustique (LAUM) et celui d’Informatique […]

Thibault Prouteau

Word embeddings temporels : néologismes, biais de genre, corpus des actualités françaisesDébuté le : 01/10/2020Doctorant : Thibault ProuteauDirecteur(s) de Thèse : Sylvain MeignierCo-encadrant(s) de Thèse : Nicolas Dugué Financement : Allocation de recherche du ministère de l’enseignement supérieurContexte de la thèse : La télévision, la production littéraire et internet fournissent des traces de notre utilisation […]

Valentin Pelloin

Intelligence Artificielle pour une compréhension de la parole contrôlée par la sémantiqueDébuté le : 01/10/2020Doctorant : Valentin PelloinDirecteur(s) de Thèse : Sylvain MeignierCo-encadrant(s) de Thèse : Nathalie Camelin et Antoine LaurentFinancement : ANR AISSPERDescritpion Le projet ANR AISSPER (Artificial Intelligence for Semantically controlled SPEech UndeRstanding) a pour objectif de proposer des nouveaux algorithmes afin de […]

Martin Lebourdais

Extraction d’informations sémantiques end-to-end à partir du signal audioDébuté le : 01/10/2020Doctorant : Martin LebourdaisDirecteur(s) de Thèse : Sylvain MeignierCo-encadrant(s) de Thèse : Antoine Laurent, Marie TahonFinancement : ANR GEMLe projet GEM vise à décrire les différences de représentation et de traitement existant entre les femmes et les hommes dans les médias, en se fondant […]

Salima Mdhaffar

Soutenance de thèse, Salima Mdhaffar Date : 01/07/2020 Heure : 9h30 Lieu : Université d’Avignon, visio-conférence Titre : Reconnaissance de la parole dans un contexte de cours magistraux : évaluation, avancées et enrichissement Composition du jury : Rapporteurs : – M. Georges Linarès (Professeur, Université d’Avignon) – Mme Irina Illina (Maître de conférences HDR, Université […]

ArSentimentAnalysis

Corpus : ArSentimentAnalysis (ArSentimentAnalysis)GitHub : https://github.com/amirabaroumi/ArSentimentAnalysis Auteur(s) : Amira BarhoumiNathalie CamelinYannick EstèveLe package ArSentimentAnalysis comprend un ensemble de ressources permettant de concevoir et évaluer un système d’analyse d’opinions en arabe. Le package contient: Des ensembles d’embeddings spécifiques à l’arabe pré-entrainés Le lexique polarisé ArSentLex   1/ Ensembles d’embeddings spécifiques à l’arabe : Les embeddings pré-entrainés […]

AlloSat

Corpus : AlloSat (AlloSat)Licences : creative CommonsAuteur(s) : Manon MacaryMarie TahonAnthony RousseauYannick EstèveThe corpus, named AlloSat, is composed of real-life call center conversations in French and is continuously annotated in frustration and satisfaction. This corpus has been set up to develop new systems able to model the continuous aspect of semantic and paralinguistic information at […]

Multi30k

Corpus : Multi30k Dataset (Multi30k)Licences : Attribution-NonCommercial-ShareAlike 4.0 InternationalGitHub : https://github.com/multi30kAuteur(s) : Loïc BarraultOzan CaglayanFethi BougaresLa base de données Flickr30K contient 31 014 images provenant de sites Web de partage de photos en ligne (Young et al., 2014). Chaque image est associée à cinq descriptions en anglais, recueillies auprès d’Amazon Mechanical Turk2. Le jeu de […]

TSAC

Corpus : Tunisian Sentiment Analysis Corpus. (TSAC)Licences : GNU Lesser General Public License v3.0GitHub : https://github.com/fbougares/TSACAuteur(s) : Fethi BougaresSalima MdhaffarYannick EstèveAbout 17k user comments manually annotated to positive and negative polarities. This corpus is collected from Facebook users comments written on official pages of Tunisian radios and TV channels namely Mosaique FM, JawhraFM, Shemes FM, […]