Proposition d’une approche de capitalisation d’indicateurs dédiés à une étude d’impact du dispositif d’amélioration du français écri+.

Proposition d’une approche de capitalisation d’indicateurs dédiés à une étude d’impact du dispositif d’amélioration du français écri+.   Directeurs : Madeth May (LIUM), Valérie Renault (CREN) Mails : prenom.nom@univ-lemans.fr Date limite de candidature : 22 mai 2020   Contexte de la thèse : Le projet national PIA écri+ (http://ecriplus.fr/) est dédié à l’accompagnement des étudiants […]

Enrichir une pédagogie active par des techniques de réalité augmentée

Enrichir une pédagogie active par des techniques de réalité augmentée   Directeur : Sébastien George Co-Encadrant(s) : Iza Marfisi Mails : prenom.nom@univ-lemans.fr Date limite de candidature : 22 mai 2020   Contexte de la thèse : Laboratoire d’Informatique de l’Université du Mans (LIUM). Cette thèse se déroulera au sein de l’équipe IEIAH (Ingénierie des Environnements […]

ArSentimentAnalysis

Corpus : ArSentimentAnalysis (ArSentimentAnalysis)GitHub : https://github.com/amirabaroumi/ArSentimentAnalysis Auteur(s) : Amira BarhoumiNathalie CamelinYannick EstèveLe package ArSentimentAnalysis comprend un ensemble de ressources permettant de concevoir et évaluer un système d’analyse d’opinions en arabe. Le package contient: Des ensembles d’embeddings spécifiques à l’arabe pré-entrainés Le lexique polarisé ArSentLex   1/ Ensembles d’embeddings spécifiques à l’arabe : Les embeddings pré-entrainés […]

AlloSat

Corpus : AlloSat (AlloSat)Licences : creative CommonsAuteur(s) : Manon MacaryMarie TahonAnthony RousseauYannick EstèveThe corpus, named AlloSat, is composed of real-life call center conversations in French and is continuously annotated in frustration and satisfaction. This corpus has been set up to develop new systems able to model the continuous aspect of semantic and paralinguistic information at […]

Multi30k

Corpus : Multi30k Dataset (Multi30k)Licences : Attribution-NonCommercial-ShareAlike 4.0 InternationalGitHub : https://github.com/multi30kAuteur(s) : Loïc BarraultOzan CaglayanFethi BougaresLa base de données Flickr30K contient 31 014 images provenant de sites Web de partage de photos en ligne (Young et al., 2014). Chaque image est associée à cinq descriptions en anglais, recueillies auprès d’Amazon Mechanical Turk2. Le jeu de […]

TSAC

Corpus : Tunisian Sentiment Analysis Corpus. (TSAC)Licences : GNU Lesser General Public License v3.0GitHub : https://github.com/fbougares/TSACAuteur(s) : Fethi BougaresSalima MdhaffarYannick EstèveAbout 17k user comments manually annotated to positive and negative polarities. This corpus is collected from Facebook users comments written on official pages of Tunisian radios and TV channels namely Mosaique FM, JawhraFM, Shemes FM, […]

Pierre-Alexandre Broux

Soutenance de thèse, Pierre-Alexandre Broux Date : 10/01/2020 Heure : 14h00 Lieu : salle 210, bâtiment IC2, LIUM, Université du Mans Titre : Segmentation et regroupement en locuteurs dans des documents audiovisuels, en interaction avec des annotateurs humains Composition du jury : Rapporteurs : – Jean-François BONASTRE (LIA, Université d’Avignon) – Nicholas EVANS (EURECOM) Examinatrice […]

Apprentissage actif, interprétation et contrôle pour la synthèse neuronale de parole expressive

Apprentissage actif, interprétation et contrôle pour la synthèse neuronale de parole expressive   Directeur : Sylvain Meignier et Anthony Larcher Co-Encadrant(s) : Marie Tahon Mails : prenom.nom@univ-lemans.fr Date limite de candidature : 22 mai 2020   Contexte de la thèse : La thèse aura lieu au Laboratoire d’Informatique de l’Université du Mans (LIUM) dans l’équipe […]

Extraction d’informations sémantiques end-to-end à partir du signal audio

Extraction d’informations sémantiques end-to-end à partir du signal audio   Directeur : Sylvain Meignier Co-Encadrant(s) : Antoine Laurent, Nathalie Camelin, Nicolas Dugué Mails : prenom.nom@univ-lemans.fr Date limite de candidature : 22 mai 2020   Mots-clés : Reconnaissance et compréhension de la parole, approches End2End, réseaux de neurones, genre   Contexte de la thèse : Cette […]

Word embeddings temporels : néologismes, biais de genre, corpus des actualités françaises

Word embeddings temporels : néologismes, biais de genre, corpus des actualités françaises   Directeur : Sylvain Meignier Co-Encadrant(s) : Nicolas Dugué et Nathalie Camelin Mails : prenom.nom@univ-lemans.fr Date limite de candidature : 22 mai 2020   Mots-clés : Word embeddings, corpus temporels, étude de genre, détection de néologismes, médias   Contexte de la thèse : […]