Corpus PASTEL

Corpus : PASTEL (Corpus PASTEL)Auteur(s) : Salima MdhaffarYannick EstèveAntoine LaurentNathalie CamelinLe corpus PASTEL consiste en une collection de cours de différents domaines informatique (traitement automatique des langues, introduction à l’informatique, etc) en première année de licence d’informatique à l’Université de Nantes. Il est constitué de cours qui proviennent de deux sources : le projet COCo […]

TurtleTablet

Logiciel : TurtleTablet (TurtleTablet)URL : https://turtletablet.univ-lemans.fr/Auteur(s) : Iza MarfisiSébastien GeorgeMarc Leconte Prix du meilleur Serious Game de l’European Conference on Game Based Learning (ECGBL) dans la catégorie “jeux sur mobiles” (4/32 jeux récompensés)     TurtleTablet est un jeu collaboratif pour s’initier aux bases de la programmation. Pour favoriser une réelle collaboration entre les joueurs, […]

Ecris Ton Zoo

Ecris Ton Zoo Description sur jeu Écris Ton Zoo est un petit jeu pédagogique, sur mobile Android, sans prétention, réalisé par les étudiants en DUT informatique de l’IUT de Laval, dans le cadre de projet tutoré 2020. L’objectif du jeu est d’entrainer des enfants en Grande Section, CP ou CE1 à écrire le nom des […]

DIETS

Diagnostic automatique des erreurs des systèmes de transcription de parole end-to-end à partir de leur réception par les utilisateurs (DIETS)Date : 02/2021 – 08/2024Financement : ANRAppel : AAPG2020 – JCJCPartenaires : LIA (porteur) (France), LPC (France)URL : https://lium.univ-lemans.fr/diets/LIUM Participant(s) : Jane WottawaAntoine ThollyUn problème majeur des métriques d’évaluation en traitement du langage concerne le fait […]

ESPERANTO logo

ESPERANTO

Exchanges for SPEech ReseArch aNd TechnOlogies (ESPERANTO)Date : 01/2021 – 12/2025Financement : EU H2020Appel : H2020-MSCA-RISE-2020Partenaires : academic (MS): Université du Mans, Universidad de Zaragoza, The University of Sheffield, Brno University of Technology, Laboratoire national de métrologie et d’essais (LNE), Université Grenoble Alpes, Avignon Université, University of Yaounde, Consejo Nacional de Investigaciones cientificas y tecnicas, […]

ArSentimentAnalysis

Corpus : ArSentimentAnalysis (ArSentimentAnalysis)GitHub : https://github.com/amirabaroumi/ArSentimentAnalysis Auteur(s) : Amira BarhoumiNathalie CamelinYannick EstèveLe package ArSentimentAnalysis comprend un ensemble de ressources permettant de concevoir et évaluer un système d’analyse d’opinions en arabe. Le package contient: Des ensembles d’embeddings spécifiques à l’arabe pré-entrainés Le lexique polarisé ArSentLex   1/ Ensembles d’embeddings spécifiques à l’arabe : Les embeddings pré-entrainés […]

AlloSat

Corpus : AlloSat (AlloSat)Licences : creative CommonsAuteur(s) : Manon MacaryMarie TahonAnthony RousseauYannick EstèveThe corpus, named AlloSat, is composed of real-life call center conversations in French and is continuously annotated in frustration and satisfaction. This corpus has been set up to develop new systems able to model the continuous aspect of semantic and paralinguistic information at […]

Multi30k

Corpus : Multi30k Dataset (Multi30k)Licences : Attribution-NonCommercial-ShareAlike 4.0 InternationalGitHub : https://github.com/multi30kAuteur(s) : Loïc BarraultOzan CaglayanFethi BougaresLa base de données Flickr30K contient 31 014 images provenant de sites Web de partage de photos en ligne (Young et al., 2014). Chaque image est associée à cinq descriptions en anglais, recueillies auprès d’Amazon Mechanical Turk2. Le jeu de […]

TSAC

Corpus : Tunisian Sentiment Analysis Corpus. (TSAC)Licences : GNU Lesser General Public License v3.0GitHub : https://github.com/fbougares/TSACAuteur(s) : Fethi BougaresSalima MdhaffarYannick EstèveAbout 17k user comments manually annotated to positive and negative polarities. This corpus is collected from Facebook users comments written on official pages of Tunisian radios and TV channels namely Mosaique FM, JawhraFM, Shemes FM, […]

SpeechBrain

SpeechBrain (SpeechBrain)Date : 09/2019 – 12/2021Financement : AutresAppel : Partenaires : Mila (Canada), LIA (France), PyTorch, IBM Research AI, fluent.ai (Canada)URL : https://speechbrain.github.ioLIUM Participant(s) : Anthony LarcherSylvain MeignierSpeechBrain est un toolkit de traitement de la parole open-source et tout-en-un qui s’appuie sur PyTorch. L’objectif est de créer un toolkit unique, flexible et convivial qui peut […]