Logiciels / Corpus – Laboratoire d'Informatique de l'Université du Mans

Données pseudo-étiquetées de kurde central vers l’anglais pour la traduction de la parole

Corpus : Données pseudo-étiquetées de kurde central vers l’anglais pour la traduction de la parole
Licences : CC BY 4.0 license
Auteur(s) : Mohammad Mohammadamini
URL : https://lium.univ-lemans.fr/ckbens2tt/

Plus d'information

Dans ce dépôt, vous trouverez un ensemble de données pseudo-étiquetées à grande échelle, comprenant de l’audio en kurde central traduit en anglais. ► Lire la suite

KUTED

Corpus : Kurdish TED
Licences : CreativeCommons Attribution NonCommercial-ShareAlike 4.0 International License.
Auteur(s) : Mohammad Mohammadamini, Antoine Laurent
URL : https://huggingface.co/datasets/aranemini/kurdishted

Plus d'information

Kurdish TED (KUTED) est le premier ensemble de données de traduction de la parole en texte (S2TT) pour la langue kurde centrale (CKB) dérivé des TED et TEDx. Le corpus se compose de 91 000 paires, 170 heures d'audio en anglais, 1,65 million de tokens en anglais et 1,40 million de tokens en kurde central. ► Lire la suite

Corpus ALLIES

Corpus : ALLIES
Auteur(s) : Anthony Larcher, Martin Lebourdais, Marie Tahon
URL : https://lium.univ-lemans.fr/corpus-allies/

Plus d'information

Le corpus ALLIES a été produit dans le cadre du projet européen CHIST-Era ALLIES. Le projet ALLIES a permis de mener une campagne d'évaluation de la diffusion d'informations à travers des systèmes de diarisation temporelle en utilisant des données françaises. ► Lire la suite

TimeLine Generator

Logiciel : TimeLine Generator
Auteur(s) : Iza Marfisi, Pierre Laforcade
URL : https://lium.univ-lemans.fr/timeline-editor/

Plus d'information

► Lire la suite

2048 Atomes

Logiciel : 2048 Atomes
Auteur(s) : Iza Marfisi
URL : https://lium.univ-lemans.fr/atomes/

Plus d'information

► Lire la suite

Jen-Planet

Logiciel : Catalogue de Jeux Educatifs Numériques
Auteur(s) : Iza Marfisi
URL : https://jen-planet.univ-lemans.fr/

Plus d'information

Le but du catalogue Planète des Jeux Educatifs Numériques (JEN) est de proposer des JEN aux enseignants pour leurs séances de cours. ► Lire la suite

VR-PEAS

Logiciel : Virtual Reality PEdAgogical Scenarisation tool
Auteur(s) : Oussema Mahdi, Lahcen Oubahssi
URL : https://lium.univ-lemans.fr/vr-peas/

Plus d'information

VR-PEAS (Virtual Reality PEdAgogical Scenarisation tool) est un outil auteur qui propose service d’opérationnalisation automatique des scénarios pédagogiques orientés RV. ► Lire la suite

Le Chaudron Magique

Logiciel : Le Chaudron Magique
Auteur(s) : Sébastien George, Iza Marfisi, Sofiane Touel
URL : https://lium.univ-lemans.fr/le-chaudron-magique/

Plus d'information

Le Chaudron Magique est une application mobile en Réalité Augmentée pour apprendre les fractions. ► Lire la suite

Get Your BUT

Logiciel : Get Your BUT
URL : https://lium.univ-lemans.fr/get-your-but/

Plus d'information

► Lire la suite

Aux couleurs de l’océan

Logiciel : Aux couleurs de l’océan
Auteur(s) : Iza Marfisi
URL : https://lium.univ-lemans.fr/aux-couleurs-de-locean/

Plus d'information

► Lire la suite

Corpus PASTEL

Corpus : PASTEL
Auteur(s) : Salima Mdhaffar, Yannick Estève, Antoine Laurent, Nathalie Camelin
URL : https://lium.univ-lemans.fr/pastel-2/

Plus d'information

Le corpus PASTEL consiste en une collection de cours de différents domaines informatique (traitement automatique des langues, introduction à l’informatique, etc) en première année de licence d’informatique à l’Université de Nantes.

► Lire la suite

TurtleTablet

Logiciel : TurtleTablet
Auteur(s) : Iza Marfisi, Sébastien George, Marc Leconte
URL : https://turtletablet.univ-lemans.fr/

Plus d'information

TurtleTablet est un jeu collaboratif pour s’initier aux bases de la programmation. Pour favoriser une réelle collaboration entre les joueurs, le jeu peut être joué avec deux objets physiques (pièces tangibles) reconnus sur l’écran de la tablette. ► Lire la suite

Plus d'information

Le package ArSentimentAnalysis comprend un ensemble de ressources permettant de concevoir et évaluer un système d'analyse d'opinions en arabe.
Le package contient:
- 1/ Des ensembles d'embeddings spécifiques à l’arabe pré-entrainés
- 2/ Le lexique polarisé ArSentLex ► Lire la suite

AlloSat

Corpus : AlloSat
Licences : creative Commons
Auteur(s) : Manon Macary, Marie Tahon, Anthony Rousseau, Yannick Estève
URL : https://lium.univ-lemans.fr/allosat/

Plus d'information

Le corpus, nommé AlloSat, est composé de conversations réelles en français provenant de centres d'appels et est annoté de façon continue sur les dimensions frustration et satisfaction. Ce corpus a été mis en place pour développer de nouveaux systèmes capables de modéliser l'aspect continu des informations sémantiques et paralinguistiques au niveau de la conversation. ► Lire la suite

Multi30k

Corpus : Multi30k Dataset
Licences : Attribution-NonCommercial-ShareAlike 4.0 International
GitHub : https://github.com/multi30k
Auteur(s) : Loïc Barrault, Ozan Caglayan, Fethi Bougares
URL : https://lium.univ-lemans.fr/multi30k/

Plus d'information

La base de données Flickr30K contient 31 014 images provenant de sites Web de partage de photos en ligne (Young et al., 2014). La base de données Multi30K étend l'ensemble de données Flickr30K avec des phrases allemandes indépendantes traduites. ► Lire la suite

TSAC

Corpus : Tunisian Sentiment Analysis Corpus.
Licences : GNU Lesser General Public License v3.0
GitHub : https://github.com/fbougares/TSAC
Auteur(s) : Fethi Bougares, Salima Mdhaffar, Yannick Estève
URL : https://lium.univ-lemans.fr/tsac/

Plus d'information

About 17k user comments manually annotated to positive and negative polarities. This corpus is collected from Facebook users comments written on official pages of Tunisian radios and TV channels ► Lire la suite

TGRIS-tool

Logiciel : TGRIS-tool
Auteur(s) : Iza Marfisi
URL : https://lium.univ-lemans.fr/tgris-tool/

Plus d'information

TGRIS est un outil de Réalité Virtuelle pour simuler des entretiens, porteurs de charge émotionnelle. ► Lire la suite

FrNewsLink

Corpus : Segmentation Thématique
URL : https://hal.archives-ouvertes.fr/hal-01741177

Plus d'information

Le package FrNewsLink comprend un ensemble de ressources permettant d’évaluer des tâches de segmentation thématique et titrage sur un corpus varié de journaux télévisés français. En raison de droits de diffusions, ce package ne contient ni les vidéos, ni les audios des journaux télévisés. ► Lire la suite

TED-LIUM Release 3

Corpus : TED-LIUM Release 3
Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)
Auteur(s) : François Fernandez, Vincent Nguyen, Sahar Ghannay, Natalia Tomashenko, Yannick Estève
URL : https://lium.univ-lemans.fr/ted-lium3/

Plus d'information

This is the TED-LIUM corpus release 3, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). ► Lire la suite

TED-LIUM Release 2

Corpus : TED-LIUM Release 2
Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)
Auteur(s) : Anthony Rousseau, Paul Deléglise, Yannick Estève
URL : https://lium.univ-lemans.fr/ted-lium2/

Plus d'information

This is the TED-LIUM corpus release 2, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). ► Lire la suite

TED-LIUM Release 1

Corpus : TED-LIUM Release 1
Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)
Auteur(s) : Anthony Rousseau, Paul Deléglise, Yannick Estève
URL : https://lium.univ-lemans.fr/ted-lium1/

Plus d'information

This is the TED-LIUM corpus release 1, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). ► Lire la suite

NMTPY

Logiciel : NMTPY
Licences : MIT License
GitHub : https://github.com/lium-lst/nmtpy
Auteur(s) : Ozan Caglayan, Mercedes García Martínez, Adrien Bardet, Walid Aransa, Loïc Barrault, Fethi Bougares
URL : https://arxiv.org/abs/1706.00457

Plus d'information

nmtpy is a suite of Python tools for training mono- and multimodal neural machine translation systems using Theano. ► Lire la suite

NMTPYTORCH

Logiciel : NMTPYTORCH
Licences : MIT License
GitHub : https://github.com/lium-lst/nmtpytorch/
Auteur(s) : Ozan Caglayan, Mercedes García Martínez, Adrien Bardet, Walid Aransa, Fethi Bougares, Loïc Barrault
URL : https://arxiv.org/abs/1706.00457

Plus d'information

This is the PyTorch fork of nmtpy, a sequence-to-sequence framework which was originally a fork of dl4mt-tutorial. ► Lire la suite

LIUM Speaker Diarization

Logiciel : LIUM Speaker Diarization
Licences : GPL
URL : https://projets-lium.univ-lemans.fr/spkdiarization/

Plus d'information

Outil de segmentation et regroupement locuteur (Speaker diarization) en java. ► Lire la suite

SIDEKIT

Logiciel : SIDEKIT
Licences : LGPL
GitHub : https://git-lium.univ-lemans.fr/Larcher/sidekit
Auteur(s) : Anthony Larcher, Kong Aik Lee, Sylvain Meignier
URL : https://projets-lium.univ-lemans.fr/sidekit/

Plus d'information

Outils de reconnaissance du locuteur. ► Lire la suite

s4d

Logiciel : SIDEKIT for diarization
Licences : LGPL
GitHub : https://git-lium.univ-lemans.fr/Meignier/s4d
Auteur(s) : Pierre-Alexandre Broux, Florent Desnous, Anthony Larcher, Sylvain Meignier
URL : https://projets-lium.univ-lemans.fr/s4d/

Plus d'information

Speaker diarization tools. ► Lire la suite

Hop3x

Logiciel : Hop3x
URL : http://hop3x.univ-lemans.fr

Plus d'information

Hop3x is a learning environment for learning programming. It allows the teacher to remotely follow the programming activity of the learners by providing qualitative information (indicators) on this activity and a real-time visualization of the productions (source code of the programs). ► Lire la suite

Logiciels diffusés

Liste des logiciels

Liste des logiciels