Logiciels diffusés

Le LIUM diffuse plusieurs logiciels et ressources tels que des corpus. Certaines productions ont fait l’objet de dépôts auprès de l’Agence de Protection des Programmes (APP) via la Société d’Accélération du Transfert de Technologies (SATT) Ouest Valorisation. La grande majorité des productions est diffusée sous licence libre, plus ou moins contraignante (GPL, LGPL, Creative Common v3, CeCILL).

Liste des logiciels

KUTED

Corpus : Kurdish TED
Licences : CreativeCommons Attribution NonCommercial-ShareAlike 4.0 International License.
Auteur(s) : Mohammad Mohammadamini, Antoine Laurent
URL : https://huggingface.co/datasets/aranemini/kurdishted

Kurdish TED (KUTED) est le premier ensemble de données de traduction de la parole en texte (S2TT) pour la langue kurde centrale (CKB) dérivé des TED et TEDx. Le corpus se compose de 91 000 paires, 170 heures d'audio en anglais, 1,65 million de tokens en anglais et 1,40 million de tokens en kurde central. ► Lire la suite

Corpus ALLIES

Corpus : ALLIES
Auteur(s) : Anthony Larcher, Martin Lebourdais, Marie Tahon
URL : https://lium.univ-lemans.fr/corpus-allies/

Le corpus ALLIES a été produit dans le cadre du projet européen CHIST-Era ALLIES. Le projet ALLIES a permis de mener une campagne d'évaluation de la diffusion d'informations à travers des systèmes de diarisation temporelle en utilisant des données françaises. ► Lire la suite

Jen-Planet

Logiciel : Catalogue de Jeux Educatifs Numériques
Auteur(s) : Iza Marfisi
URL : https://jen-planet.univ-lemans.fr/

Le but du catalogue Planète des Jeux Educatifs Numériques (JEN) est de proposer des JEN aux enseignants pour leurs séances de cours. ► Lire la suite

VR-PEAS

Logiciel : Virtual Reality PEdAgogical Scenarisation tool
Auteur(s) : Oussema Mahdi, Lahcen Oubahssi
URL : https://lium.univ-lemans.fr/vr-peas/

VR-PEAS (Virtual Reality PEdAgogical Scenarisation tool) est un outil auteur qui propose service d’opérationnalisation automatique des scénarios pédagogiques orientés RV. ► Lire la suite

Le Chaudron Magique

Logiciel : Le Chaudron Magique
Auteur(s) : Sébastien George, Iza Marfisi, Sofiane Touel
URL : https://lium.univ-lemans.fr/le-chaudron-magique/

Le Chaudron Magique est une application mobile en Réalité Augmentée pour apprendre les fractions. ► Lire la suite

Corpus PASTEL

Corpus : PASTEL
Auteur(s) : Salima Mdhaffar, Yannick Estève, Antoine Laurent, Nathalie Camelin
URL : https://lium.univ-lemans.fr/pastel-2/

Le corpus PASTEL consiste en une collection de cours de différents domaines informatique (traitement automatique des langues, introduction à l’informatique, etc) en première année de licence d’informatique à l’Université de Nantes.

► Lire la suite

TurtleTablet

Logiciel : TurtleTablet
Auteur(s) : Iza Marfisi, Sébastien George, Marc Leconte
URL : https://turtletablet.univ-lemans.fr/

TurtleTablet est un jeu collaboratif pour s’initier aux bases de la programmation. Pour favoriser une réelle collaboration entre les joueurs, le jeu peut être joué avec deux objets physiques (pièces tangibles) reconnus sur l’écran de la tablette. ► Lire la suite

ArSentimentAnalysis

Corpus : ArSentimentAnalysis
GitHub : https://github.com/amirabaroumi/ArSentimentAnalysis
Auteur(s) : Amira Barhoumi, Nathalie Camelin, Yannick Estève
URL : https://lium.univ-lemans.fr/arsentimentanalysis/

Le package ArSentimentAnalysis comprend un ensemble de ressources permettant de concevoir et évaluer un système d'analyse d'opinions en arabe.
Le package contient:
- 1/ Des ensembles d'embeddings spécifiques à l’arabe pré-entrainés
- 2/ Le lexique polarisé ArSentLex ► Lire la suite

AlloSat

Corpus : AlloSat
Licences : creative Commons
Auteur(s) : Manon Macary, Marie Tahon, Anthony Rousseau, Yannick Estève
URL : https://lium.univ-lemans.fr/allosat/

Le corpus, nommé AlloSat, est composé de conversations réelles en français provenant de centres d'appels et est annoté de façon continue sur les dimensions frustration et satisfaction. Ce corpus a été mis en place pour développer de nouveaux systèmes capables de modéliser l'aspect continu des informations sémantiques et paralinguistiques au niveau de la conversation. ► Lire la suite

Multi30k

Corpus : Multi30k Dataset
Licences : Attribution-NonCommercial-ShareAlike 4.0 International
GitHub : https://github.com/multi30k
Auteur(s) : Loïc Barrault, Ozan Caglayan, Fethi Bougares
URL : https://lium.univ-lemans.fr/multi30k/

La base de données Flickr30K contient 31 014 images provenant de sites Web de partage de photos en ligne (Young et al., 2014). La base de données Multi30K étend l'ensemble de données Flickr30K avec des phrases allemandes indépendantes traduites. ► Lire la suite

TSAC

Corpus : Tunisian Sentiment Analysis Corpus.
Licences : GNU Lesser General Public License v3.0
GitHub : https://github.com/fbougares/TSAC
Auteur(s) : Fethi Bougares, Salima Mdhaffar, Yannick Estève
URL : https://lium.univ-lemans.fr/tsac/

About 17k user comments manually annotated to positive and negative polarities. This corpus is collected from Facebook users comments written on official pages of Tunisian radios and TV channels ► Lire la suite

TGRIS-tool

Logiciel : TGRIS-tool
Auteur(s) : Iza Marfisi
URL : https://lium.univ-lemans.fr/tgris-tool/

TGRIS est un outil de Réalité Virtuelle pour simuler des entretiens, porteurs de charge émotionnelle. ► Lire la suite

FrNewsLink

Corpus : Segmentation Thématique
URL : https://hal.archives-ouvertes.fr/hal-01741177

Le package FrNewsLink comprend un ensemble de ressources permettant d’évaluer des tâches de segmentation thématique et titrage sur un corpus varié de journaux télévisés français. En raison de droits de diffusions, ce package ne contient ni les vidéos, ni les audios des journaux télévisés. ► Lire la suite

TED-LIUM Release 3

Corpus : TED-LIUM Release 3
Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)
Auteur(s) : François Fernandez, Vincent Nguyen, Sahar Ghannay, Natalia Tomashenko, Yannick Estève
URL : https://lium.univ-lemans.fr/ted-lium3/

This is the TED-LIUM corpus release 3, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). ► Lire la suite

TED-LIUM Release 2

Corpus : TED-LIUM Release 2
Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)
Auteur(s) : Anthony Rousseau, Paul Deléglise, Yannick Estève
URL : https://lium.univ-lemans.fr/ted-lium2/

This is the TED-LIUM corpus release 2, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). ► Lire la suite

TED-LIUM Release 1

Corpus : TED-LIUM Release 1
Licences : Creative Commons BY-NC-ND 3.0 (attribution/non-commercial/no-derivatives)
Auteur(s) : Anthony Rousseau, Paul Deléglise, Yannick Estève
URL : https://lium.univ-lemans.fr/ted-lium1/

This is the TED-LIUM corpus release 1, licensed under Creative Commons BY-NC-ND 3.0 (http://creativecommons.org/licenses/by-nc-nd/3.0/deed.en). ► Lire la suite

NMTPY

Logiciel : NMTPY
Licences : MIT License
GitHub : https://github.com/lium-lst/nmtpy
Auteur(s) : Ozan Caglayan, Mercedes García Martínez, Adrien Bardet, Walid Aransa, Loïc Barrault, Fethi Bougares
URL : https://arxiv.org/abs/1706.00457

nmtpy is a suite of Python tools for training mono- and multimodal neural machine translation systems using Theano. ► Lire la suite

NMTPYTORCH

Logiciel : NMTPYTORCH
Licences : MIT License
GitHub : https://github.com/lium-lst/nmtpytorch/
Auteur(s) : Ozan Caglayan, Mercedes García Martínez, Adrien Bardet, Walid Aransa, Fethi Bougares, Loïc Barrault
URL : https://arxiv.org/abs/1706.00457

This is the PyTorch fork of nmtpy, a sequence-to-sequence framework which was originally a fork of dl4mt-tutorial. ► Lire la suite

LIUM Speaker Diarization

Logiciel : LIUM Speaker Diarization
Licences : GPL
URL : https://projets-lium.univ-lemans.fr/spkdiarization/

Outil de segmentation et regroupement locuteur (Speaker diarization) en java. ► Lire la suite

Hop3x

Logiciel : Hop3x
URL : http://hop3x.univ-lemans.fr

Hop3x is a learning environment for learning programming. It allows the teacher to remotely follow the programming activity of the learners by providing qualitative information (indicators) on this activity and a real-time visualization of the productions (source code of the programs). ► Lire la suite

CSLM

Logiciel : Continuous Space Language Model toolkit
GitHub : https://git-lium.univ-lemans.fr/barrault/cslm
Auteur(s) : Holger Schwenk
URL : https://git-lium.univ-lemans.fr/barrault/cslm/-/archive/master/cslm-master.tar.gz

CSLM toolkit is open-source software which implements the so-called continuous space language model. ► Lire la suite

MANY

Corpus : MANY
Licences : GNU GPL v3
URL : https://code.google.com/archive/p/many/

Many un logiciel de combinaison de systèmes de traduction automatique statistique dont l'architecture est décrite ► Lire la suite