Séminaires d’Adrien Bardet et d’Amira Barhoumi, doctorants au LIUM

 

Date: 08/11/2019
Heure: 11h00
Lieu: IC2, Salle des conseils
Intervenant: Adrien Bardet, Amira Barhoumi

 

L’apprentissage par transfert multilingue dans la traduction automatique neuronale : Trouver l’équilibre entre les langues.

L’apprentissage par transfert est une solution au problème du manque de données pour une paire de langues donnée en traduction automatique. Nous essaierons de déterminer quels sont les meilleures pratiques pour obtenir un transfert efficace et ainsi améliorer au maximum les résultats de notre tâche où peu de données sont disponibles. Les différences de quantités de données entre les langues pour les systèmes multilingues sont problématiques pour apprendre des systèmes équilibrés. Cette différence de quantité est à prendre en compte dès l’étape de pré-traitement pour assurer une utilisation optimale du système sur ses différentes langues. Nous verrons l’impact de cet équilibre sur les résultats en traduction automatique.

dig

 

Une évaluation empirique des embeddings spécifiques à la langue arabe pour l’analyse des sentiments.

Dans cet article, nous proposons plusieurs plongements lexicaux spécifiques dans le cadre de l’analyse d’opinions en arabe. En effet, l’arabe se caractérise par son agglutination et sa richesse morphologique contribuant à une grande rareté qui pourrait affecter la qualité de l’embedding. Ce travail présente une étude rigoureuse qui compare différents types d’embeddings spécifiques à l’arabe. Nous les évaluons à l’aide de 2 architectures neuronales : l’une basée sur un réseau neuronal convolutif (CNN) et l’autre basée sur un réseau récurrent de type bi-LSTM. Des expériences sont faites sur le corpus de revues de livres (LABR). Nos meilleurs résultats augmentent de 1,9 % la précision des publications précédentes. De plus, nous avons expérimenté la combinaison de nos systèmes individuels définissant une décision très sûre, atteignant une précision de 92,2% sur 98,25% du jeu de test du corpus LABR.

dig