User Pic

Thibault Prouteau


LST ( Le Mans )

02 43 83 38 56

thibault.prouteau[at]univ-lemans.fr

https://lium.univ-lemans.fr/team/thibault-prouteau-2/


Activités de Recherche :

Thèse : Word embeddings temporels : néologismes, biais de genre, corpus des actualités françaises

 

Biographie

Après une licence en informatique à l’Université de Tours, un séjour d’une année à l’HAW Hamburg, intéressé par le TAL depuis le début de mes études, j’ai poursuivi mon cursus au sein du master Apprentissage et Traitement Automatique des Langues (ATAL) proposé par Le Mans Université. Doctorant au Laboratoire d’Informatique de l’Université du Mans (LIUM), mes travaux ont pour but de fournir une représentation informatique temporelle et interprétable des mots (word embeddings) pour la détection et la caractérisation des néologismes sur de grands corpus textuels, dans le cadre de l’évolution du langage télévisé dans des corpus INA transcrits ou encore pour évaluer l’évolution des biais de genre et des stéréotypes dans le temps. Ce sujet de thèse est à la croisée de trois domaines : l’intelligence artificielle, les humanités numériques et la théorie des réseaux.

Liste Complète des Publications sur HAL  Hal https://hal.archives-ouvertes.fr/search/index/?qa[authIdHal_s][]=thibault-prouteau

Publications au LIUM - 8

[1]Simon Guillot, Thibault Prouteau, Nicolas Dugué. Sparser is better: one step closer to word embedding interpretability. International Conference of Computational Semantics 2023 (IWCS), Jun 2023, Nancy, France. <hal-04321407>
[2]Simon Guillot, Thibault Prouteau, Nicolas Dugué. De l'interprétabilité des dimensions à l'interprétabilité du vecteur : parcimonie et stabilité. Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Association pour le Traitement Automatique des Langues (ATALA), Jun 2023, Paris, France. <hal-04321436>
[3]Thibault Prouteau, Nicolas Dugué, Simon Guillot, Anthony Perez. SINr: a python package to train interpretable word and graph embeddings. French Regional Conference on Complex Systems, May 2023, Le Havre, France. pp.215, ⟨10.5281/zenodo.7957531⟩. <hal-04113024>
[4]Simon Guillot, Thibault Prouteau, Nicolas Dugue. De l'interprétabilité des dimensions à l'interprétabilité du vecteur : parcimonie et stabilité. 18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.83-91. <hal-04130221>
[5]Thibault Prouteau, Nicolas Dugué, Nathalie Camelin, Sylvain Meignier. Are Embedding Spaces Interpretable? Results of an Intrusion Detection Evaluation on a Large French Corpus. LREC 2022, Jun 2022, Marseille, France. <hal-03770444>
[6]Thibault Prouteau, Victor Connes, Nicolas Dugué, Anthony Perez, Jean-Charles Lamirel, et al.. SINr: Fast Computing of Sparse Interpretable Node Representations is not a Sin!. Advances in Intelligent Data Analysis XIX, 19th International Symposium on Intelligent Data Analysis, IDA 2021, Apr 2021, Porto, Portugal. pp.325-337, ⟨10.1007/978-3-030-74251-5_26⟩. <hal-03197434>
[7]Coralie Reutenauer, Luce Lefeuvre, Aurélie Fouqueray, Thibault Prouteau, Valentin Pelloin, et al.. Technologies sémantiques et accès à l'information dans le prescrit SNCF. Congrès Lambda Mu 22 « Les risques au cœur des transitions » (e-congrès) - 22e Congrès de Maîtrise des Risques et de Sûreté de Fonctionnement, Institut pour la Maîtrise des Risques, Oct 2020, Le Havre (e-congrès), France. <hal-03476574>
[8]Valentin Pelloin, Thibault Prouteau. Apprentissage de plongements de mots sur des corpus en langue de spécialité : une étude d’impact. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL, Jun 2020, Nancy, France. pp.164-178. & <hal-02786198>