User Pic

Thibault Prouteau


LST ( Le Mans )

(+33) 02 43 83 38 56

thibault.prouteau[at]univ-lemans.fr

https://lium.univ-lemans.fr/en/team/thibault-prouteau-2/

 

Biography

After graduating with my BSc from the University of Tours and a year abroad at HAW Hamburg (Hamburg University of Applied Sciences), passionate with NLP since the beginning of my curriculum, I graduated with a MSc in natural language processing (ATAL) from the University of Le Mans. I am currently a PhD student at Laboratoire d’Informatique de l’Université du Mans (LIUM). My thesis aims at developing temporal and interpretable word representations (word embeddings) to detect and characterise neologisms in large text corpora, in the context of evolving language using transcribed INA corpora. Another goal is to evaluate gender bias and stereotypes over time. My work is at the crossroads of three domains: artificial intelligence, digital humanities and network theory.

HAL Publications  Hal https://hal.archives-ouvertes.fr/search/index/?qa[authIdHal_s][]=thibault-prouteau

LIUM Publications - 8

[1]Simon Guillot, Thibault Prouteau, Nicolas Dugué. Sparser is better: one step closer to word embedding interpretability. International Conference of Computational Semantics 2023 (IWCS), Jun 2023, Nancy, France. <hal-04321407>
[2]Simon Guillot, Thibault Prouteau, Nicolas Dugué. De l'interprétabilité des dimensions à l'interprétabilité du vecteur : parcimonie et stabilité. Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Association pour le Traitement Automatique des Langues (ATALA), Jun 2023, Paris, France. <hal-04321436>
[3]Thibault Prouteau, Nicolas Dugué, Simon Guillot, Anthony Perez. SINr: a python package to train interpretable word and graph embeddings. French Regional Conference on Complex Systems, May 2023, Le Havre, France. pp.215, ⟨10.5281/zenodo.7957531⟩. <hal-04113024>
[4]Simon Guillot, Thibault Prouteau, Nicolas Dugue. De l'interprétabilité des dimensions à l'interprétabilité du vecteur : parcimonie et stabilité. 18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.83-91. <hal-04130221>
[5]Thibault Prouteau, Nicolas Dugué, Nathalie Camelin, Sylvain Meignier. Are Embedding Spaces Interpretable? Results of an Intrusion Detection Evaluation on a Large French Corpus. LREC 2022, Jun 2022, Marseille, France. <hal-03770444>
[6]Thibault Prouteau, Victor Connes, Nicolas Dugué, Anthony Perez, Jean-Charles Lamirel, et al.. SINr: Fast Computing of Sparse Interpretable Node Representations is not a Sin!. Advances in Intelligent Data Analysis XIX, 19th International Symposium on Intelligent Data Analysis, IDA 2021, Apr 2021, Porto, Portugal. pp.325-337, ⟨10.1007/978-3-030-74251-5_26⟩. <hal-03197434>
[7]Coralie Reutenauer, Luce Lefeuvre, Aurélie Fouqueray, Thibault Prouteau, Valentin Pelloin, et al.. Technologies sémantiques et accès à l'information dans le prescrit SNCF. Congrès Lambda Mu 22 « Les risques au cœur des transitions » (e-congrès) - 22e Congrès de Maîtrise des Risques et de Sûreté de Fonctionnement, Institut pour la Maîtrise des Risques, Oct 2020, Le Havre (e-congrès), France. <hal-03476574>
[8]Valentin Pelloin, Thibault Prouteau. Apprentissage de plongements de mots sur des corpus en langue de spécialité : une étude d’impact. 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 3 : Rencontre des Étudiants Chercheurs en Informatique pour le TAL, Jun 2020, Nancy, France. pp.164-178. & <hal-02786198>