User Pic

Simon Guillot


LST ( Le Mans )

(+33) 02 43 83 38 71

Simon.Guillot@univ-lemans.fr

https://lium.univ-lemans.fr/en/team/simon-guillot-2/


Research Activities:

Thesis: Interpretability of embeddings

Project(s): DIGING

 

Biography

After two years in a course of mathematics for social sciences and a bachelor’s degree in linguistics, I chose to continue with an MA in Corpus Linguistics. This program led me to an internship at the Laboratory of Computer Science of Université du Mans (LIUM). There, I implemented a model of diachronic word embeddings using SINr, an interprepable embeddings model developped in the departement.

My PhD, supervised between the LIUM and the ERTIM research team at Institut National des Langues et Civilisations Orientales(INALCO), consists in interfacing interpretable NLP models and theoritical linguistics, particularly around diachronic embeddings.

HAL Publications  Hal https://hal.archives-ouvertes.fr/search/index/?qa[authIdHal_s][]=

LIUM Publications - 7

[1]Thibault Prouteau, Nicolas Dugué, Simon Guillot. From Communities to Interpretable Network and Word Embedding: an Unified Approach. Journal of Complex Networks, 2024, 12 (6), ⟨10.1093/comnet/cnae034⟩. <hal-04829653>
[2]Anna Béranger, Nicolas Dugué, Simon Guillot, Thibault Prouteau. SINr-filtered : Favoriser l'émergence du sens en filtrant les communautés extraites des réseaux de cooccurrences de mots. Extraction et Gestion des Connaissances, Jan 2024, Dijon, France. pp.429-430. <hal-04470451>
[3]Anna Béranger, Nicolas Dugué, Simon Guillot, Thibault Prouteau. Filtering communities in word co-occurrence networks to foster the emergence of meaning. Conference on Complex Networks and their Applications, Nov 2023, Menton, France. pp.377-388, ⟨10.1007/978-3-031-53468-3_32⟩. <hal-04398742>
[4]Simon Guillot, Thibault Prouteau, Nicolas Dugué. Sparser is better: one step closer to word embedding interpretability. International Conference of Computational Semantics 2023 (IWCS), Jun 2023, Nancy, France. pp.106-115. <hal-04321407>
[5]Simon Guillot, Thibault Prouteau, Nicolas Dugué. De l'interprétabilité des dimensions à l'interprétabilité du vecteur : parcimonie et stabilité. Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Association pour le Traitement Automatique des Langues (ATALA), Jun 2023, Paris, France. <hal-04321436>
[6]Thibault Prouteau, Nicolas Dugué, Simon Guillot, Anthony Perez. SINr: a python package to train interpretable word and graph embeddings. French Regional Conference on Complex Systems, May 2023, Le Havre, France. pp.215, ⟨10.5281/zenodo.7957531⟩. <hal-04113024>
[7]Simon Guillot, Thibault Prouteau, Nicolas Dugue. De l'interprétabilité des dimensions à l'interprétabilité du vecteur : parcimonie et stabilité. 18e Conférence en Recherche d'Information et Applications -- 16e Rencontres Jeunes Chercheurs en RI -- 30e Conférence sur le Traitement Automatique des Langues Naturelles -- 25e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues, 2023, Paris, France. pp.83-91. <hal-04130221>