Dynamic and Interpretable Graph-based word embeddINGs (DIGING)

Date : 01/2022 - 12/2025
Financement : ANR
Appel : ANR JCJC
URL : https://lium.univ-lemans.fr/diging/


Les approches récentes d’apprentissage de plongements lexicaux ont mis l’accent sur les résultats, souvent au détriment de l’interprétabilité et de la complexité algorithmique. Pourtant, l’interprétabilité est un pré-requis nécessaire à la mise en œuvre de telles technologies lorsqu’elles sont au service de domaines sensibles comme le domaine juridique ou la médecine. Par ailleurs, les impératifs écologiques créent une urgence à réfléchir à des systèmes performants et économes en calculs. Nous proposons avec DIGING une nouvelle approche performante et économe en calculs pour la construction de plongements lexicaux interprétables basée sur la théorie des réseaux complexes. Avec cette approche originale, l’objectif est de construire des vecteurs intégrant la polysémie nativement en plongeant les mots dans un espace aux dimensions interprétables.

L’interprétabilité de tels plongements permet ainsi d’envisager des applications liées à des domaines sensibles et des sujets de société. Ainsi, nous proposons notamment d’appliquer les méthodes automatiques développées dans le projet sur les corpus issus de deux projets ANR dont le LIUM est partenaire : ANTRACT et GEM, le premier lié à l’évolution de la France à travers son histoire audiovisuelle, et le second étudiant les représentations de genre dans les médias. L’interprétabilité des modèles développés avec DIGING est particulièrement adaptée pour la fouille de tels corpus, notamment dans un contexte temporel, en considérant la détection et la caractérisation des néologismes sémantiques.