Nicolas Dugué
Enseignant-Chercheur
IEIAH-LST ( Le Mans )
02 43 83 38 44
nicolas.dugue[at]univ-lemans.fr
https://cv.hal.science/nicolas-dugue
https://cv.archives-ouvertes.fr/nicolas-dugue
Activités de Recherche :
Biographie
2016-Aujourd’hui : Au LIUM, je travaille avec l’équipe LST sur des projets variés autour de la fouille de données. En particulier, mon travail met l’accent sur les espaces de représentation (embeddings), dans le cadre de corpus industriels (avec SNCF R&D, projets C3LS et PolysEmY), de corpus issus des médias sociaux (Thèse de Matthieu François) ou pour la recherche de l’interprétabilité (Thèses de Thibault Prouteau, Simon Guillot et Félix Saget) et la gestion de la temporalité (Thèse de Thibault Prouteau et Simon Guillot, projet Neo). Je poursuis également mon travail en Scientométrie en collaboration avec mes collègues du Loria, continuant à contribuer sur la mesure de la qualité des résultats de clustering. J’ai également mené des travaux en analyse d’opinion par le biais de l’apprentissage faiblement supervisé dans le projet ASSC avec MMA (Thèse Rémi Bouvet).
2015-2016 : Au LORIA en post-doc, j’ai ensuite travaillé sur la fouille des bases de données de publications scientifiques. Dans le cadre du projet ISTEX, j’ai notamment mis en œuvre des outils pour découvrir avec précision les thématiques évoquées dans les documents scientifiques et techniques, mais également pour suivre l’évolution de ces thématiques et des mots-clés qui les caractérisent. En particulier, j’ai amorcé des travaux en scientométrie impliquant la mesure de la qualité de clustering, le clustering diachronique, ou le résumé automatique de publications scientifiques.
2011-2015 : Durant ma thèse au LIFO, j’ai étudié via des méthodes statistiques, de théorie des graphes et d’apprentissage automatique des questions de recherche comme la mesure de la visibilité et de l’influence d’un utilisateur sur un réseau social, la détection du spam ou encore la détection d’évènements sur ces mêmes réseaux. Cela m’a amené à m’intéresser à des problèmes d’apprentissage supervisé, de détection de communauté dans des graphes, ou de rôle dans des réseaux.
Intérêts actuels
- Plongements de mots et de noeuds ;
- Interprétabilités ;
- Fouille de corpus textuels ;
- Apprentissage non supervisé.
Logiciel
- SINr : Apprentissage de plongements de noeuds ou de mots interprétables.
Vous souhaitez utiliser SINr dans le cadre de vos cours pour permettre à vos étudiant⋅es de visualiser des plongements interprétables ? Je dispose de TPs, n’hésitez pas à me les demander. - Directed Louvain : Détection de communautés dans des graphes orientés
Responsabilités de recherche
- Coordinateur du projet ANR Diging sur l’apprentissage de plongements interprétables par des méthodes économes en calcul.
- Coordinateur du projet régional PolysEmY en collaboration avec SNCF R&D sur l’apprentissage et l’évaluation de plongements pour des acronymes métiers polysémiques.
- Coordinateur du projet régional Neo, projet amorçage régional Atlanstic2020, sur l’apprentissage de plongements.
Encadrements de thèse
- 2024 – 2027 : Matthieu François, thèse sur la chaire REASONS, en co-encadrement avec Paul Gay et dirigée par Xavier Arnauld de Sartre de L’université de Pau.
- 2023 – 2026 : Félix Saget, thèse ministère sur l’interprétabilité des approches automatiques pour le speech, co-dirigée par Marie Tahon et Anthony Larcher
- 2022 – 2025 : Simon Guillot, doctorant sur le projet ANR Diging, Interprétabilité des plongements et diachronie, dirigée par Antoine Laurent
- 2020 – 2024 : Thibault Prouteau, thèse ministère sur l’apprentissage de plongements interprétables par des méthodes graphes, dirigée par Sylvain Meignier
- 2019 – 2021 : Rémi Bouvet, thèse en collaboration avec MMA pour l’analyse d’opinion en aspects, dirigée par Sylvain Meignier
Encadrements de Post-doc et alternant⋅es :
- 2023 – 2025 : Anna Béranger, alternante sur le projet ANR Diging, développement de SINr et SeeMantics
- 2021 – 2022 : Mohamed Ettaleb, post-doctorant sur le projet ASSC avec MMA
- 2020 – 2021 : Gaëtan Caillaut, post-doctorant sur le projet PolysEmY
Enseignements
- Apprentissage automatique, M1 IA, Université du Mans
- Big Data, M2 IA, Université du Mans
- Conférences, M2 IA, Université du Mans
- Traitement automatique du langage, M2 IA, Université du Mans
- Théorie des graphes, L3, Université du Mans
- Complexité et Structure de données, L3, Université du Mans
- POO, L3, Université du Mans
- Web dynamique, L2, Université du mans
2018-2021 :
- Fouille de texte, M2 ATAL, Université du Mans
- Fouille de données supervisée, M2 AFD, Université du Mans
2016-2021 :
- Systèmes d’information de gestion, 2A, département de gestion de l’IUT du Mans
- Bureautique, 1A, département de gestion de l’IUT du Mans
2019-2021 :
- Introduction à l’IA, M2 UNIC, Université Pantheon Assas
Responsabilités en enseignement
- Depuis 2024 : Responsable des stages du département informatique de l’Université du Mans
- 2018-2021 : Responsable du parcours Musique et Sport Études depuis 201 : aménagement du DUT sur 3 ans et suivi individuels avec les clubs et le conservatoire ;
- Responsable des Licences professionnelles au département de gestion de l’IUT en 2020
- Référent de première année à l’IUT de gestion en 2021
[1] | Thibault Prouteau, Nicolas Dugué, Simon Guillot. From Communities to Interpretable Network and Word Embedding: an Unified Approach. Journal of Complex Networks, 2024, 12 (6), ⟨10.1093/comnet/cnae034⟩. <hal-04829653> |
[2] | Wajd Meskini, Alexandre Brouste, Nicolas Dugué. Speeding up the Training of Neural Networks with the One-Step Procedure. Neural Processing Letters, 2024, 56 (3), pp.178. ⟨10.1007/s11063-024-11637-6⟩. <hal-04733965> |
[3] | Anna Béranger, Nicolas Dugué, Simon Guillot, Thibault Prouteau. SINr-filtered : Favoriser l'émergence du sens en filtrant les communautés extraites des réseaux de cooccurrences de mots. Extraction et Gestion des Connaissances, Jan 2024, Dijon, France. pp.429-430. <hal-04470451> |
[4] | Anna Béranger, Nicolas Dugué, Simon Guillot, Thibault Prouteau. Filtering communities in word co-occurrence networks to foster the emergence of meaning. Conference on Complex Networks and their Applications, Nov 2023, Menton, France. pp.377-388, ⟨10.1007/978-3-031-53468-3_32⟩. <hal-04398742> |
[5] | Simon Guillot, Thibault Prouteau, Nicolas Dugué. Sparser is better: one step closer to word embedding interpretability. International Conference of Computational Semantics 2023 (IWCS), Jun 2023, Nancy, France. pp.106-115. <hal-04321407> |
[6] | Simon Guillot, Thibault Prouteau, Nicolas Dugué. De l'interprétabilité des dimensions à l'interprétabilité du vecteur : parcimonie et stabilité. Conférence sur le Traitement Automatique des Langues Naturelles (TALN), Association pour le Traitement Automatique des Langues (ATALA), Jun 2023, Paris, France. <hal-04321436> |
[7] | Thibault Prouteau, Nicolas Dugué, Simon Guillot, Anthony Perez. SINr: a python package to train interpretable word and graph embeddings. French Regional Conference on Complex Systems, May 2023, Le Havre, France. pp.215, ⟨10.5281/zenodo.7957531⟩. <hal-04113024> |
[8] | Mohamed Ettaleb, Amira Barhoumi, Nathalie Camelin, Nicolas Dugué. Evaluation of weakly-supervised methods for aspect extraction. 26th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems, Sep 2022, Verona, Italy. <hal-03765562> |
[9] | Thibault Prouteau, Nicolas Dugué, Nathalie Camelin, Sylvain Meignier. Are Embedding Spaces Interpretable? Results of an Intrusion Detection Evaluation on a Large French Corpus. LREC 2022, Jun 2022, Marseille, France. pp.4414-4419. <hal-03770444> |
[10] | Nicolas Dugué, Anthony Perez. Direction matters in complex networks: A theoretical and applied study for greedy modularity optimization. Physica A: Statistical Mechanics and its Applications, 2022, 603, pp.127798. ⟨10.1016/j.physa.2022.127798⟩. <hal-03701447> |
[11] | Nicolas Dugué, Jean-Charles Lamirel, Yue Chen. Evaluating clustering quality using features salience: a promising approach. Neural Computing and Applications, 2021, 33 (19), pp.12939-12956. ⟨10.1007/s00521-021-05942-7⟩. <hal-03714726> |
[12] | Gaëtan Caillaut, Nicolas Dugué, Nathalie Camelin. Narcissist! Do you need so much attention?. CAP : Conférence sur l'Apprentisage automatique, Jun 2021, Saint-Etienne (en distanciel), France. & <hal-03236703> |
[13] | Jean-Charles Lamirel, Younes Gueddari, Yuqi Wang, Pascal Cuxac, Anthony Perez, et al.. Analysis of the dynamics and influence of the research work of Prof. Liu Zeyuan in China featuring a new hybrid approach combining community detection with topic tracking. Scientometrics, 2021, 126 (7), pp.6273-6300. ⟨10.1007/s11192-021-04010-0⟩. <hal-03285158> |
[14] | Thibault Prouteau, Victor Connes, Nicolas Dugué, Anthony Perez, Jean-Charles Lamirel, et al.. SINr: Fast Computing of Sparse Interpretable Node Representations is not a Sin!. Advances in Intelligent Data Analysis XIX, 19th International Symposium on Intelligent Data Analysis, IDA 2021, Apr 2021, Porto, Portugal. pp.325-337, ⟨10.1007/978-3-030-74251-5_26⟩. <hal-03197434> |
[15] | Henri Marret, Floriane Bonnin, Nicolas Dugué. Prescription de macroprogestatifs oraux en alternative aux contraceptions validées : étude de pratiques en Région Centre.. Congrès Pari(s) Santé Femmes, Jan 2021, Paris, France. <hal-03139136> |
[16] | Jean-Charles Lamirel, Yue Chen, Pascal Cuxac, Shadi Al Shehabi, Nicolas Dugué, et al.. Science of Science research in mainland China: 40 years of evolution. A new method of analysis based on clustering with feature maximization and contrast graphs. Scientometrics, 2020, 125, pp.2971-2999. ⟨10.1007/s11192-020-03503-8⟩. <hal-03179165> |
[17] | Victor Connes, Nicolas Dugué. Apprentissage de plongements lexicaux par une approche réseaux complexes. TALN 2019, Jul 2019, Toulouse, France. <hal-02408156> |
[18] | Gaëtan Caillaut, Guillaume Cleuziou, Nicolas Dugué. Learning pretopological spaces to extract ego-centered communities. Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), Apr 2019, Macau, China. pp.488-500, ⟨10.1007/978-3-030-16145-3\_38⟩. <hal-02079771> |
[19] | Nicolas Dugué, Nathalie Camelin, Luce Lefeuvre, Xining Li, Coralie Reutenauer, et al.. Apprentissage et évaluation de plongements lexicaux sur un corpus SNCF en langue spécialisée. Extraction et Gestion des Connaissances, Jan 2019, Metz, France. <hal-01982661> |
[20] | Gaëtan Caillaut, Guillaume Cleuziou, Nicolas Dugué. Extraction de communautés ego-centrées par apprentissage supervisé d'espaces prétopologiques.. 19èmes Journées Extraction et Gestion des Connaissances (EGC 2019), Jan 2019, Metz, France. pp.117-128. <hal-02003133> |
[21] | Victor Connes, Nicolas Dugué, Adrien Guille. Is Community Detection Fully Unsupervised? The Case of Weighted Graphs. COMPLEX NETWORKS 2018: Complex Networks and Their Applications VII, Dec 2018, Cambridge, United Kingdom. <hal-01982660> |
[22] | Nicolas Dugué, Jean-Charles Lamirel, Anthony Perez. Bringing a Feature Selection Metric from Machine Learning to Complex Networks. COMPLEX NETWORKS 2018:The Seventh International Conference on Complex Networks & their Applications, Dec 2018, Cambridge, United Kingdom. pp.107-118, ⟨10.1007/978-3-030-05414-4_9⟩. <hal-03250913> |
[23] | Hazem Al Saied, Nicolas Dugué, Jean-Charles Lamirel. Automatic summarization of scientific publications using a feature selection approach. International Journal on Digital Libraries, 2018, 19 (2-3), pp.203-215. ⟨10.1007/s00799-017-0214-x⟩. <hal-01508130> |
[24] | Amira Barhoumi, Vincent Levorato, Nicolas Dugué, Nathalie Camelin. "L'important c'est de participer" : positive #ironie. Analyse de sentiments et détection de l'ironie Les systèmes du LIUM et d'OCTO. DEFT 2017, Jun 2017, Orléans, France. <hal-01592453> |
[25] | Nicolas Dugué, Jean-Charles Lamirel. Une métrique de sélection de variables appliquée à la centralité et à la détection des rôles communautaires. 17ème Conférence Extraction et Gestion des Connaissances (EGC 2017), Jan 2017, Grenoble, France. pp.9-20. <hal-01504066> |
[26] | Nicolas Dugué, Jean-Charles Lamirel, Pascal Cuxac. Visualisation pour la détection d’évolutions dans des corpus de publications scientifiques. Les Cahiers du numérique, 2016, 12 (4), pp.157-184. <hal-01504064> |