Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique

 

Date: 23/11/2018

Heure: 11h00

Lieu: IC2, Salle des Conseils

Intervenant(s): Bamba Kane

 

La découverte de motifs est une tâche importante en fouille de données. Ce travail traite de l’extraction des motifs émergents minimaux. Nous proposons une nouvelle méthode efficace qui permet d’extraire les motifs émergents minimaux sans ou avec contrainte de support ; contrairement aux méthodes existantes qui extraient généralement les motifs émergents minimaux les plus supportés, au risque de passer à côté de motifs très intéressants mais peu supportés par les objets. De plus, notre méthode prend en compte l’absence d’attribut qui apporte une nouvelle connaissance intéressante.
En considérant les règles associées aux motifs émergents avec un support élevé comme des règles prototypes, on a montré expérimentalement que cet ensemble de règles possède une bonne confiance sur les objets couverts, mais malheureusement ne couvre pas une bonne partie des objets ; ce qui constitue un frein pour leur usage en classification. Nous proposons une méthode de sélection à base de prototypes qui améliore la couverture de l’ensemble des règles prototypes sans pour autant dégrader leur confiance. Au vu des résultats encourageants obtenus, nous appliquons cette méthode de sélection sur un jeu de données chimique ayant rapport à l’environnement aquatique : Aquatox. Cela permet ainsi aux chimistes, dans un contexte de classification, de mieux expliquer la classification des molécules, qui sans cette méthode de sélection serait prédite par l’usage d’une règle par défaut.