Modèle de correction des fautes d'orthographe en khmer avec une approche d'apprentissage profond pour améliorer la précision de la saisie en khmer dans un contexte éducatif

Débuté le : 01/11/2022
Doctorant : Seanghort Born
Directeur(s) de Thèse : Madeth May
Co-encadrant(s) de Thèse :
Financement :

Dans l’industrie 4.0, nous nous dirigeons vers l’utilisation du numérique, qui fait désormais partie intégrante de nos vies. Avant l’invention des appareils numériques, nous gardions la trace des informations par l’écriture manuelle, mais maintenant nous tapons. Les erreurs de frappe, en particulier les fautes d’orthographe, peuvent entraîner des problèmes de texte, d’assurance de frappe et de perturbation sociale. En comparaison avec d’autres langues majeures, il existe peu d’études et d’outils disponibles sur les fautes d’orthographe en khmer. C’est un défi pour les utilisateurs de la langue khmère qui font des erreurs typographiques dans leur saisie en khmer en raison de la complexité de la langue khmère et du manque de bonnes suggestions orthographiques, en particulier dans le milieu universitaire. Le but de cette recherche est de développer un modèle de langue khmère capable de corriger les mots mal orthographiés en khmer dans le domaine de l’éducation avec trois objectifs :

  • accroître la confiance des dactylos khmères,
  • participer à la promotion de la littérature nationale dans le domaine universitaire,
  • et de développer des outils d’assistance pour les applications de rédaction de texte les plus répandues, notamment l’extension Microsoft Word et l’extension Chrome.

Nous proposerons un modèle de correction des fautes d’orthographe en khmer en utilisant une technique d’apprentissage profond qui permet à l’ordinateur de se perfectionner en utilisant le modèle BERT et des données de 100 000 mots du dictionnaire khmer.