Training CHIldren reading Comprehension skills with Adapted Artificial Intelligence (CHICA-AI)

Date : 10/2023 - 09/2027
Financement : ANR
Appel : AAPG2023
Partenaires : Lalilo (Toulouse), IRIT (Toulouse), EMC (Lyon)
URL : https://lium.univ-lemans.fr/chica-ai/


L’étude PISA 2019 montre que 20% des élèves français de 15 ans ont des difficultés sévères en lecture et que les écarts socio-économiques creusent les différences de niveaux. Lalilo veut réduire ces inégalités à l’aide d’une plateforme en ligne fondée sur l’intelligence artificielle pour différencier l’apprentissage de la lecture. La compréhension de la lecture est essentielle et peut être entraînée grâce à des activités comme le résumé de texte.

Nous proposons de créer un environnement informatique pour l’apprentissage humain (EIAH) entraînant les enfants du cycle 3 à produire des résumés oraux qualitatifs, en analysant automatiquement leur production et en fournissant un retour différencié. Notre EIAH combinera la reconnaissance automatique de la parole (ASR), la compréhension du langage parlé (SLU), et le traitement automatique des langues tout en incorporant les sciences cognitives. Le projet est organisé en trois tâches.

  1. Nous créerons des textes originaux pour l’activité de résumé, ainsi qu’une grille d’évaluation basée sur les grilles psycho-cognitives d’évaluation de résumé. Les données seront collectées via la plateforme Lalilo et annotées pour entraîner et évaluer les systèmes automatiques.

  2. Nous construirons plusieurs systèmes ASR et SLU afin de compléter automatiquement la grille d’évaluation. Nous étudierons pour cela les représentations auto-supervisées de la parole, la robustesse au bruit, la reconnaissance d’entités nommées, les plongements de phrases parole/texte, la modélisation de thèmes et l’analyse syntaxique.

  3. Notre EIAH sera créé et évalué, en construisant des scores automatiques pour chaque critère d’évaluation, en les validant par rapport aux annotations manuelles et aux mesures traditionnelles de compréhension de la lecture, et en concevant des retours ciblés pour enfants et professeurs. Enfin, l’impact de l’intervention sur l’apprentissage des élèves sera évalué par des essais aléatoires contrôlés en classe.

 

 

"Grâce à ce projet, nous avons la chance de pouvoir collaborer avec des chercheurs aux compétences variées issus d’un consortium à 4 partenaires : Lalilo, une entreprise qui propose des solutions d’apprentissage de la lecture assistée par ordinateur adaptées à chaque enfant, le laboratoire EMC de Lyon qui étudie les mécanismes cognitifs et l’IRIT, où une équipe travaille sur le traitement automatiquement de la langue naturelle.

Avec Antoine Laurent, nous apporterons à ce projet nos compétences en traitement automatique de la parole, sur les aspects transcription et compréhension. L’objectif du projet est de proposer une activité de résumé oral offrant un retour formatif aux élèves et un rapport détaillé aux enseignants. De nombreux challenges nous attendent afin d’une part de traiter la parole spontanée des jeunes enfants et d’autre part de produire des critères d’évaluation des résumés produits".

Nathalie CAMELIN | Enseignante-chercheure en informatique