II.3.7 Tâche 7- Diffusion et valorisation des ressources produites

Responsable : S. Fleury (Clesthia)
Partenaires : CIRCEFT (E. Bautier), CLESTHIA (O. Lumbroso, Chiara Mainardi, C. Doquet), CLLE (L.-M. Ho-Dac), LIDILEM (C. Ponton, I. Rousset)
Période : mois 0-42
Livrable : site Web présentant l’ensemble des livrables du projet et mis en relation avec d’autres espaces en ligne, en particulier les sites des équipes partenaires et les outils mis en place dans le cadre de dispositifs didactiques (cf. impact sociétal : III.3).
Objectif : assurer la diffusion et la valorisation de l’ensemble des livrables issus de chacune des tâches du projet E-CALM – corpus retranscrit et annoté, guide de recueil et d’annotation, ressources lexicales, modules de traitement automatique. Toutes nos données et outils seront distribués en accès libre sous licence Creative Commons et déposés sur Ortolang.
Justification de la tâche : notre projet reposant en partie sur le partage des ressources et des analyses qui y seront effectuées, la diffusion et la valorisation doivent faire l’objet d’une tâche à part entière.
Programme détaillé des travaux :
• T. 7-1 Création et enrichissement progressif du site Web du projet [0-42]
Ce site sera à la fois un outil de valorisation en accès ouvert et un outil de travail en interne au sein du projet avec une partie en accès restreint (cf. tâche 0). Les ressources construites sur les données traitées dans le projet (corpus annoté, lexique de graphies, etc.) seront progressivement mises à disposition sur ce site.


• T. 7-2 Mise à disposition progressive de l’ensemble des ressources [19-38]
Parallèlement au dépôt sur la plateforme Ortolang (cf. tâche 1.3), l’ensemble du corpus constitué dans la tâche 1 sera archivé et accessible sur le site Web du projet. Ce site présentera l’intégralité des données au fur et à mesure de leur traitement (anonymisation, transcription, mise en relation entre les écrits et les différentes métadonnées collectées). Les écrits seront rendus accessibles par différents opérateurs de tri : caractéristiques des classes (établissement / niveau de classe), des élèves (sexe / parcours scolaire), des écrits (genre / consigne / présence de divers états du texte / interventions du professeur sur les copies). Le corpus sera diffusé avec le guide des bonnes pratiques pour le recueil et le traitement de corpus scolaires mis en place et éprouvé au fil du projet. Les guides d’annotations pour les différents niveaux d’analyse seront diffusés.


• T. 7-3 Mise à disposition progressive d’outils et de méthodes pour l’exploration du corpus [19-38]
La mise à disposition des ressources sur le site du projet s’accompagnera du développement de modules permettant des traitements informatiques sur ces données. Un premier ensemble de modules concerne l’exploitation des données du corpus E-CALM (cf. tâche 1). Ce type de module est actuellement en cours de test sur les données Ecriscol utilisées dans le projet. Pour le moment, les données du corpus Ecriscol mettent au jour les différentes opérations de réécriture visibles sur le manuscrit original ; les développements envisagés visent par exemple à explorer quantitativement les différents types d’opération de réécriture sur l’ensemble des copies du corpus. Le deuxième ensemble concerne les sous-corpus utilisés et annotés dans les tâches d’analyse (cf. tâches 3 et 4). En effet, ces analyses seront pour partie appuyées par le développement d’outils spécifiques comme, par exemple, la détection des erreurs et/ou des réussites liées à la morphologie verbale dans tel ou tel contexte (cf. tâche 3.1). Le site web du projet offrira la possibilité d’utiliser (ou de télécharger) directement ces outils sur ces corpus pour d’éventuelles autres recherches.


• T. 7-4 Évaluation et adaptation du site Web [33-42]
Afin de rendre les ressources accessibles aux utilisateurs qui ne sont pas familiers du monde de la recherche, une expérimentation sera proposée à un panel d’enseignants du premier et second degré. Il s’agira de leur demander d’utiliser le site et les ressources pour la construction de séquences pédagogiques et d’analyser ensuite avec eux la facilité d’exploitation de ces matériaux.
Le site et les ressources seront ensuite amenés à évoluer en fonction des retours de cette expérimentation.