III. Impact et retombées du projet

III.1. Impact scientifique
L’impact le plus net est l’ouverture de possibilités d’investigations linguistiques inédites sur les produits mais également le processus de production d’écrits (différents états de l’écriture) en milieu scolaire/universitaire. Le changement d’échelle des observations que permet la mise à disposition d’un grand corpus outillé pour les linguistes et les didacticiens leur permettra d’affronter les défis que pose l’apprentissage de la production des textes de l’école à l’université en ouvrant à des analyses qualitatives et quantitatives innovantes.
• Apports aux analyses de la cohérence textuelle
Les théories de la cohérence du discours ont été jusque là mises à l’épreuve sur des données attestées constituées de textes d’experts, généralement “cohérents”. Toutefois, ces travaux s’appuient généralement sur des tâches très contraintes, du type dictée, et non sur de la production de texte. Leur mise à l’épreuve sur des productions écrites d’apprenants révélant un moindre degré de cohérence permettra de tester leur robustesse, voire de mettre au jour des axes d’améliorations des théories. Une expérience a déjà été tentée pour des textes de scripteurs avec troubles psychiatriques (Rebuschi et al. 2014), mais jamais encore sur des textes d’élèves.
• Apports aux analyses de l’orthographe
Les nombreux travaux disponibles portant sur l’orthographe et le développement de la compétence orthographique constituent un socle déterminant pour les analyses de la morphographie flexionnelle et lexicale. En s’articulant aux travaux existants, l’exploration outillée de notre corpus de textes d’élèves et d’étudiants contribuera à éclairer, à grande échelle, les variantes orthographiques, leur évolution, leur traitement par les enseignants, ainsi que la question de la gestion et du contrôle de l’orthographe en production de texte quand les ressources attentionnelles sont partagées.
• Possibilité d’un retour des observations vers la description du système de la langue
La situation d’apprentissage de l’écriture et les difficultés qu’elle révèle permettent de mettre au jour les zones les plus résistantes de la langue qui apparaissent aussi, mais sous forme atténuée, chez les scripteurs disposant d’un haut degré de maitrise de l’écrit. En plus d’investigations linguistiques inédites sur les écrits (brouillons et textes), le corpus et l’outillage constitués rendront possible un regard précis et comparatif sur des éléments de la langue qui auront des conséquences directes sur des catégories linguistiques existantes ; par exemple, le relevé des différentes graphies pour un morphème alimentera l’étude des morphogrammes.
• Apports à la génétique textuelle
Au-delà de l’étude d’écrits scolaires, le corpus que nous réunissons permettra de revisiter des catégories construites à partir des manuscrits d’écrivains. La génétique textuelle (Lebrave, 2006) décrit les opérations d’écriture comme orientées dans le temps et impactées par le contexte scriptural dans lequel elles interviennent (au sein de la scription vs pendant une relecture). L’approche des écrits d’élèves que nous proposons, théorisée linguistiquement grâce à la notion de co-énonciation (cf. I.2.1), permet de différencier les opérations d’écriture « spontanées », celles que le scripteur effectue de son propre chef – et ce, sachant que le contexte scolaire de l’écriture inclut souvent le recours à des outils scolaires, à des affichages méthodologiques, etc. – d’opérations d’écritures suscitées par les prescriptions et interventions de l’enseignant sur la copie. L’observation de la relation entre intervention de l’enseignant et réponse de l’élève permettra de réinstancier des études énonciatives des manuscrits d’écrivains (Grésillon & Lebrave, 1984 ; Fuchs et al., 1987) et de proposer une méthode d’exploration génétique de l’écriture collaborative.

III.2. Impact technologique
Les impacts technologiques du projet se situent sur deux plans : le corpus complet et l’outillage.
Concernant le corpus, pour favoriser sa diffusion et faciliter sa réutilisation dans des contextes scientifiques et applicatifs variés, nous avons fait le choix d’aller vers le format TEI. Cette norme est celle adoptée pour divers types de corpus (littéraires, journalistiques, SMS, tweets…) et proposée par la plateforme Ortolang. La définition d’une norme TEI pour les corpus scolaires contribuera à l’interopérabilité en facilitant l’accès à la fois aux contenus des écrits scolaires et aux métadonnées associées. Notre corpus sera ainsi facilement exploitable par des traitements automatiques et par les outils classiques de textométrie qui acceptent tous la norme TEI, permettant ainsi des requêtes portant à la fois sur le contenu, les annotations et les méta-données.
Dans le cadre des analyses menées sur l’orthographe, la cohérence/cohésion et les interventions des enseignants, nous développerons des outils d’aide à la manipulation des données. En effet, une des originalités du projet est de recourir aux technologies relevant du domaine du TAL dans le but d’outiller les tâches de transcription, d’annotation et d’exploitation de ces annotations. Les outils développés à cette occasion seront mis à disposition via le site web du projet et constitueront une première “boite à outils” de traitement automatique ou semi-automatique de corpus scolaires.


III.3. Impact sociétal
Les livrables projetés contribueront à la construction de nouveaux leviers de lutte contre l’échec scolaire, à destination des enseignants, des formateurs et décideurs de l’Éducation Nationale (formateurs d’enseignants, conseillers pédagogiques, inspecteurs, inspecteurs généraux…) et des instances universitaires. L’objectivation du regard sur les performances, la mise au jour des scénarios de développement des diverses compétences permettront de distinguer la maitrise de l’orthographe de celle de la construction des textes et d’agir de façon appropriée sur chaque compétence. L’état des lieux des performances des élèves et étudiants en production écrite et sa mise en relation avec des caractéristiques sociologiques et didactiques permettront :

  1. pour les acteurs de la formation – y compris dans le domaine de la pédagogie universitaire – et de l’accompagnement des enseignants, de caractériser les inégalités au regard des gestes professionnels des enseignants, notamment la correction des copies, de repérer les gestes les plus appropriés au développement des compétences scripturales tout au long de la scolarité et ainsi de mieux former les enseignants ;
  2. pour les enseignants, de comprendre les scénarios ou modalités de développement des diverses compétences, de mieux identifier les obstacles à l’écriture et donc de produire des propositions didactiques différenciées, adaptées aux différents contextes d’apprentissage ;
  3. au-delà de la sphère enseignante, pour les parents d’élèves et autres acteurs du système éducatif, de mieux comprendre les compétences en jeu par le biais site web du projet qui aura vocation à vulgariser nos travaux.
    Le consortium, du fait de ses partenariats existants avec l’Éducation Nationale (Institut Carnot de l’Éducation, établissements primaires en REP, micro-lycées) est assuré de la réalité de ces retombées pour les différents niveaux de la scolarité : primaire, secondaire, supérieur.