I. Contexte, positionnement et objectif(s) de la proposition

Les enquêtes PISA (OCDE 2016) montrent depuis dix ans la particularité de la France concernant le poids de l’origine sociale sur les inégalités entre élèves (cf. également CNESCO 2016) ; elles montrent également le faible niveau des élèves dans des tâches d’écriture complexes, à un moment où les attendus de la maitrise de l’écrit littératié dans les apprentissages prend de plus en plus d’importance. Pourtant la production écrite est pointée par de récentes enquêtes comme trop peu travaillée à l’école et au collège (Claus et al. 2013 ; Goigoux et al. 2016) et la réalité des performances à l’écrit des élèves et des étudiants est encore approximativement cernée, faute de données exploitables et disponibles à tous les niveaux de la scolarité. Notre projet vise à décrire avec précision, grâce à des outils d’analyse textuelle, (1) ces performances tout au long de la scolarité et jusqu’au Master, et (2) les attentes des enseignants en termes de normes linguistiques et langagières, en vue de soutenir la formation professionnelle des enseignants sur l’accompagnement et l’évaluation des écrits. Ce projet s’appuie sur et inclut la publication en open access d’un vaste corpus de référence d’écrits d’apprenants assorti de métadonnées contextuelles et d’outils de traitement qui permettront ensuite d’autres investigations de la part d’équipes extérieures.


I.1. Objectifs et hypothèses scientifiques
• Objectif 1 : structurer et mettre à disposition de la communauté scientifique un vaste corpus d’écrits d’élèves et d’étudiants
Les équipes du projet ont déjà recueilli un matériau considérable rassemblé en deux types de corpus :
– Productions écologiques : Ecriscol, Clesthia (David, Doquet 2016) = 1390 écrits et leurs brouillons, du primaire au baccalauréat, en cours d’annotation et balisage XML TEI ; Littératie avancée, Lidilem (Jacques, Rinck 2017) = 330 écrits d’étudiants, en ligne, balisage XML TEI.
– Productions suscitées par la recherche : Scoledit, Lidilem (Wolfarth et al. 2016) = longitudinal CP-CM2, 3365 écrits, balisage XML ; Resolco, CLLE (Garcia-Debanc, Bras 2016) = 400 écrits, de l’école à l’université, consigne de résolution de problèmes de cohérence/cohésion.
L’enjeu est de poursuivre l’harmonisation des traitements entamée en 2014 pour diffuser un corpus enrichi.
• Objectif 2 : caractériser les écrits d’élèves et d’étudiants et les attentes des enseignants du point de vue de l’acquisition de l’orthographe et de la cohérence, dans des analyses sociologiquement contextualisées.
L’orthographe et la cohérence sont des points nodaux résistant à l’acquisition et privilégiés lors de l’évaluation des copies par les enseignants. La méthodologie commune d’analyse permettra d’étudier ce qui est maitrisé vs ce qui reste à acquérir aux différents niveaux de l’apprentissage, ainsi que les écarts interindividuels sur : (1) la morphosyntaxe écrite, (2) la cohérence et la cohésion textuelles. Le croisement des résultats permettra de caractériser l’évolution des compétences orthographiques, textuelles et discursives des rédacteurs des textes, selon les contextes (sociologique, didactique et pédagogique) de production.
• Objectif 3 : étudier les modalités de l’écriture dans les avant-textes (plans, notes, brouillons) et les textes, notamment à travers l’influence réciproque des écrits remis et des interventions des enseignants
La comparaison de différentes versions d’un même texte permettra d’observer :
– les interventions des correcteurs, classées selon les composantes linguistiques concernées et la forme qu’elles prennent (soulignement, commentaires, etc.) ;
– les opérations de modification des textes, considérées selon leur degré d’aboutissement, leur place dans la chronologie de l’écriture et leur articulation à des interventions des enseignants.
En croisant les informations sur les performances des élèves et les réécritures suscitées ou non par les interventions des enseignants, cette analyse alimentera la formation à une didactique de la réécriture.
• Hypothèses :

I. Contexte, positionnement et objectif(s) de la proposition
Les enquêtes PISA (OCDE 2016) montrent depuis dix ans la particularité de la France concernant le poids de l’origine sociale sur les inégalités entre élèves (cf. également CNESCO 2016) ; elles montrent également le faible niveau des élèves dans des tâches d’écriture complexes, à un moment où les attendus de la maitrise de l’écrit littératié dans les apprentissages prend de plus en plus d’importance. Pourtant la production écrite est pointée par de récentes enquêtes comme trop peu travaillée à l’école et au collège (Claus et al. 2013 ; Goigoux et al. 2016) et la réalité des performances à l’écrit des élèves et des étudiants est encore approximativement cernée, faute de données exploitables et disponibles à tous les niveaux de la scolarité. Notre projet vise à décrire avec précision, grâce à des outils d’analyse textuelle, (1) ces performances tout au long de la scolarité et jusqu’au Master, et (2) les attentes des enseignants en termes de normes linguistiques et langagières, en vue de soutenir la formation professionnelle des enseignants sur l’accompagnement et l’évaluation des écrits. Ce projet s’appuie sur et inclut la publication en open access d’un vaste corpus de référence d’écrits d’apprenants assorti de métadonnées contextuelles et d’outils de traitement qui permettront ensuite d’autres investigations de la part d’équipes extérieures.
I.1. Objectifs et hypothèses scientifiques
• Objectif 1 : structurer et mettre à disposition de la communauté scientifique un vaste corpus d’écrits d’élèves et d’étudiants
Les équipes du projet ont déjà recueilli un matériau considérable rassemblé en deux types de corpus :
– Productions écologiques : Ecriscol, Clesthia (David, Doquet 2016) = 1390 écrits et leurs brouillons, du primaire au baccalauréat, en cours d’annotation et balisage XML TEI ; Littératie avancée, Lidilem (Jacques, Rinck 2017) = 330 écrits d’étudiants, en ligne, balisage XML TEI.
– Productions suscitées par la recherche : Scoledit, Lidilem (Wolfarth et al. 2016) = longitudinal CP-CM2, 3365 écrits, balisage XML ; Resolco, CLLE (Garcia-Debanc, Bras 2016) = 400 écrits, de l’école à l’université, consigne de résolution de problèmes de cohérence/cohésion.
L’enjeu est de poursuivre l’harmonisation des traitements entamée en 2014 pour diffuser un corpus enrichi.
• Objectif 2 : caractériser les écrits d’élèves et d’étudiants et les attentes des enseignants du point de vue de l’acquisition de l’orthographe et de la cohérence, dans des analyses sociologiquement contextualisées.
L’orthographe et la cohérence sont des points nodaux résistant à l’acquisition et privilégiés lors de l’évaluation des copies par les enseignants. La méthodologie commune d’analyse permettra d’étudier ce qui est maitrisé vs ce qui reste à acquérir aux différents niveaux de l’apprentissage, ainsi que les écarts interindividuels sur : (1) la morphosyntaxe écrite, (2) la cohérence et la cohésion textuelles. Le croisement des résultats permettra de caractériser l’évolution des compétences orthographiques, textuelles et discursives des rédacteurs des textes, selon les contextes (sociologique, didactique et pédagogique) de production.
• Objectif 3 : étudier les modalités de l’écriture dans les avant-textes (plans, notes, brouillons) et les textes, notamment à travers l’influence réciproque des écrits remis et des interventions des enseignants
La comparaison de différentes versions d’un même texte permettra d’observer :
– les interventions des correcteurs, classées selon les composantes linguistiques concernées et la forme qu’elles prennent (soulignement, commentaires, etc.) ;
– les opérations de modification des textes, considérées selon leur degré d’aboutissement, leur place dans la chronologie de l’écriture et leur articulation à des interventions des enseignants.
En croisant les informations sur les performances des élèves et les réécritures suscitées ou non par les interventions des enseignants, cette analyse alimentera la formation à une didactique de la réécriture.
• Hypothèses :

I. Contexte, positionnement et objectif(s) de la proposition
Les enquêtes PISA (OCDE 2016) montrent depuis dix ans la particularité de la France concernant le poids de l’origine sociale sur les inégalités entre élèves (cf. également CNESCO 2016) ; elles montrent également le faible niveau des élèves dans des tâches d’écriture complexes, à un moment où les attendus de la maitrise de l’écrit littératié dans les apprentissages prend de plus en plus d’importance. Pourtant la production écrite est pointée par de récentes enquêtes comme trop peu travaillée à l’école et au collège (Claus et al. 2013 ; Goigoux et al. 2016) et la réalité des performances à l’écrit des élèves et des étudiants est encore approximativement cernée, faute de données exploitables et disponibles à tous les niveaux de la scolarité. Notre projet vise à décrire avec précision, grâce à des outils d’analyse textuelle, (1) ces performances tout au long de la scolarité et jusqu’au Master, et (2) les attentes des enseignants en termes de normes linguistiques et langagières, en vue de soutenir la formation professionnelle des enseignants sur l’accompagnement et l’évaluation des écrits. Ce projet s’appuie sur et inclut la publication en open access d’un vaste corpus de référence d’écrits d’apprenants assorti de métadonnées contextuelles et d’outils de traitement qui permettront ensuite d’autres investigations de la part d’équipes extérieures.
I.1. Objectifs et hypothèses scientifiques
• Objectif 1 : structurer et mettre à disposition de la communauté scientifique un vaste corpus d’écrits d’élèves et d’étudiants
Les équipes du projet ont déjà recueilli un matériau considérable rassemblé en deux types de corpus :
– Productions écologiques : Ecriscol, Clesthia (David, Doquet 2016) = 1390 écrits et leurs brouillons, du primaire au baccalauréat, en cours d’annotation et balisage XML TEI ; Littératie avancée, Lidilem (Jacques, Rinck 2017) = 330 écrits d’étudiants, en ligne, balisage XML TEI.
– Productions suscitées par la recherche : Scoledit, Lidilem (Wolfarth et al. 2016) = longitudinal CP-CM2, 3365 écrits, balisage XML ; Resolco, CLLE (Garcia-Debanc, Bras 2016) = 400 écrits, de l’école à l’université, consigne de résolution de problèmes de cohérence/cohésion.
L’enjeu est de poursuivre l’harmonisation des traitements entamée en 2014 pour diffuser un corpus enrichi.
• Objectif 2 : caractériser les écrits d’élèves et d’étudiants et les attentes des enseignants du point de vue de l’acquisition de l’orthographe et de la cohérence, dans des analyses sociologiquement contextualisées.
L’orthographe et la cohérence sont des points nodaux résistant à l’acquisition et privilégiés lors de l’évaluation des copies par les enseignants. La méthodologie commune d’analyse permettra d’étudier ce qui est maitrisé vs ce qui reste à acquérir aux différents niveaux de l’apprentissage, ainsi que les écarts interindividuels sur : (1) la morphosyntaxe écrite, (2) la cohérence et la cohésion textuelles. Le croisement des résultats permettra de caractériser l’évolution des compétences orthographiques, textuelles et discursives des rédacteurs des textes, selon les contextes (sociologique, didactique et pédagogique) de production.
• Objectif 3 : étudier les modalités de l’écriture dans les avant-textes (plans, notes, brouillons) et les textes, notamment à travers l’influence réciproque des écrits remis et des interventions des enseignants
La comparaison de différentes versions d’un même texte permettra d’observer :
– les interventions des correcteurs, classées selon les composantes linguistiques concernées et la forme qu’elles prennent (soulignement, commentaires, etc.) ;
– les opérations de modification des textes, considérées selon leur degré d’aboutissement, leur place dans la chronologie de l’écriture et leur articulation à des interventions des enseignants.
En croisant les informations sur les performances des élèves et les réécritures suscitées ou non par les interventions des enseignants, cette analyse alimentera la formation à une didactique de la réécriture.
• Hypothèses :

  1. La langue écrite des élèves et des étudiants peut être décrite comme intégrant les normes et les procédés scripturaux de différents niveaux : orthographe, morphosyntaxe, cohésion/cohérence et textualité.
  2. Les ratures, en tant qu’indicateurs du travail des scripteurs sur leur texte en cours d’écriture, permettent de repérer des éléments propices à un enseignement efficient.
  3. Les variations dans les performances sont liées aux variations des contextes sociaux, didactiques et pédagogiques (rapports à l’écriture, usages de l’écrit scolaire, variations interindividuelles).