II. Organisation du projet et moyens mis en œuvre

II.1. Coordinateur scientifique
Claire Doquet est professeure en Sciences du Langage à la Sorbonne Nouvelle, responsable de l’axe Linguistique de l’écrit du laboratoire Clesthia et, au sein de cet axe, co-responsable avec Serge Fleury de l’opération de recherche Ecriscol. Impliquée à 75% dans le projet, elle se centrera avant tout sur la coordination, tâche essentielle et complexe du fait de l’importance de l’équipe et du nombre de partenaires. Elle participera aux autre tâches en particulier pour ce qui concerne la dimension génétique de l’analyse (brouillons et textes, rôle des interventions des enseignants dans la réécriture).


II.2. Consortium
Les équipes impliquées dans le projet E-CALM travaillent toutes sur l’écriture scolaire, à partir de points de vue et avec des approches théoriques et technologiques complémentaires. Tous les partenaires sont partie-prenante de la formation initiale et/ou continue des enseignants ainsi que de la formation de l’encadrement intermédiaire des enseignants (les différents corps d’inspection). Tous les partenaires ont une expérience de la constitution et de la mise à disposition de corpus, les trois équipes de Sciences du Langage participent au Consortium CORLI porté par l’Institut de la Langue Française, Fédération de Recherche du CNRS, FR 2393.
• Clesthia : Outre son expertise dans le domaine de la constitution de corpus, avec le Corpus du Français Parlé Parisien (http://cfpp2000.univ-paris3.fr), le projet FRACOV (http://www.univ-paris3.fr/fracov-227156.kjsp) et le corpus Oral représenté en constitution (http://www.univ-paris3.fr/operation-1-oral-represente–316241.kjsp), le laboratoire Clesthia a acquis une expérience dans le domaine du traitement des écrits d’élèves, à travers la constitution, entamée depuis 3 ans, du corpus écologique Ecriscol (http://www.univ-paris3.fr/ecriscol-300509.kjsp), qui est aujourd’hui le seul conçu pour rendre accessibles automatiquement les opérations scripturales (ajouts, suppressions, etc.). E-CALM s’inscrit dans la continuité des travaux de différents chercheurs du laboratoire : C. Doquet a réalisé la première étude génétique d’écriture scolaire en temps réel (capture avec un logiciel de traitement de texte dédié (Doquet-Lacoste 2004), J. David est un spécialiste de l’acquisition de l’orthographe (David 2007 ; David, Morin, 2013 ; David, Doquet, 2016), J.L. Pilorgé travaille sur l’évaluation des écrits des élèves (Pilorgé 2010), O. Lumbroso (DILTEC EA2288) poursuit des recherches sur la transposition didactique de l’écriture « à programme » repérée chez Zola (Lumbroso 2007). Clesthia a organisé le 18 mars 2015 la première journée d’études consacrée aux corpus d’écrits d’élèves rassemblant 5 laboratoires de linguistique et didactique, prélude à la constitution d’un réseau de recherche national. Ce réseau est aujourd’hui en cours de constitution et les travaux de cette journée ont donné lieu à un numéro de la revue Corpus (David, Doquet, Fleury 2017).
Sur le plan technologique, l’équipe Clesthia travaille depuis de nombreuses années une approche quantitative des textes, qui a conduit au développement de plusieurs logiciels comme Lexico3 et à de nombreux partenariats dans des projets de linguistique outillée. Plus récemment le logiciel Le Trameur, outil d’exploration de treebank créé par S. Fleury (http://www.tal.univ-paris3.fr/trameur/) permet de réaliser des traitements quantitatifs sur des ressources textuelles multilingues et richement annotées, y compris des corpus alignés (Fleury, Zimina 2007 ; Fleury, Zimina 2014 ; Zimina, Fleury 2015). La spécificité des écrits d’élèves et la volonté de permettre une approche génétique de l’écriture a conduit à aménager la transcription diplomatique des manuscrits (Doquet, Enoiu, Fleury, Mazziotti, 2017), à élaborer un système d’annotation spécifique adapté et à aménager le logiciel Trameur pour le traitement des fichiers obtenus.
Clesthia participe au consortium CORpus Langues, Interactions (Huma Num) et a porté le projet ANR Écritures (http://www.univ-paris3.fr/anr-ecritures-96530.kjsp) consacré à l’analyse des brouillons d’écrits professionnels avec une approche génétique, discursive et textométrique (Lardilleux, Fleury, Cislaru 2013 ; Doquet, Poudat 2015). Le groupe Ecriscol porte aujourd’hui le projet Émergence de perspectives genrées dans des écrits d’enfants et d’adolescents financé par le GIS Institut du Genre.
• Circeft-Escol : Circeft-Escol dès sa création en 1987 a travaillé à la compréhension des inégalités sociales de réussite scolaire et plus particulièrement au rôle du langage et de l’écrit dans ces inégalités, aux différents niveaux de leur réalisation, en analysant les effets différenciateurs de la littératie scolaire. L’équipe a conduit de nombreuses actions de recherche portant sur les analyses de copies d’élèves à différents niveaux de la scolarité (Bautier 1997 ; Bautier, Rochex 1997 ; 1998), sur les écrits de l’évaluation internationale PISA (Bautier, Crinon, Rayou, Rochex 2006 ; Bautier, Rayou 2009, 2013) ou encore les écrits d’élèves raccrocheurs dans le cadre d’une convention avec l’Institut Français d’Éducation et le Commissariat général à l’égalité des territoires (rapport sous la direction de D. Glasman, P. Rayou, IFE 2016). C. Delarue-Breton a plus particulièrement étudié le rôle de l’écriture scientifique dans l’appropriation des savoirs par les étudiants de master, à partir de leurs écrits de travail et des différentes versions du mémoire (Delarue-Breton 2014b, 2016a, 2017 ; Delarue-Breton, Dolignier 2016). B. Lavieu-Gowzdz s’intéresse aux travaux d’élèves et d’étudiants dans le domaine de l’étude de la langue (Lavieu-Gwozdz 2013 ; Lavieu, Pagnier 2017) et P. Richard-Principalli à l’écriture de texte dans différents genres par des enfants d’âge primaire (Richard-Principalli, Ferone, Crinon 2012), ou sous forme de textes de savoir à partir d’un support numérique (Richard-Principalli, Ferone, Crinon 2017). E. Vinel a travaillé sur la co-construction de récits oraux par des adultes (parents ou enseignants) et des enfants et la variation des usages des expressions référentielles dans ces discours suivant différents facteurs : genre de discours, support choisi, contexte d’énonciation (Vinel 2014). De plus, E. Bautier est responsable d’un axe de recherche du groupe de recherche interuniversitaire Reseida qui étudie dans les cahiers d’élèves de 6ème de collège la relation entre les traces écrites, les opérations de pensées ainsi sollicitées et les contextes sociaux des établissements. Depuis janvier 2017, l’ensemble des participants de l’équipe Circeft-Escol au projet ANR, participe à un projet d’investissement et d’avenir, TAO, qui vise à comparer un dispositif numérique « Twictée » d’apprentissage de l’orthographe avec des dispositifs plus traditionnels en vue de comprendre l’impact de l’utilisation de ce dispositif sur l’apprentissage de l’orthographe d’élèves de cycle 3.
• CLLE-ERSS est une des deux composantes de l’UMR 5263, CLLE (Cognition, Langue, Langages, Ergonomie) dont les activités couvrent de nombreux domaines de l’analyse linguistique (phonologie, morphologie, syntaxe, sémantique, discours) et intègrent une forte dimension interdisciplinaire (didactique des langues, traitement automatique des langues, psycholinguistique). Depuis sa création, CLLE-ERSS développe une approche quantitative de la linguistique, à travers la constitution et l’exploitation de grands corpus langagiers, écrits ou oraux. L’activité de CLLE-ERSS s’organise autour de quatre axes, dont trois sont représentés par les membres du projet: l’axe S’caladis (Structures Sémantiques : des catégories lexicales au discours, resp. A. Le Draoulec et J. Rebeyrolle) qui s’intéresse aux structures du sens dans la langue et à leurs processus de construction; l’axe DidAPs (Didactique, Acquisition, Psycholinguistique, resp. K. Duvignau et C. Garcia-Debanc) qui mène des études sur l’acquisition et l’enseignement du français; et l’axe CARTEL (Corpus, Applications et Ressources pour le Traitement et l’Étude du Langage, resp. N. Hatout) dont les travaux portent sur le développement, l’adaptation et l’utilisation de ressources informatiques pour l’étude du langage. Avec le projet E-CALM, la collaboration entre S’caladis et CARTEL, qui a abouti à la constitution de la ressource ANNODIS (Asher et al. 2017 ; Ho-Dac, Péry-Woodley 2014 ; Péry-Woodley et al. 2011), va se poursuivre en s’ouvrant au nouveau type de données que constituent les textes d’élèves. La mise commun des spécificités de tous les membres impliqués dans le projet E-CALM permettra de bénéficier d’expériences à la fois en termes de constitution et d’analyse d’une ressource annotée au niveau discursif (Ho-Dac et al. 2012, Péry-Woodley et al. 2017 ; Atallah et al. 2016), d’analyse de la composante discursive des textes d’élèves (Garcia-Debanc et al. 2017 ; Garcia-Debanc, Bras 2016), d’élaboration de modélisations linguistiques et psycholinguistiques ainsi que de diffusion des travaux de recherche à divers milieux professionnels, notamment auprès des enseignants, de l’école maternelle à l’université (Beucher-Marsal, Garcia-Debanc 2014 ; Auriac et al. 2013).
CLLE-ERSS participe au Consortium CORLI et au projet COST TextLink visant le partage et l’interopérabilité des ressources linguistiques pour l’étude du niveau discursif. Il a participé au projet ORFEO aboutissant à la mis à disposition d’une plateforme d’interrogation de corpus oraux et écrits et a organisé en juin 2015 une journée d’étude sur le sujet, intitulée « Méthodes d’analyse et de traitement des textes d’élèves : enjeux scientifiques et ressources pour la formation ».
• Le Lidilem possède une expertise reconnue en matière de constitution de corpus, de description linguistique et de recherches en didactique. Ses travaux portent sur différents niveaux de description – interface sémantique-syntaxe, pragmatique, acquisition du langage, compétences en littératie, etc. – et sur différents publics – locuteurs « tout-venant », scientifiques, élèves de tous niveaux scolaires, étudiants, etc. Il mène aussi des recherches en TAL, ce qui engendre au sein du laboratoire des collaborations fructueuses (par ex. TAL et didactique, TAL et lexicologie). Le Lidilem a porté divers projets ANR dans cette veine : Scientext 2006 (Tutin, Grossmann 2014) pour la mise à disposition d’un grand corpus d’écrits scientifiques, Emolex 2009 (responsables Novakova et Blumenthal) pour des études sur le lexique des émotions… Il a également participé au projet IDILL (Integrated Digital Language Learning) dans le cadre du réseau d’excellence européen Kaleidoscope (Granger, Kraif, Ponton, Antoniadis, Zampa 2007).
Les préoccupations didactiques du Lidilem englobent la littératie au sens large, avec des travaux sur l’entrée dans l’écrit, le rapport à l’écriture, les compétences scripturales au primaire et au secondaire (Barré de Miniac 2003), ainsi que sur la compétence orthographique, son enseignement et son développement (Brissaud, Chevrot, Lefrançois 2006 ; Brissaud, Chevrot 2011 ; Brissaud, Cogis 2011). La recherche s’articule à des démarches concrètes pour la formation : élaboration de tests de positionnement en français écrit (projet porté par l’Université Paris Ouest Nanterre et financé par Université Ouverte des Humanités), synthèse des apports du laboratoire sur les écrits universitaires (Boch, Frier 2015).
Le Lidilem élabore des corpus cohérents avec ces recherches : Littéracie avancée (financements Corpus Écrits de la TGIR HumaNum et Equipex ORTOLANG pour la finalisation de corpus – responsables Rinck et Jacques), Scoledit (responsables Brissaud, Ponton, Totereau), qui s’inscrit dans la continuité du projet Lire-Ecrire au CP (2012-2015, financé par IFÉ et DGESCO) et poursuit un objectif d’édition d’un large corpus longitudinal d’écrits scolaires du primaire (du CP au CM2), assistée par des méthodes issues du TAL (Wolfarth, Ponton, Totereau 2016). Le Lidilem est aussi le partenaire Recherche de projets financés par l’Institut Carnot de l’Éducation et collabore à ce titre avec des établissements et des cadres de l’Éducation Nationale. Il participe en outre au projet E-Fran « Twictées » avec Circeft, partenaire du consortium actuel.

II.3. Moyens mis en œuvre pour atteindre les objectifs
Hormis la tâche de coordination qui court sur l’ensemble du projet (tâche 0), le découpage en tâches et la répartition des chercheurs entre les tâches reflètent le fonctionnement très intégré des interrogations. À partir des trois objectifs énoncés plus haut, qui nous permettront de contribuer à l’étayage empirique de la didactique de l’écriture, les tâches sont en interaction les unes avec les autres, chacune se concentrant :
(1) sur un des volets transversaux aux objectifs (tâches 2, 4, 5) : domaine d’investigation : orthographe / textualité ; objets étudiés : interventions des enseignants / textes finaux / avant-textes
(2) sur les aspects technologiques en lien avec ces investigations (tâches 1, 3).