II.3.0 Tâche 0- Coordination

Responsable : C. Doquet (Clesthia)
Partenaires : CIRCEFT (E. Vinel), CLLE (L.-M. Ho-Dac), LIDILEM (M.-P. Jacques)
Période : toute la durée du projet [mois 0-42]
Livrable : rapport intermédiaire et rapport final de la recherche.
Programme détaillé des travaux :
• T. 0-1: Supervision organisationnelle : avancée du projet, planning des tâches, respect du budget.
– Mise en relation des différents groupes de travail pour optimiser la coopération et la circulation de l’information : en particulier, les informations internes aux groupes (T. 0.4).
– Préparation du passage d’une tâche à l’autre, en particulier pour les éléments d’interaction étroite comme les annotations linguistiques et discursives.
– Dispositions pour le respect du calendrier et du budget.


• T. 0-2: Supervision scientifique : veiller à la cohérence méthodologique et théorique des tâches et de l’articulation entre tâches.
– Prise de connaissance régulière des travaux des groupes.
– Information systématique sur les communications et articles des autres membres du projet.
– Veille scientifique sur les thématiques du projet : repérage des publications et travaux d’autres groupes de recherche autour des écrits d’apprenants.
La coordinatrice prendra en charge les bilans intermédiaires à remettre à l’ANR en cours de projet ainsi que le bilan final. L’écriture de ces documents se fera en lien avec les responsables des tâches et les rapports qu’ils fourniront régulièrement. Chaque responsable de tâche prendra en charge son organisation en conformité avec les objectifs spécifiés dans le projet. Les responsables de tâches fourniront à la coordinatrice un bref rapport récapitulatif des avancements à chaque étape de la tâche et l’informeront des éventuelles solutions de repli mises en place.

• T. 0-3: Organisation des différentes réunions et ateliers de travail
Le socle du travail commun sera réalisé lors de séminaires organisés chaque année, en présentiel (voir diagramme) :
– année 1 : 1 réunion de 2 journées, 1 réunion d’1 journée ;
– années 2 et 3 : 1 réunion de 2 journées chaque année (une réunion à Toulouse, une à Grenoble) ;
– année 4 : 1 réunion de 2 journées pour la clôture du projet.
Des réunions en visio-conférences viendront, chaque année, compléter ces rencontres :
– une réunion de l’ensemble des participants au projet ;
– deux réunions des responsables de chaque équipe seront programmées chaque semestre, pour s’assurer de l’avancée des travaux dans les trois équipes.

• T. 0-4 : Organisation de la communication du projet à l’intérieur du groupe de recherche :
– Actualisation de l’espace réservé du site Web (cf. tâche 7) :
– compte-rendu périodique des activités, tâche par tâche ;
– mise à disposition et actualisation des documents et résultats intermédiaires, chat interne.
– Veille scientifique sur les thématiques du projet : appels à communication et articles.

• T. 0-5 : Supervision des opérations de valorisation scientifique au cours du projet :
– Veille sur les appels à communication ou articles.
– Organisation de la proposition de symposiums dans des colloques internationaux.
– Organisation des opérations de valorisation du travail :
– Une journée d’études à mi-parcours (entre mars et juin 2018).
– Un colloque de fin de projet, organisé en partenariat avec un autre laboratoire travaillant sur des écrits non standards (par exemple le laboratoire Praxiling à Montpellier).
Pour l’ensemble de cette tâche, la coordinatrice scientifique sera aidée par un project manager.

II.3.1 Tâche 1 – Structuration d’un corpus cohérent et significatif
Responsable : C. Ponton (Lidilem)
Partenaires : le collectif
Période : mois 0-18
Livrable : le corpus au format XML TEI intégralement transcrit et assorti de métadonnées.
Objectif : constituer un corpus de référence de l’écriture scolaire à partir d’une sélection parmi les corpus existant au sein de chaque équipe, complétée de recueils supplémentaires. Le corpus final contiendra des écrits du primaire à l’université (du cours préparatoire au master) avec les métadonnées contextuelles et prendra en compte la variété des contextes sociaux et des cursus.
Programme détaillé des travaux :
• T. 1-1 Constitution du « corpus brut ». [mois 0-18]
Les différentes équipes disposent actuellement de corpus déjà constitués sous des formes diverses (cf. tableau récapitulatif en annexe). En fonction des objectifs linguistiques et didactiques du projet, cette sous-tâche aura pour mission d’opérer une sélection dans cet ensemble de données et d’en constituer une version numérique dans le format commun défini dans les sous-tâches 3 et 5. Ceci nécessitera notamment :
– la sélection des corpus et constitution de corpus complémentaires,
– la transcription des corpus non encore transcrits,
– la transposition des corpus ne respectant pas le format commun,
– la gestion des droits (la nature du corpus et l’objectif final de diffusion nous imposent une charte éthique très stricte ; si ce n’est déjà fait, les données recueillies seront anonymisées et soumises à une autorisation préalable de diffusion),
– l’annotation des interventions des enseignants


• T. 1-2 Déterminer et réaliser la collecte complémentaire. [mois 0-18]
Même si les corpus déjà existants peuvent répondre aux objectifs du projet, il sera toutefois nécessaire d’opérer quelques compléments de collecte. En effet, les études proposées dans les différentes tâches du projet nécessitent des compléments (manques de données au niveau du collège et du lycée, manque de textes narratifs dans le supérieur) et d’apport en données contextuelles (pour le collège et le lycée).


• T. 1-3 Définir les métadonnées pertinentes (indices contextuels didactiques et sociologiques) et compléter les métadonnées déjà existantes. [mois 0-6]
Les corpus déjà construits dans les équipes disposent d’un ensemble de de métadonnées décrivant le contexte de recueil des productions ainsi que de données décrivant les élèves, les enseignants, la classe… Ces données sont spécifiques aux utilisations prévues pour chaque sous-corpus. Il s’agira dans cette sous-tâche, à partir de l’existant, de définir une description commune au corpus final du projet. Une collaboration initiée depuis 2016 entre les équipes Circeft et Clesthia a permis de réaliser simultanément des collectes d’écrits et de métadonnées très précises, par le biais d’observations des classes et d’entretiens avec les élèves et les enseignants. Ce matériau va être analysé et il en sera extrait les corrélations les plus significatives entre qualité textuelle et variables contextuelles, de sorte que pour des recueils de plus grande ampleur, pour lesquels il n’est pas possible de réaliser des entretiens, puissent être élaborés des questionnaires à destinations (1) des élèves et (2) des enseignants qui permettront de recueillir plus rapidement les métadonnées les plus pertinentes.


• T. 1-4 Définir la procédure de transcription. [mois 0-6]
La transcription est l’étape (manuelle pour nous) qui permet de passer de la copie papier à une version numérique. Elle impose un certain nombre de choix interprétatifs sur ce qui doit être transcrit et comment. Plusieurs membres du projet ont déjà eu une réflexion commune sur cette étape et un embryon de procédure commune existe. Toutefois, il conviendra ici d’affiner cette procédure et, surtout, d’homogénéiser l’ensemble des corpus qui alimenteront le corpus commun. Par exemple, pour répondre aux objectifs de la tâche 4, il conviendra de faire apparaitre tout ce qui se voit sur la copie (matériau linguistique, spatialité, soulignements, différences de scripteurs, etc.).


• T. 1-5 Proposer un schéma d’encodage des corpus scolaires à la norme TEI. [mois 7-10]
Afin de partager largement le corpus constitué lors de ce projet sur la plateforme Ortolang (cf. tâche 2), nous proposerons, en fonction des réflexions de T. 1-3 et T. 1-4, un schéma d’encodage de notre corpus (extensible à d’autres corpus du même type) répondant aux recommandations XML TEI.