Exploration libre du corpus E-CALM

Le corpus E-CALM est constitué de quatre sous-corpus qui ont chacun leur spécificité liée au laboratoire de recherche qui l’a constituée. La plateforme proposée sur ce site donne accès à une version simplifiée de ces outils.

Une version complète de la ressource E-Calm est également disponible au téléchargement via la plateforme Ortolang : https://www.ortolang.fr/market/corpora/e-calm. Plusieurs format sont proposés, dont un format permettant l’exploration de la ressource avec l’outil TXM.

Pour accéder aux versions complètes des ressources constitutives de la ressource E-CALM, vous pouvez utiliser les liens ci-dessous.



Corpus Scoledit

Le corpus Scoledit propose une visualisation de productions d’enfants de l’école primaire (CP-CM2) recueillies auprès d’élèves des académies de Toulouse, Bordeaux, Lyon, Clermont-Ferrand et Grenoble selon les mêmes consignes d’écriture. La particularité du corpus SCOLEDIT est qu’il est longitudinal, c’est-à-dire que ces productions ont été récoltées auprès des mêmes élèves tout au long de leur scolarité en primaire; il permet ainsi de voir l’évolution des compétences d’écriture de chaque individu.

Corpus ECRISCOL

Le corpus ECRISCOL permet de visualiser une grande diversité de productions recueillies auprès d’élèves de niveaux allant du CE1 à l’université (première année de Licence et de BTS) selon des consignes diverses. La particularité du corpus ECRISCOL est qu’il a été constitué pour étudier la génétique textuelle, c’est-à-dire les processus de réécriture d’un texte avec ou sans intervention de l’enseignant. La page du corpus permet de visualiser les différentes étapes de ce processus.

Corpus RésolCo

Le corpus RésolCo permet de visualiser et de rechercher dans un ensemble de productions recueillies auprès d’élèves de primaire (CE2, CM1, CM2), collège (tous les niveaux) et université (2e année de Master). La particularité du corpus RésolCo réside dans le fait que les textes produits répondent tous à une même consigne d’écriture. Celle-ci a été conçue comme une tâche-problème imposant aux élèves la résolution de problèmes de cohésion textuelle. La page du corpus permet de sélectionner des textes selon leur niveau, selon le nombre de rature et d’erreurs d’orthographe ou encore en cherchant des chaînes de caractères dans les versions originales ou corrigées orthographiquement. Elle permet également une visualisation faisant apparaître les expressions utilisées par les élèves pour faire référence aux personnages principaux de leur texte.

Corpus Littéracie avancée

Le corpus Littéracie Avancée recense des productions universitaires d’étudiants de niveaux allant de la licence première année au master 2ème année, dans le domaine des sciences du langage, de la didactique du français, des sciences de l’éducation et de la formation des enseignants de français. Ce corpus rassemble un grande diversité de productions : mémoires, fiches de lecture, lettres de motivation, comptes-rendus. Contrairement aux autres corpus dont les productions sont manuscrites, les productions de ce corpus sont tapuscrites.