Le projet PASTEL (pour Performing Automatic Speech Transcription for Enhanced Learning) est un projet financé par l’Agence Nationale pour la Rercherche ayant pour objectif d’explorer le potentiel de la transcription automatique en temps réel pour l’instrumentation de situations pédagogiques se déroulant en situation présentielle ou à distance, synchrones ou asynchrones. Ce potentiel est exploré par la création et l’évaluation d’outils novateurs permettant notamment une transcription fidèle et sans latence du discours de l’enseignant. Deux situations types sont au cœur du projet : l’une centrée sur les cours magistraux et l’autre sur le travail collaboratif mené dans le cadre de travaux dirigés ou de travaux pratiques. Outre ces deux situations, le but est de proposer un panel d’outils qui puisse assister les enseignants et les apprenants au cours des différents stades du module d’enseignement : depuis la préparation des cours par l’enseignant jusqu’à la révision pour les étudiants.
Sur la base de transcriptions automatiques, réalisées en temps réel avec une latence faible, et comportant un nombre limité d’erreurs, il est possible de développer des outils pour faciliter les échanges entre les apprenants ou entre tuteurs et apprenants. Ces derniers peuvent par exemple assister à la prise de notes individuelle et collaborative, la rédaction de compte-rendu, ou pour la délimitation de zones particulièrement intéressantes du discours pouvant être gérées par le tuteur en direct ou a posteriori : zones traitant de notions mal comprises, demandes d’approfondissement ou d’exemple, etc. D’autres fonctionnalités sont explorées en se basant notamment sur des outils de segmentation thématique d’énoncés, d’analyse d’actes du langage, d’analyse sémantique pour la recommandation de contenu pédagogique connexe. Ces outils seront utilisés pour enrichir la transcription et rendre compte le mieux possible du déroulement du cours en obtenant des enregistrements étiquetés dans lequel il sera facile de retrouver du contenu. Ces enregistrements pourront être diffusés pour servir à la révision, mais également être utilisés par l’enseignant comme contenu pour la conception de cours en ligne. Outre ceux basés sur le traitement automatique des langues, d’autres outils seront réalisés afin de pouvoir collecter et exploiter les traces d’utilisation du dispositif. Ils permettront de rendre compte de manière synthétique de situations complexes d’enseignement. Ils aideront l’apprenant à évaluer son propre apprentissage, et permettront à l’enseignant d’obtenir un retour sur l’activité de l’ensemble des apprenants, qui est moins facile à évaluer en ligne que dans un cadre de cours classique.
Tous les documents produits, les contenus rassemblés et les bilans d’activité pourront être ré-exploités par l’enseignant pour préparer la prochaine itération du cours. Le matériel pédagogique produit pourra être exploité afin de faciliter l’adaptation d’un cours présentiel en cours en ligne. Cette réutilisation permettra d’automatiser en partie un processus de création de cours aujourd’hui coûteux en temps. Cette chaîne d’instruments est destinée à un vaste public et son usage ne nécessitera pas un temps d’apprentissage long. Obtenir des outils utilisables rapidement pour dispenser modules de cours pré-existants est l’un des buts du projet. Afin d’obtenir le plus rapidement la transcription la plus fidèle possible quelle que soit la spécificité du thème du cours, l’enseignant sera invité à fournir ses ressources préparatoires pour entraîner le modèle de langage sur lequel repose le dispositif de transcription.
La conception des outils est guidée par une analyse des besoins et des usages pré-existants auprès d’utilisateurs-cible du dispositif, à savoir les enseignants et apprenants de l’enseignement supérieur. Au cours de la démarche de conception du projet, le système est expérimenté en situation réelle d’enseignement à distance, lors de cours magistraux et travaux de groupes. Ces expériences permettent d’évaluer son utilisabilité, de le confronter à un nombre conséquent d’utilisateurs, ainsi que de recueillir de véritables traces d’utilisation. Ces informations alimenteront la démarche de conception itérative du système.