Lots

Lot 0 : Pilotage du projet et dissémination

Lot 1 : Analyse des besoins et des usages et validation

Les conditions de réussite du projet reposent sur l’identification des besoins et des usages des utilisateurs et sur l’évaluation des différents prototypes proposés et la bonne prise en compte de ces résultats dans chaque nouvelle version de prototypes expérimentée. L’objectif de ce lot est ainsi de préparer des scénarios pour les situations pédagogiques identifiées et d’analyser les conditions de réussite de ces scénarios. Il s’agit d’identifier les différents éléments les constituant et leur articulation (identifier les acteurs représentatifs, leur rôle et fonctions, les activités, ressources, outils, …), de proposer et analyser des pistes d’intégration des scénarios dans les prototypes.

Tâches :

  • Analyse des besoins
  • Expérimentation et tests utilisateurs
  • Analyse des usages

Lot 2 : Traitement automatique de la parole

Dans le cadre applicatif du projet PASTEL, les technologies de reconnaissance de la parole seront sollicitées pour traiter des discours très spécialisés, puisque liés à des enseignements spécifiques, mais aussi très divers : le système de reconnaissance de la parole devra être capable de transcrire avec une qualité similaire des cours magistraux de disciplines variées dispensés par des enseignants différents. Ce lot vise à optimiser les performances de la reconnaissance automatique de la parole dans les deux principaux cas d’usage visés par le projet : la reconnaissance en différé, où toutes les ressources (données et serveurs de calcul) peuvent être utilisées dans un temps non strictement contraint, et la reconnaissance en direct à flux contraint, dont les implications sont très fortes en termes de qualité. L’adaptation des modèles de langage est l’un des axes de recherche les plus importants du lot 2. Cette thématique de recherche n’est pas nouvelle, ni résolue. Le projet PASTEL contient des spécificités qui le rendent scientifiquement très intéressant dans ce domaine : l’information disponible a priori pour l’adaptation est minimale, les séances d’enseignement sont susceptibles de se succéder dans une même matière et permettent l’étude d’une technique d’adaptation incrémentale, et la transcription automatique en direct dans le cadre d’un cours offre des conditions très intéressantes pour expérimenter des approches d’adaptation à la volée des modèles de langage.

Tâches :

  • Adaptation a priori des modèles de langage
  • Reconnaissance de la parole en différé
  • Reconnaissance de la parole en direct et à latence contrainte
  • Suivi de conversations en temps réel de groupes d’apprenants
  • Intégration

Lot 3 : Enrichissement du matériel pédagogique

L’objectif est d’apporter une certaine plasticité aux contenus multi-modaux qui seront exploités par les instruments conçus dans le lot 4. Il s’agit de fournir des techniques permettant la segmentation des contenus, leur description et leur rapprochement. Les contenus manipulés comprennent des monologues et des polylogues (dialogues multi-participants), des ressources pédagogiques et du domaine (manuels, articles, rapports, sujets de travaux) écrites et non-dialogiques, des notes écrites. La segmentation thématique produite dans la tâche T 3.1 pourra servir à organiser visuellement la transcription d’un discours considérée comme une prise de note automatique. L’analyse en actes du dialogue (tâche T 3.2) d’une ressource pédagogique de type conversations asynchrones (e.g. forum de discussion) pourra être exploitée en phase de structuration du contenu pédagogique (T 4.4) pour générer une liste des questions les plus fréquentes (FAQ). Si la qualité de la transcription le permet, cette analyse pourra servir pour suivre l’état informationnel des participants d’une conversation orale afin de lever une alerte à l’attention d’un enseignant en cas de détection de questions sans réponse par exemple. La recherche de contenus multi-modaux (T 3.3) pourra directement être investie dans un instrument d’enrichissement proactif de la transcription. La tâche T 3.3 reposera sur les résultats des tâches T 3.1 et T 3.2 pour délimiter des contenus à rapprocher voire pour sélectionner ceux qui doivent être utilisés comme base à une recherche (e.g. les contenus cadrés par une question ou par l’expression d’une incompréhension par un étudiant). Ce travail vise à réaliser des avancées significatives dans la structuration de contenus multi-modaux et multi-thématiques notamment dans le contexte d’une nécessité de traitement en temps réel.

Tâches :

  • Segmentation thématique
  • Analyse en actes du dialogue
  • Recherche de contenus pédagogiques
  • Intégration

Lot 4 : Instrumentation de l’apprentissage et de la conception

Le constat sous-tendant l’ensemble du projet PASTEL est que l’approche la plus prometteuse pour l’utilisation massive du numérique dans l’enseignement supérieur est l’enseignement hybride, où s’intègre et s’articule l’enseignement traditionnel et l’enseignement en ligne, l’interaction classique et celle médiée par la technologie, les modalités synchrones et asynchrones. Dans ce cadre, PASTEL veut définir et outiller un processus de développement de type « rapid learning » fondé sur l’exploitation de la transcription automatique de la parole. Ce processus vise au développement et à la mise en place rapide et facile de situations pédagogiques hybrides supportées par un dispositif d’apprentissage intégrant compte les besoins et les contraintes de tous les acteurs de la formation. Nous nous proposons dans ce projet d’exploiter la TA pour produire des indicateurs qui, combinés à d’autres, permettront de qualifier l’activité des groupes et d’aider le tuteur dans sa régulation (décider du moment et du type de son intervention en fonction du contexte de l’activité des apprenants). Un des objectifs important du projet est d’instrumenter l’enseignant pour l’aider, sur la base de son enseignement présentiel, à générer facilement et rapidement du contenu pédagogique en ligne de type SPOC (Small and Private Online Course). Nous voulons donc développer une chaîne éditoriale de base qui facilitera la structuration et l’agencement des ressources pédagogiques du cours (vidéo captée lors de l’exposé magistral, ressources pédagogiques collectées, traces d’activité, etc.) en vue de la mise en ligne d’un SPOC.

Tâches :

  • Traçage et analyse de l’activité
  • Instrumentation de l’exposé magistral
  • Instrumentation du travail
  • Aide à la structuration
  • Intégration aux plateformes de MOOC