Chatbot WhatsApp relié à une architecture multi-RAG (N  matières)

Objectif


Permettre aux étudiants de poser des questions en WhatsApp et d’obtenir des réponses fiables, sourcées et multilingues (FR/MG), en s’appuyant sur 10 bases de connaissances distinctes (une par matière), avec un routage automatique vers la bonne matière et des garde-fous pédagogiques.

  • Mettre à disposition des étudiants  un chatbot WhatsApp pédagogique, dialoguant comme un professeur de TP.
    • L’étudiant pose une question → le bot répond en mode pratique, cite ses sources (OdoLearn, YouTube, MOOC), et propose des exercices concrets à réaliser.

On souhaite un chatbot WhatsApp qui serve d’assistant pédagogique comme un professeur de TP, mais orienté agriculture (L1 licence), et qui s’appuie non pas sur des cours théoriques mais sur trois sources pratiques :

  1. Contenus OdooLearning  (supports pratiques, fiches TP, exercices interactifs),
  2. Tutoriels YouTube (séquences vidéo pas-à-pas),
  3. MOOC (séquences vidéos + fiches pratiques).




Vue d’ensemble (couches)

1- Canal & Accès


  • WhatsApp Business (Meta API).
  • Réponses structurées (texte, lien, image preview, vidéo).
  • Boutons rapides (“voir vidéo”, “exercice OdoLearn”, “séquence MOOC”).

> How ? 


  • WhatsApp Business (Cloud API Meta ou passerelle équivalente).
  • Webhook → Backend (API) pour recevoir/émettre les messages.


En savoir plus

2- Orchestration & Routage


  • Détection du sujet agricole (maraîchage, irrigation, sol, machinisme…).
  • Router vers la bonne base pratique (OdoLearn / YouTube / MOOC).
  • Si ambigu : proposer 2 options à choisir.
  • Détection de la matière (router) : mots-clés + classifieur léger + méta-données du cours.

> how ? 

  • Fallback : demande de précision ou top-2 matières avec score.


En savoir plus

3- RAG par matière (10 x)

RAG par domaine agricole

  • 10 collections vectorielles (une par matière pratique agricole).
  • Exemple : Sols, Irrigation, Semis, Protection des cultures, Machinisme, Élevage, Agroforesterie, Transformation, Économie rurale, Développement durable.
  • Chaque réponse = explication pratique + sources croisées (OdoLearn + YouTube + MOOC). > Sources pratiques (multi-RAG)
ourceContenu indexéFormat de restitution
OdoLearnFiches TP, exercices pratiques, protocolesPDF extrait + consignes interactives
YouTubeTutoriels vidéos (semis, irrigation, compostage, etc.)Lien vidéo + minute exacte
MOOCVidéos + supports téléchargeablesVidéo séquence + résumé en puces


> how ? 

  • Ingestion → normalisation → chunking (500–1 200 tokens) → embeddings → index vectoriel (une collection par matière).
  • Retriever (top-k, re-ranker) → Contexte → LLM génératif → Réponse structurée + citations.

En savoir plus

4- Post-traitement pédagogique


Style des réponses

  • Ton = professeur de TP → langage simple, direct, étape par étape.
  • Exemple de sortie :

    ✅ “Pour irriguer tes tomates :

    1. Pose le tuyau goutte-à-goutte à 10 cm de la tige.
    2. Débit conseillé = 1,5 L/plante/jour.
    3. Vérifie le sol chaque matin.
      📖 Voir la fiche TP OdoLearn : [lien].
      ▶️ Tutoriel vidéo (3:22) : [YouTube].
      🎓 Séquence MOOC chap. 2.4 : [lien].”
  • Vérifs (hallucination guard, filtres de sécurité), formatage (bullet points, glossaire), citations + liens vers sources (PDF/vidéos/notes).
  • Résumé court + “pour aller plus loin”.


En savoir plus

5- Services transverses

  • FR ⇄ MG automatique avec glossaire agricole.
  • Niveau L1 (explications pratiques, peu de jargon).

> How ? 

  • Traduction FR ⇄ MG (au besoin : détection langue).
  • Profil étudiant (niveau L1/L2/L3 pour adapter la granularité).
  • Journalisation & analytics (tableau de bord qualité).
  • Back-office : ajout/MAJ contenus, feedback enseignants, évaluation des réponses.

+

  1. Feedback et progression
    • L’étudiant peut :
      • Donner un 👍/👎 à la réponse,
      • Demander un “exercice similaire”,
      • Stocker sa progression (via OdoLearn).


En savoir plus

.

.

Schéma de flux (simplifié)

Utilisateur (WhatsApp) → Webhook → Router matières → RAG[matière] (Retriever + Re-ranking) → LLM (avec contexte) → Vérifs & citations → Traduction/Adaptation → Réponse WhatsApp (+ boutons: “sources”, “exercices”, “autre matière”).

.

ANNEXES

🔗 Intégration des 3 sources



  • OdoLearn = back-office principal (upload fiches TP, suivi progression).
  • YouTube = liens enrichis (avec timestamps → passage exact).
  • MOOC = séquences chapitrées (API ou liens directs).

Chaque réponse combine 1 fiche TP + 1 vidéo YouTube + 1 séquence MOOC → cohérence pédagogique.

📊  Observabilité & qualité


  • Logs : matière + source activée (OdoLearn/YouTube/MOOC).
  • KPI : % réponses avec citation multi-sources, temps moyen par réponse, taux d’exercices réalisés.
  • Feedback enseignant (corrige, valide, enrichit la base).

🚀 Plan de déploiement


MVP (2 matières : maraîchage + irrigation)

  • WhatsApp ↔ RAG ↔ OdoLearn + YouTube.
  • Réponses FR.

Extension (5 matières)

  • Ajout MOOC.
  • FR + MG.

Complet (10 matières TP agricoles)

  • Multi-sources automatiques (OdoLearn + YouTube + MOOC).
  • Profil étudiant (progression L1).

Optimisation

  • Exos interactifs (quiz OdoLearn).
  • Dashboard enseignant.

 

🌱 Découpage par matière (L1 TP agricoles) 


RAG par domaine agricole

  • 10 collections vectorielles (une par matière pratique agricole).
  • Exemple : Sols, Irrigation, Semis, Protection des cultures, Machinisme, Élevage, Agroforesterie, Transformation, Économie rurale, Développement durable.
  • Chaque réponse = explication pratique + sources croisées (OdoLearn + YouTube + MOOC).

Découvrir plus