Chatbot WhatsApp relié à une architecture multi-RAG (N matières)
Objectif
Permettre aux étudiants de poser des questions en WhatsApp et d’obtenir des réponses fiables, sourcées et multilingues (FR/MG), en s’appuyant sur 10 bases de connaissances distinctes (une par matière), avec un routage automatique vers la bonne matière et des garde-fous pédagogiques.
- Mettre à disposition des étudiants un chatbot WhatsApp pédagogique, dialoguant comme un professeur de TP.
- L’étudiant pose une question → le bot répond en mode pratique, cite ses sources (OdoLearn, YouTube, MOOC), et propose des exercices concrets à réaliser.

On souhaite un chatbot WhatsApp qui serve d’assistant pédagogique comme un professeur de TP, mais orienté agriculture (L1 licence), et qui s’appuie non pas sur des cours théoriques mais sur trois sources pratiques :
- Contenus OdooLearning (supports pratiques, fiches TP, exercices interactifs),
- Tutoriels YouTube (séquences vidéo pas-à-pas),
- MOOC (séquences vidéos + fiches pratiques).
Vue d’ensemble (couches)
1- Canal & Accès
- WhatsApp Business (Meta API).
- Réponses structurées (texte, lien, image preview, vidéo).
- Boutons rapides (“voir vidéo”, “exercice OdoLearn”, “séquence MOOC”).
> How ?
- WhatsApp Business (Cloud API Meta ou passerelle équivalente).
- Webhook → Backend (API) pour recevoir/émettre les messages.
2- Orchestration & Routage
- Détection du sujet agricole (maraîchage, irrigation, sol, machinisme…).
- Router vers la bonne base pratique (OdoLearn / YouTube / MOOC).
- Si ambigu : proposer 2 options à choisir.
- Détection de la matière (router) : mots-clés + classifieur léger + méta-données du cours.
> how ?
- Fallback : demande de précision ou top-2 matières avec score.
3- RAG par matière (10 x)
RAG par domaine agricole
- 10 collections vectorielles (une par matière pratique agricole).
- Exemple : Sols, Irrigation, Semis, Protection des cultures, Machinisme, Élevage, Agroforesterie, Transformation, Économie rurale, Développement durable.
- Chaque réponse = explication pratique + sources croisées (OdoLearn + YouTube + MOOC). > Sources pratiques (multi-RAG)
ource | Contenu indexé | Format de restitution |
---|---|---|
OdoLearn | Fiches TP, exercices pratiques, protocoles | PDF extrait + consignes interactives |
YouTube | Tutoriels vidéos (semis, irrigation, compostage, etc.) | Lien vidéo + minute exacte |
MOOC | Vidéos + supports téléchargeables | Vidéo séquence + résumé en puces |
> how ?
- Ingestion → normalisation → chunking (500–1 200 tokens) → embeddings → index vectoriel (une collection par matière).
- Retriever (top-k, re-ranker) → Contexte → LLM génératif → Réponse structurée + citations.
4- Post-traitement pédagogique
Style des réponses
- Ton = professeur de TP → langage simple, direct, étape par étape.
-
Exemple de sortie :
✅ “Pour irriguer tes tomates :
- Pose le tuyau goutte-à-goutte à 10 cm de la tige.
- Débit conseillé = 1,5 L/plante/jour.
-
Vérifie le sol chaque matin.
📖 Voir la fiche TP OdoLearn : [lien].
▶️ Tutoriel vidéo (3:22) : [YouTube].
🎓 Séquence MOOC chap. 2.4 : [lien].”
- Vérifs (hallucination guard, filtres de sécurité), formatage (bullet points, glossaire), citations + liens vers sources (PDF/vidéos/notes).
- Résumé court + “pour aller plus loin”.
5- Services transverses
- FR ⇄ MG automatique avec glossaire agricole.
- Niveau L1 (explications pratiques, peu de jargon).
> How ?
- Traduction FR ⇄ MG (au besoin : détection langue).
- Profil étudiant (niveau L1/L2/L3 pour adapter la granularité).
- Journalisation & analytics (tableau de bord qualité).
- Back-office : ajout/MAJ contenus, feedback enseignants, évaluation des réponses.
+
- Feedback et progression
-
L’étudiant peut :
- Donner un 👍/👎 à la réponse,
- Demander un “exercice similaire”,
- Stocker sa progression (via OdoLearn).
-
L’étudiant peut :
.
.
Schéma de flux (simplifié)
Utilisateur (WhatsApp) → Webhook → Router matières → RAG[matière] (Retriever + Re-ranking) → LLM (avec contexte) → Vérifs & citations → Traduction/Adaptation → Réponse WhatsApp (+ boutons: “sources”, “exercices”, “autre matière”).
.
ANNEXES
🔗 Intégration des 3 sources
- OdoLearn = back-office principal (upload fiches TP, suivi progression).
- YouTube = liens enrichis (avec timestamps → passage exact).
- MOOC = séquences chapitrées (API ou liens directs).
Chaque réponse combine 1 fiche TP + 1 vidéo YouTube + 1 séquence MOOC → cohérence pédagogique.
📊 Observabilité & qualité
- Logs : matière + source activée (OdoLearn/YouTube/MOOC).
- KPI : % réponses avec citation multi-sources, temps moyen par réponse, taux d’exercices réalisés.
- Feedback enseignant (corrige, valide, enrichit la base).
🚀 Plan de déploiement
MVP (2 matières : maraîchage + irrigation)
- WhatsApp ↔ RAG ↔ OdoLearn + YouTube.
- Réponses FR.
Extension (5 matières)
- Ajout MOOC.
- FR + MG.
Complet (10 matières TP agricoles)
- Multi-sources automatiques (OdoLearn + YouTube + MOOC).
- Profil étudiant (progression L1).
Optimisation
- Exos interactifs (quiz OdoLearn).
- Dashboard enseignant.
🌱 Découpage par matière (L1 TP agricoles)
RAG par domaine agricole
- 10 collections vectorielles (une par matière pratique agricole).
- Exemple : Sols, Irrigation, Semis, Protection des cultures, Machinisme, Élevage, Agroforesterie, Transformation, Économie rurale, Développement durable.
- Chaque réponse = explication pratique + sources croisées (OdoLearn + YouTube + MOOC).