Edutech App <> IA openAI
Identification
- identification via Google ID > marche très bien > Cool
UX comme chatGPT
- Idéal car ne perd pas l'utilisateur > Cool
Acquisition audio > reconnaissance de la parole
- Objectif : reconnaissance de la parole TTS via des calls API de openAI's Whisper
- Pour l'instant sur site distant ( paris ) , ne marche pas > mais GROS challenge attendu pour les call API et les délais d'aller retour et time out >
- Niveau complexité probable : 4/5
Evolution vers cinématic comme ChatGPT
- Rajout du tilde ( symbole au dessus à droite de l'écran )
- Et si jouable petite montre ou truc qui tourne sur le symbol à octé quand la piste audio est en train d'être reconnu
- Niveau complexité probable : 1/5
Evolution vers cinématic comme ChatGPT ( étape 2 )
- Rajout bouton rond noir et flêche permettant d'envoyer le message text
- Niveau complexité probable : 1/5
Notes temps réel en bas de l'image
- Pas de record pour l'heure > est ce vers firebase ?
- Niveau complexité probable : 2/5
v
Fonctionnalité 2
.
Fonctionnalité 3
.
UX pour service reconnaissance d'objet de Vincent ( YouSpeakItDisplay)
UX multi-fenêtre pour futur service reconnaissance vidéo
- Ergo multifenêtre sur Laptop est oki
- Test à faire sur mobile ( pas simple cf multi fenêtrage > inspiration à faire probablement avec les services de reco google et openAI
Création nouveau projet de reco
- UX avec nom, statut ( en cours, attente, terminé ), date = fonctionne > cool
Call API du terminal pour capture vidéo temps réel (camera)
- Idem pour vidéo > fonctionné

