Edutech App <> IA openAI

Identification

identification via Google ID > marche très bien > Cool

UX comme chatGPT

Idéal car ne perd pas l'utilisateur > Cool

Acquisition audio > reconnaissance de la parole

Objectif : reconnaissance de la parole TTS via des calls API de openAI's Whisper
Pour l'instant sur site distant ( paris ) , ne marche pas > mais GROS challenge attendu pour les call API et les délais d'aller retour et time out >
Niveau complexité probable : 4/5

Evolution vers cinématic comme ChatGPT

Rajout du tilde ( symbole au dessus à droite de l'écran )
Et si jouable petite montre ou truc qui tourne sur le symbol à octé quand la piste audio est en train d'être reconnu
Niveau complexité probable : 1/5

Evolution vers cinématic comme ChatGPT ( étape 2 )

Rajout bouton rond noir et flêche permettant d'envoyer le message text

Niveau complexité probable : 1/5

Notes temps réel en bas de l'image

Pas de record pour l'heure > est ce vers firebase ?
Niveau complexité probable : 2/5

v

Fonctionnalité 2

.

Fonctionnalité 3

.

UX pour service reconnaissance d'objet de Vincent ( YouSpeakItDisplay)

UX multi-fenêtre pour futur service reconnaissance vidéo

Ergo multifenêtre sur Laptop est oki
Test à faire sur mobile ( pas simple cf multi fenêtrage > inspiration à faire probablement avec les services de reco google et openAI

Création nouveau projet de reco

UX avec nom, statut ( en cours, attente, terminé ), date = fonctionne > cool

Call API du terminal pour capture vidéo temps réel (camera)

Idem pour vidéo > fonctionné