Edutech App <> IA openAI

Identification 

  • identification via Google ID > marche très bien > Cool 

UX comme chatGPT

  • Idéal car ne perd pas l'utilisateur > Cool 

Acquisition audio > reconnaissance de la parole 

  • Objectif : reconnaissance de la parole TTS via des calls API de openAI's Whisper
  • Pour l'instant sur site distant ( paris  ) , ne marche pas > mais GROS challenge attendu pour les call API et les délais d'aller retour et time out > 
  • Niveau complexité probable : 4/5

Evolution vers cinématic comme ChatGPT

  • Rajout du tilde ( symbole au dessus à droite de l'écran  )
  • Et si jouable petite montre ou truc qui tourne sur le symbol à octé quand la piste audio est en train d'être reconnu 
  • Niveau complexité probable : 1/5

Evolution vers cinématic comme ChatGPT ( étape 2 )

  • Rajout bouton rond noir et flêche permettant d'envoyer le message text



  • Niveau complexité probable : 1/5

Notes temps réel en bas de l'image

  • Pas de record pour l'heure > est ce vers firebase ? 
  • Niveau complexité probable : 2/5

 v

Fonctionnalité 2

.

Fonctionnalité 3

.

UX pour service reconnaissance d'objet de Vincent ( YouSpeakItDisplay)

UX multi-fenêtre pour futur service reconnaissance vidéo

  • Ergo multifenêtre sur Laptop est oki
  • Test à faire sur mobile ( pas simple cf multi fenêtrage > inspiration à faire probablement avec les services de reco google et openAI

Création nouveau projet de reco 

  • UX avec nom, statut ( en cours, attente, terminé ), date = fonctionne > cool

Call API du terminal  pour capture vidéo temps réel (camera)

  • Idem pour vidéo > fonctionné