Accéder au contenu principal

Naturellement, parler à la machine

Lors de son intervention au Web à Québec 2017, Mat Velloso (Microsoft) insiste : non, il n'est pas nécessaire de parler à un robot de conversation alors qu'on peut tout simplement cliquer sur un bouton...  


Selon lui, les robots de conversation (ou chatbots) sont performants dès lors qu'ils permettent à l'utilisateur d'accéder plus rapidement à une information. Peu importe qu'on lui parle, qu'il nous écoute et nous réponde.

La voix ne sera utilisée qu'en dernier recours, après le clic et la saisie de texte : par exemple quand, au volant, on ne peut pas manipuler son téléphone.

Toutefois, la reconnaissance vocale permet dans certaines situations d'enrichir une expérience.

Avec Wiidii, un assistant hybride personnel développé par une société bordelaise, l'apport d'informations se construit sur la base d'un échange, textuel ou vocal.

J'ai pu tester cette application lors du Talent Day 2016 organisé par Imaginove sur le thème de l'intelligence artificielle et des nouvelles interfaces. La reconnaissance vocale est d'une incroyable précision, ce qui permet véritablement une expérience relationnelle avec Wiidii.



Les concepteurs de Wiidii ont eu l'intelligence de ne pas personnifier le chatbot : pas de visage, ni de forme physique. C'est à mon sens la plus grande réussite de cet assistant personnel.

Dans d'autres situations, la voix est mise au profit d'une progression dans la narration.

C'est le cas dans Untethered, un jeu vidéo en VR (Virtual Reality) dans lequel le joueur incarne un animateur radio.


We’re social creatures who like to converse. Untethered lets you talk to a story. Why? Because humans want to talk. And that’s reason enough.
- extrait de l'article If You Talk To This Story, The Characters Will Listen (merci à Jiminy Panoz pour le lien)

D'autres dispositifs hybrides s'appuient sur l'oralité comme constituant (ADN).

Le livre Wuxia le renard, édité par Sagaworld à Québec, fait appel à une application iPad qui réagit à la voix.

Les animations s'activent en fonction d'une centaine de points de reconnaissance vocale : en fonction de la tonalité, du rythme, etc. Dans Wuxia, l'oralité du conte est réactivée au profit d'un partage de l'histoire entre parent et enfant.



(merci à Eric Letarte pour la référence)

Dernier point d'émergence de la reconnaissance vocale : pour... gagner du temps !

Avec la sortie de Clips, nouvelle application Apple pour l'édition de vidéos, dont le système de reconnaissance vocale permet la transcription instantanée (Live Title).


Commentaires

Posts les plus consultés de ce blog

En voyage dans les métavers : plaidoyer pour la diversité

Retranscription illustrée d'une conférence présentée le 25 mai 2022 à Québec dans la catégorie « Innovation » du WAQ (Web à Québec). Merci au comité de programmation pour l'invitation ! ( voir la captation de la conférence)

Pédagogie du corps scanné

Avec sa première classe culturelle numérique, la metteuse en scène Anne-Sophie Grac met au défi les collégiens d'imaginer les canons de beauté de demain, en passant par la déconstruction du corps réel et représenté.

Le chalet, lieu refuge du métavers

Le chalet en bois cosy au beau milieu des montagnes enneigées, c'est le paysage obligé de tous les univers virtuels (un peu comme Mariah Carey à l'approche de Noël). Mais pourquoi un tel engouement pour le style chalet ?