Accéder au contenu principal

Naturellement, parler à la machine

Lors de son intervention au Web à Québec 2017, Mat Velloso (Microsoft) insiste : non, il n'est pas nécessaire de parler à un robot de conversation alors qu'on peut tout simplement cliquer sur un bouton...  


Selon lui, les robots de conversation (ou chatbots) sont performants dès lors qu'ils permettent à l'utilisateur d'accéder plus rapidement à une information. Peu importe qu'on lui parle, qu'il nous écoute et nous réponde.

La voix ne sera utilisée qu'en dernier recours, après le clic et la saisie de texte : par exemple quand, au volant, on ne peut pas manipuler son téléphone.

Toutefois, la reconnaissance vocale permet dans certaines situations d'enrichir une expérience.

Avec Wiidii, un assistant hybride personnel développé par une société bordelaise, l'apport d'informations se construit sur la base d'un échange, textuel ou vocal.

J'ai pu tester cette application lors du Talent Day 2016 organisé par Imaginove sur le thème de l'intelligence artificielle et des nouvelles interfaces. La reconnaissance vocale est d'une incroyable précision, ce qui permet véritablement une expérience relationnelle avec Wiidii.



Les concepteurs de Wiidii ont eu l'intelligence de ne pas personnifier le chatbot : pas de visage, ni de forme physique. C'est à mon sens la plus grande réussite de cet assistant personnel.

Dans d'autres situations, la voix est mise au profit d'une progression dans la narration.

C'est le cas dans Untethered, un jeu vidéo en VR (Virtual Reality) dans lequel le joueur incarne un animateur radio.


We’re social creatures who like to converse. Untethered lets you talk to a story. Why? Because humans want to talk. And that’s reason enough.
- extrait de l'article If You Talk To This Story, The Characters Will Listen (merci à Jiminy Panoz pour le lien)

D'autres dispositifs hybrides s'appuient sur l'oralité comme constituant (ADN).

Le livre Wuxia le renard, édité par Sagaworld à Québec, fait appel à une application iPad qui réagit à la voix.

Les animations s'activent en fonction d'une centaine de points de reconnaissance vocale : en fonction de la tonalité, du rythme, etc. Dans Wuxia, l'oralité du conte est réactivée au profit d'un partage de l'histoire entre parent et enfant.



(merci à Eric Letarte pour la référence)

Dernier point d'émergence de la reconnaissance vocale : pour... gagner du temps !

Avec la sortie de Clips, nouvelle application Apple pour l'édition de vidéos, dont le système de reconnaissance vocale permet la transcription instantanée (Live Title).


Commentaires

Posts les plus consultés de ce blog

Pokémon réenchante le monde

20 ans après la création de la franchise, Pokémon lance son jeu sur mobile en réalité augmentée : Pokémon Go. Le principe ? Au lieu de balader votre personnage dans un univers virtuel, vous êtes le personnage à balader dans le monde réel. Des Pokémon se cachent à tous les coins de rue ; votre espace se densifie.

Invitation à sortir C'est d'abord un monde beau : vert, pastel, plane, on a envie de le parcourir.

Tous mes déplacements par principe figurent dans un coin de mon paysage, sont reportés sur la carte du visible. Tout ce que je vois par principe est à ma portée, au moins à la portée de mon regard, relevé sur la carte du "je peux". Chacun des deux cartes est complète. Le monde visible et celui de mes projets moteurs sont des parties totales du même Etre. Merleau-Ponty, L'Oeil et l'Esprit




C'est ensuite un monde jalonné, donc rassurant : de nombreux points parsèment les routes et intersections comme autant de promesses. Ces points - appelés PokéStops d…

Dix musées sur l'échelle de Richter

En 2015, Museomix eut lieu dans 10 musées autour du monde. Comment faire vibrer ensemble un millier de participants qui ne travaillent pas avec les mêmes collections, sur les mêmes prototypes, dans le même fuseau horaire ? La mixroom saisit l'occasion pour renforcer les liens entre les musées.
Une ligne éditoriale pour les gouverner tous L'an dernier (relire l'article 2014), la mixroom avait déjà calibré les livrables : chaque équipe audiovisuelle devait produire chaque jour trois vidéos (l'une à diffusion locale, les deux autres à diffusion globale).



En 2015, trois questions se posent :

faut-il maintenir la diffusion d'une vidéo en anglais alors qu'aucun musée anglophone ne participe, mais que certaines communautés parlent espagnol, allemand ou flamand ? comment donner de la visibilité à toutes les vidéos de format libre qui sont produites en marge des livrables imposés ? peut-on allier communication interne (entre les musées pendant l'événement) et extern…

Pour une documentation de la compassion

Je voudrais avancer l'hypothèse d'un facteur humain intervenant dans une interaction homme / machine, et qui s'appellerait la compassion. Cette hypothèse expliquerait pourquoi, en dépit de la plus mauvaise interface qui puisse exister, un utilisateur parviendra toujours à ses fins, à condition qu'il soit en contact direct avec le créateur du dispositif.
Cet article est d'abord été pensé en réaction à celui de Kevin Vennitti, intitulé : Etude de cas UX, du templating à la documentation technique. Les titres de mes parties sont des citations directes.

Comme Kevin, j'ai travaillé sur le projet Ludomuse : un moteur open-source partagé à terme entre plusieurs musées et dont la singularité technique repose sur la connexion en WiFi direct de deux appareils mobiles qui permet de jouer en binôme.

Pour en savoir plus sur Ludomuse, lire cet article sur le site d'Erasme

Canaliser davantage la patience de l'utilisateur En intervenant au musée Cernuschi à Paris puis …