Dragon Naturally Speaking 11 : petit retour d'expérience

Démarré par Cedric_g, Juillet 22, 2011, 09:20:57

« précédent - suivant »

Cedric_g

Bonjour
Pour celles et ceux que cela pourrait intéresser, voici un petit retour sur Dragon Naturally Speaking version 11 (acheté 49€ en promo chez Cultura), une application de reconnaissance vocale et donc, de dictée et de contrôle de l'ordinateur par la voix.
Installation et paramétrage
Phase somme toute assez simple, il suffit donc d'installer l'appli puis de créer un profil vocal (on est guidé tout au long de la manip, c'est ultra facile) ; nous est demandé de lire un texte (que l'on peut choisir), ce qui prend environ 10 minutes, puis le programme va ensuite calculer les données liées à notre profil vocal (durée : environ 20mn)

Et c'est tout ! À noter que le programme "sait" reconnaître les accents régionaux, et s'adapte donc en conséquence. Il y a également la possibilité de créer plusieurs profils vocaux.
Efficacité et utilisation
J'avoue avoir été très, très, très agréablement surpris de l'efficacité avec laquelle l'application arrive à reconnaître, avec un taux d'erreur somme toute très bas, les dictées que je lui ai proféré ! Lorsqu'une expression ou un mot n'est pas reconnu, il y a la possibilité de lui "apprendre" (on lui épèle le mot - ou on le tape au clavier - puis on enregistre sa prononciation, et basta) ; autant dire qu'en matière de langage technique ou naturaliste, si pas mal de mots sont reconnus, il y a quand même une période d'accoutumance pour arriver à une utilisation concrète de l'outil.

Par contre, pour répondre à des mails, écrire des courriers en langage courant, on est proche des 100% d'efficacité : réellement impressionnant ! Il est possible de piloter en partie Windows et les applications à la voix, avec plus ou moins de bonheur (voir plus bas).

Par exemple, depuis le Bureau Windows, "ouvrir Word" exécute notre traitement de texte préféré. Il suffit ensuite de dicter, ou énoncer les actions à réaliser ("Ouvrir", ou "Imprimer"). Possibilité de correction à la voix, d'annulation, de navigation dans le texte ("fin de ligne", "nouveau paragraphe", etc.)

En matière de diction, il faut bien évidemment parler clairement et articuler un minimum, et prononcer la ponctuation. Mais il ne faut pas parler de manière hachée : une dictée prononcée comme on parle usuellement (en forçant un minimum l'articulation pour ceux qui comme moi bouffent la moitié des mots ;) ) est parfaitement reconnue.

On peut aussi activer/désactiver la reconnaissance à la voix, avec "au boulot" et "au repos" (marrant ça :) )
Usage bureautique
Je l'ai utilisé à ce jour essentiellement avec Word et avec Outlook. À l'usage, même si je suis quasiment à 100 mots/minute en moyenne à la frappe au clavier (c'est un peu mon job, aussi...) je gagne vraiment du temps à dicter au lieu d'écrire (inutile de vous dire qu'une personne qui tape à 2 doigts va elle, vraiment gagner à l'usage ;D )

Pour répondre aux mails notamment, ça va super vite. "Répondre". Après on dicte. Relecture rapide. "Envoyer" et hop, c'est fini !

J'ai du lui apprendre certains mots : "Canon", "Sigma", "mm" (pour millimètres), "DPI", etc. mais une fois cela fait, l'application sait reconnaître le contexte (ou le champs lexical) et s'adapte en conséquence avec une assez bonne efficacité.

Quelques ratés surviennent de temps à autres, mais c'est anecdotique. Dans l'ensemble, on gagne vraiment du temps : c'était l'objectif !
Usage "photographique" sous Lightroom
Ben oui : quand on a quelques centaines d'images (!) à annoter au niveau des IPTC, ça peut servir également ! SAUF lorsque les textes utilisent massivement des expressions particulières, genre noms d'oiseaux peu communs, noms scientifiques (il ne sait pas reconnaître le latin ::) ), etc.

Dans l'ensemble on gagne du temps (ce matin par ex. j'ai annoté une petite quarantaine de photos - trois zones à chaque fois - en 30mn environ, soit approximativement un gain de 30% par rapport à d'habitude) mais uniquement sur des sujets de vocabulaire relativement courant (ce matin, c'étaient des photos de chats pour mon agence)

J'ai noté par contre que certains mots sont pris pour des commandes LR, et du coup on se retrouve parfois en mode zoom ou développement, sans comprendre pourquoi ;D : un peu pénible (m'est arrivé deux fois)
Mon premier bilan
Je ne regrette en rien mon achat, que j'avais programmé de longue date (ça fait deux ans et demi que je me traîne une épicondylite doublée d'une épitrochléïte aux deux bras - un tennis elbow si vous préférez, une forme de tendinite au niveau du coude et des avants-bras - à cause d'usage trop intensif du clavier...)

Le gain de temps est globalement intéressant, j'envisage notamment de demander l'acquisition du logiciel au niveau de mon boulot, car dicter ses écrits est finalement assez reposant, indéniablement (à contrario je pourrai plus trop venir sur Chassimages durant les heures de bureau ;D )

Inconvénient : nécessite d'être un minimum isolé, d'une part pour ne pas gêner son entourage, et d'autre part pour ne pas interférer au niveau de la reconnaissance (aucune incidence sur la qualité de cette dernière, mais ralentit l'interprétation des phrases car le logiciel doit "trier" les sons si j'ose dire !)
Voilà !

Je n'ai aucune action chez Nuance (la société qui édite le logiciel) et rien à gagner à en parler, c'était juste pour le partage :D
Ah, dernière chose : j'avais dans le passé (il y a 10/12 ans) testé le même logiciel, dans une version bien entendu beaucoup plus arriérée. C'était quasi inutilisable. Il semble que la version 11 (actuelle) soit NETTEMENT au-dessus de ce que faisaient les précédentes...

Nikojorj

Citation de: Cedric_g le Juillet 22, 2011, 09:20:57
J'ai noté par contre que certains mots sont pris pour des commandes LR, et du coup on se retrouve parfois en mode zoom ou développement, sans comprendre pourquoi ;D : un peu pénible (m'est arrivé deux fois)
Ca, c'est un truc qui m'arrive parfois aussi avec le clavier : ça dépend tout simplement de où est le focus. S'il est dans la boite de texte, ça rentre une lettre, s'il est ailleurs sur l'interface, ça rentre un raccourci clavier...

Franciscus Corvinus

Citation de: Cedric_g le Juillet 22, 2011, 09:20:57(...) je me traîne une épicondylite doublée d'une épitrochléïte aux deux bras - un tennis elbow si vous préférez (...)

Si tu as dicte ca, je crois que c'est une preuve suffisante que ca ne marche pas trop mal ;)

bitere

Citation de: Franciscus Corvinus le Juillet 23, 2011, 23:16:31
Si tu as dicte ca, je crois que c'est une preuve suffisante que ca ne marche pas trop mal ;)
;D

Merci du retour, j'ai une vieille version mi figue mi raisin et justement ils me proposent un prix pour une mise à jour.
Vais y réfléchir.