Suivez-nous sur X

|
|
|
0,
A,
B,
C,
D,
E,
F,
G,
H,
I,
J,
K,
L,
M,
N,
O,
P,
Q,
R,
S,
T,
U,
V,
W,
X,
Y,
Z,
ALL
|
|
0,
A,
B,
C,
D,
E,
F,
G,
H,
I,
J,
K,
L,
M,
N,
O,
P,
Q,
R,
S,
T,
U,
V,
W,
X,
Y,
Z
|
|
0,
A,
B,
C,
D,
E,
F,
G,
H,
I,
J,
K,
L,
M,
N,
O,
P,
Q,
R,
S,
T,
U,
V,
W,
X,
Y,
Z
|
|
A propos d'Obligement
|
|
David Brunet
|
|
|
|
Test de VoRecOne
(Article écrit par Nicolas Fournel et extrait d'A-News (Amiga News) - juillet 1990)
|
|
VoRecOne : votre Amiga n'est plus sourd
Ça y est, l'Amiga dispose de son premier système de reconnaissance vocale, le VoRecOne. S'il ne vous permet pas
encore d'entrer vos mémoires de vive voix comme le commandant du Galactica, il offre déjà la possibilité de se
familiariser avec une des techniques de pointe de l'intelligence artificielle et de réaliser quelques applications
intéressantes.
Vous pouvez lire ces quelques notions générales sur la reconnaissance vocale
pour cerner le sujet. Après ceci, nous voici fin prêts à expérimenter le dernier joujou qu'Impulse a mis à notre disposition.
Le VoRecOne est le premier système de reconnaissance de la parole disponible pour Amiga. Il a été étudié par
Impulse qui annonce ce périphérique comme le premier d'une série de produits touchant à ce domaine. Dans la
boîte se trouvent un microphone, une petite boîte bleue qui sert apparemment de filtre (?) et se connecte sur
la prise manette, et une disquette contenant tout ce qu'il faut d'ingéniosité et d'ergonomie pour gérer le tout
(sans oublier les fichiers "listening.device" et une "recognition.library").
Voice Editor
Le VoRecOne est un système de reconnaissance vocale globale et monolocuteur. Comme nous allons le voir, le
logiciel qui l'accompagne, nommé Voice Editor, permet d'associer au mot à reconnaître un script. La phase
d'apprentissage du VoRecOne consiste à entrer un mot et une suite d'actions très simples, à effectuer
lorsque celui-ci sera reconnu par l'ordinateur. Le logiciel demande de prononcer le mot de une à trois fois
(fonction "Train"). Si l'analyse spectrale d'un mot est très caractéristique, le VoRecOne se contentera d'une
seule prononciation.
Ensuite, une fonction "Test" permet d'essayer les mots que l'on vient d'enregistrer (cette fonction sert en
fait aussi de mode "Trace" qui exécute pas à pas le script associé au mot) et éventuellement de reprononcer
certains mots si l'expérimentation ne se révèle pas très convaincante. On peut ensuite essayer d'utiliser
notre banque de mots à l'intérieur même du logiciel Voice Editor, ou bien, plus intéressant, de lancer le programme
Recon en multitâche derrière un programme habituel comme Deluxe Paint. C'est un petit
logiciel qui se lance sous Workbench, charge en mémoire la banque de mots de notre choix, et n'attend qu'un
geste de notre part - pardon, un mot - pour exécuter un script prédéfini. C'est en quelque sorte un "lecteur"
pour VoRecOne...
Fiabilité
Impulse annonce une réussite moyenne de 50 à 100%. Cent pour cent me semble tout de même bien exagéré. De plus,
les erreurs sont plus souvent des confusions entre deux mots que de simples rejets, ce qui est un désavantage
de taille pour envisager des applications sérieuses de ce produit.
Autre inconvénient, le VoRecOne cherche désespérément à reconnaître un mot, même s'il ne fait absolument pas
partie du vocabulaire préenregistré. Donc, si vous dites n'importe quoi, ou même si vous tapez dans vos mains,
il y a de fortes chances pour que le logiciel reconnaisse un mot quelconque, ce qui peut mener à de fâcheuses
mésaventures... Il y a un commutateur sur le micro, servez vous-en ou éloignez le micro lorsque vous n'en
n'avez pas besoin. Je vous déconseille aussi d'utiliser des scripts produisant des actions irrémediables du
style formatage ou destruction de fichiers...
Malgré tout, il est indéniable que le VoRecOne est une réussite : si vous prononcez un mot faisant partie du vocabulaire,
il le reconnaîtra -en moyenne- dans 80% des cas. Il est évident qu'il s'agit là d'un produit dont les résultats
dépendent fortement de l'expérimentation et parler avec une voix la plus monocorde possible améliorera immédiatement
les résultats. De plus, le temps de réponse est très court ce qui permet d'envisager des applications en temps réel.
Justement, pour créer des applications, il fallait que le VoRecOne puisse non seulement reconnaître les mots, mais
qu'il soit aussi capable d'exécuter des commandes, c'est pourquoi Impulse à doté sa petite boîte bleue d'un système
de scripts redoutablement simple et efficace.
Des scripts à vous laisser sans voix
En effet, l'éditeur Voice Editor nous offre un véritable petit langage pour gérer nos applications.
Il comprend deux types de données : les entiers et les chaînes de caractères, sur lesquels il permet d'effectuer
de nombreuses opérations (comparaisons, décalages, opérations mathématiques et logiques, etc.). Il accepte des
labels, des instructions de saut, des instructions conditionnelles de type IF...ELSE, IF...ELSE...ENDIF, etc.
Mais en plus de ces instructions de base, il dispose de fonctions toutes prêtes et fort utiles telles que SOUND
qui joue un son numérisé. SAY qui permet d'utiliser le narrator.device, et LOADPIC, LOADPALETTE et LOADBRUSH, qui
chargent respectivement une image, une palette et une brosse, le tout au format IFF bien sûr. Il est tout
aussi formidable de constater qu'un débutant peut réaliser en une après-midi un logiciel de dessin (même si ce
n'est pas Deluxe Paint 3) entièrement pilotable à la voix grâce à de nombreuses fonctions graphiques comme DRAW,
RECTANGLE, CIRCLE, ELLIPSE ou encore TEXT et SETFONT, juste en appelant ces fonctions de vive voix, après avoir
ouvert de la même façon un écran graphique de son choix.
L'écran du Voice Editor vous donne un aperçu d'un programme de démonstration des fonctions graphiques qui se
trouve sur la disquette : une fonction permet ici de passer l'écran derrière, une autre de tracer un cercle,
et enfin la dernière, de dessiner une ellipse.
L'utilisation la plus intéressante du VoRecOne reste cependant de piloter des logiciels existants ténors dans
leur domaine, entièrement à la voix. C'est pourquoi il est possible de simuler toutes les combinaisons de touches
d'un clavier d'Amiga, les touches de fonctions, les raccourcis clavier des logiciels. De même, il devient
possible d'un seul mot de positionner la souris où l'on veut, ou encore de simuler l'activation d'un gadget,
et donc de gérer entièrement l'Amiga à la voix. L'instruction REXX permet même d'envoyer des commandes aux
programmes intcrfacés avec ARexx.
Deux autres commandes sont particulièrement intéressantes. Il s'agit de NEWWORDS et LOADWORDS, qui permettent
à tout moment de charger un nouveau vocabulaire en mémoire. Quel est l'intérêt ? Tout simplement de fragmenter
un fichier vocabulaire important en plusieurs fichiers de moindres tailles, ce qui permet d'une part d'occuper
moins de place en mémoire en ne chargeant que le fichier intéressant au bon moment et d'autre part d'accroître
la fiabilité du système.
En effet, plus il y a de mots dans son dictionnaire, plus le VoRecOne risque de confondre deux analyses spectrales.
Le fait de fragmenter le dictionnaire en plusieurs dictionnaires moins importants permet donc de diminuer ce risque.
La possibilité de remplacer un vocabulaire par un autre à n'importe quel moment autorise aussi l'utilisateur à
créer des hiérarchies dans ses mots. Supposons un instant que vous vouliez faire reconnaître des phrases entières
au VoRecOne. Vous allez débuter avec un vocabulaire comprenant les débuts de phrases possibles, par exemple les
pronoms personnels et les articles définis et indéfinis (le, la, un, une, je, tu, il, etc.). Si l'ordinateur
reconnaît un pronom personnel vous allez enchaîner en chargeant votre fichier vocabulaire contenant les verbes
(veux, dessine, écris, bouge...) alors que si c'est un article vous opterez pour le fichier vocabulaire contenant
les mots (souris, bouton, gadget, musique...). Et ainsi de suite...
Ce type de hiérarchisation est utilisé avec succès par le TetraVox, système de reconnaissance de la parole conçu au
laboratoire d'informatique médicale de la faculté de médecine de Marseille : le vocabulaire est divisé en sous-menus
correspondant à un affinement successif de la commande à entrer et si deux mots sont trop "voisins"
l'un de l'autre, on s'arrange pour qu'ils se trouvent dans deux sous-menus différents. Remercions Impulse qui ne
nous vend pas le VoRecOne au prix d'un TetraVox, prix que je tairai par pudeur...
Conclusion
Impulse a été le premier à se lancer dans la grande aventure de la reconnaissance vocale sur Amiga. Son premier bébé,
le VoRecOne, est encore tout jeune mais déjà plein de promesses : le logiciel et le langage de programmation des
scripts sont excellents et le taux de reconnaissance tout à fait correct après quelques expérimentations.
L'ensemble ne me paraît tout de même pas encore assez fiable pour des applications scientifiques comme la commande
vocale d'automates (d'ailleurs y a-t-il les cartes nécessaires sur Amiga ?), ou pour le domaine du handicap
où c'est vraiment le minimum acceptable.
Le VoRecOne est un beau jouet qui vous permettra d'animer des soirées
en lançant par exemple les pistes d'un séquenceur MIDI les unes après les autres, à la voix. Mais c'est aussi un
peu plus qu'un simple gadget car il apporte peut-être une nouvelle dimension au monde du multimédia : la reconnaissance
vocale, avec ses commandes toutes faites pour charger sons et images...
Nom : VoRecOne.
Constructeur : Impulse.
Genre : reconnaissance vocale.
Date : 1990.
Prix : 1150 FF.
|
|