De l’utilisation raisonnée des voix de synthèse…

Trop de modules de formation en ligne, outils de communication et serious games sont encore sonorisés avec des voix de synthèse…Est-ce vraiment la meilleure solution ?

En tant que consultante indépendante, je teste beaucoup de réalisations produites par des éditeurs e-learning et serious games du marché. Le salon du serious game à Lyon, qui a lieu en ce moment même, est d’ailleurs l’occasion de vérifier le savoir-faire de plusieurs acteurs du marché.

Souvent très aboutis techniquement, graphiquement réussis, ces outils de formation ou de communication sont encore souvent sonorisés avec des voix de synthèse.

Une uniformisation progressive des contenus produits

Outre le fait que ces voix deviennent vite insupportables à l’écoute, aujourd’hui, tous les produits ainsi sonorisés se ressemblent car les éditeurs utilisent 2 logiciels du marché : Acapela et Loquendo. En langue anglaise, ces voix de synthèse sont en général assez réussies. Mais en version française, les liaisons sont souvent hasardeuses, les voix sont robotisées voire métalliques et les enregistrements nécessitent des ajustements que les concepteurs n’ont pas le temps de réaliser fichier son par fichier son. (Ils optent d’ailleurs souvent pour des batches pour gagner du temps).

Je connais les contraintes budgétaires sur ce type de projet mais, en mon nom, je lance un appel aux éditeurs et à leurs clients : arrêtez de sonoriser vos e-learning et serious games avec des voix de synthèse, cela dénature totalement des réalisations de grande qualité ! Cela gâche tout le travail accompli par les équipes de production !

Le plus réussi des serious games ou des modules e-learning, devient fade voire exaspérant lorsqu’il est sonorisé en voix de synthèse. Au bout de quelques minutes, vous n’entendez plus que les défauts de prononciation et n’êtes plus concentré sur le contenu à proprement parler.

Quand utiliser la voix de synthèse ?

La voix de synthèse, à mon sens, ne devrait être utilisée qu’à des fins de tests ; pour vérifier que les sons sont correctement appelés dans les contenus produits. Une fois ceci fait, il s’agit de remplacer ces sons par de véritables voix de comédiens expérimentés qui donneront vie à votre contenu.

Ne pensez pas que le coût est exhorbitant : il existe d’excellent studios d’enregistrement aux tarifs tout à fait raisonnables.

Ou, pour les budgets les plus modestes, des comédiens freelances disposant d’un équipement suffisant, enregistrent leurs voix à des prix défiant toute concurrence.

Sonoriser les contenus en voix naturelles n’est pas un luxe : c’est une nécessité.

J’entends déjà les éditeurs et les commanditaires mettre en avant le fait que l’usage des voix de synthèse est pratique dans le cas de formation multi-lingues ou dans le cas de contenus devant être mis à jour régulièrement. Oui, il est plus facile de gérer du fichier son de synthèse car si vous devez faire-faire des retouches, vous gagnerez du temps et de l’argent. Mais au final : le jeu en vaut-il la chandelle ? De plus, ce problème peut être contourné justement en utilisant la voix de synthèse jusqu’au dernier moment de la production avant de remplacer les fichiers par de véritables voix. Enfin, sachez que souvent les studios travaillent avec une équipe de comédiens qu’ils connaissent bien et avec qui ils travaillent depuis longtemps : s’il vous venait l’idée de modifier votre contenu (et donc vos fichiers sons) dans 2 ans ou plus, il y a fort à parier que le comédien fera toujours partie du pool de comédiens de votre studio.

Enfin, je pose la question : lorsque vous faites produire un contenu e-learning ou serious-game, avez-vous calculé combien de fois vous avez fait modifier ce contenu dans les 2 à 5 ans après sa mise en ligne ?

La plupart du temps, et sauf exception, les contenus deviennent obsolètes et décision est prise de refaire entièrement un nouveau contenu avec de nouvelles technologies ou de nouveaux outils de production…CQFD.

 

Et si vous n’êtes toujours pas convaincu : je vous assure, un comédien même médiocre sera toujours plus agréable à écouter qu’une voix de synthèse.

En conclusion : si vous aimez vos apprenants ou vos utilisateurs, si vous respectez les équipe de production qui se donnent du mal pour réaliser des contenus de qualité : optez pour des voix humaines plutôt que des voix de synthèse. Tout le monde vous en sera très reconnaissant…


Publié

dans

par

Étiquettes :