Question:
Comment puis-je obtenir une transcription de base d'un enregistrement audio à l'aide de la reconnaissance vocale?
mmccoo
2011-07-06 19:37:41 UTC
view on stackexchange narkive permalink

J'aime enregistrer les personnes âgées de ma famille. Je pose mon enregistreur sur la table et nous discutons juste. Je traîne juste.

La plupart des images qui en résultent ne sont pas intéressantes, mais parfois, j'obtiens un bijou. Une histoire ancienne racontée d'une manière tout simplement géniale.

J'utilise Google Voice depuis un certain temps maintenant. Il transcrit le message et me l'envoie par SMS. La transcription est souvent amusante, mais généralement assez proche pour comprendre l'essentiel.

La reconnaissance vocale semble donc s'améliorer.

Y a-t-il un moyen de tirer parti de cela pour obtenir une transcription approximative de mes enregistrements. Je pense que ce sera plus facile que d'écouter.

Quatre réponses:
Clint Torres
2011-07-07 01:53:28 UTC
view on stackexchange narkive permalink

Si vous êtes un éditeur vidéo, la dernière version d'Adobe Premiere Pro contient un composant de transcription vocale respectable.

Si vos enregistrements sont très clairs et de haute qualité, alors une idée folle pourrait être de lire l'enregistrement sur Dragon Naturally Speaking. Mais, étant donné la technologie actuelle, je doute qu'une solution logicielle fonctionne bien, et toutes généreront des phrases bizarres.

Mon option préférée est d'envoyer vos fichiers à un tiers pour la transcription. La plupart des services se spécialisent dans les domaines médical et juridique, mais certains transcriront n'importe quel audio pour vous. Le service Jott de Nuance, le principal que je connaissais, venait apparemment d'être supprimé en mai 2011. Une recherche en ligne pour "service de transcription vocale" vous offre une tonne d'options parmi lesquelles choisir, certaines nationales, d'autres offshore. Des services comme celui-ci peuvent vous coûter cher, mais vos résultats seront bien meilleurs qu’une approche logicielle.

Mon expérience de la lecture des systèmes de reconnaissance vocale - et je fais des recherches à ce sujet - est que cela ne fonctionne pas très bien.
Andrew
2011-10-03 12:07:57 UTC
view on stackexchange narkive permalink

Une technique que j'ai essayée est similaire à la suggestion de Clint, mais au lieu de jouer l'enregistrement dans Dragon, vous écoutez l'enregistrement au casque et ensuite dites ce que vous entendez dans Dragon. Cela peut donner de meilleurs résultats car le logiciel de reconnaissance vocale repose sur l'apprentissage de la voix d'une personne pour améliorer sa précision. Vous aurez également l'occasion, en «traduisant», de parler plus clairement que la personne interrogée. Vous pouvez l'essayer en obtenant une version gratuite de l ' application Dragon iPhone. Il est probablement également disponible sur d'autres plates-formes.

Il existe également un logiciel à vendre appelé Boris SoundBite qui, bien qu'il ne fasse pas de transcription, vous permet de rechercher un mot donné parmi des heures et des heures de fichiers vidéo.

Richard Tasker
2012-05-06 00:03:42 UTC
view on stackexchange narkive permalink

Il existe un nouveau microphone de groupe basé sur USB qui peut enregistrer six canaux audio séparés appelés Microcone qui fera exactement ce que vous recherchez. Il possède une application distincte appelée Microcone Recorder qui est parfaite pour enregistrer des groupes, avec elle, vous obtenez une chronologie visuelle avec une indication de qui parlait et vous pouvez baliser des sections de l'enregistrement à la volée.

Il existe également une transcription audio intégrée utilisant Nuance (la société derrière Dragon).

DRMacIver
2011-07-08 12:08:53 UTC
view on stackexchange narkive permalink

Vous pouvez essayer d'utiliser http://speakertext.com/ (je ne les ai pas utilisés personnellement, mais ils ont une bonne réputation).



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...