DSpeech – Conversor de textos a audio

Ventana principal de DSpeech con un área de edición del texto y los controles de la síntesis de vozPrograma que permite convertir texto a voz (Text To Speech) utilizando las herramientas del sistema operativo y generando como resultado un archivo de audio en formato WAV, MP3, AAC, WMA u OGG.

Dentro del texto a convertir es posible incorporar marcas que permiten variar las características de la síntesis de voz que se esté usando o cambiar la propia síntesis de voz.  De esta forma resulta muy sencillo que para resaltar textos se utilice unos parámetros de voz o personaje diferente al del resto del documento, o en caso de hacerse referencia a un texto en otro idioma será posible utilizar una síntesis que realice la lectura correcta del texto en el idioma que se encuentre escrito el texto.

Idioma:  Inicialmente se encuentra en inglés, pero por medio de un archivo se puede poner el otros idiomas como el español y el catalán.

Licencia:  El autor permite su libre distribución siempre y cuando se garantice la integridad completa del programa y sin haber sido modificado.

Requisitos.

  • Está disponible para equipos con sistema operativo Windows.
  • Precisa utilizar las síntesis de voz basadas en SAPI.

Accesibilidad.

  • Es posible realizar todas las funciones con teclado y ratón.
  • Utiliza controles estándar de Windows que son accesibles con revisor y magnificador de pantalla.

Instalación y configuración:

Se precisa disponer de síntesis de voz SAPI instaladas en el equipo.

DSpeech no requiere de instalación, sólo descomprimir el archivo ZIP en una carpeta y ejecutar el programa «DSPEECH.EXE«.

Para que DSpeech se encuentre en el idioma deseado, después de descargar el archivo comprimido con la traducción hay que descomprimirlo en una carpeta y copiar el archivo «.LNG» en el misma carpeta en el que se encuentra el programa «DSPEECH.EXE».  Después ejecuta DSpeech y selecciona el nuevo idioma accediendo a la Barra de Menú Options Language selection.

Utilización:

Una vez abierto el programa Dspeech, podemos escribir un texto, pegarlo desde el portapapeles o abrir un archivo TXT, DOC o PDF que tenga el texto que queremos convertir en audio desde el menú Archivo Abrir o pulsando Control + O. Se abrirá una ventana desde donde podemos elegir el archivo como en otros programas de Windows.  El texto del documento aparecerá en la pantalla del programa.

Con los botones de control, o bien, desde los menús podemos hacer que nos lea el texto completo, línea a línea, etc. En la parte derecha hay una serie de listas desplegables donde podemos escoger, entre otras cosas, la voz y la fuente y tamaño de la misma para visualizar en pantalla el texto. También el volumen, la velocidad y el tono de la voz para la lectura.

En el menú Edición podemos activar la opción Ajustar el texto que se encargará de dividir las líneas de texto para poder verlas en pantalla sin necesidad de desplazarnos horizontalmente.

Otra opción interesante del menú de Edición es Eliminar retornos de carro innecesarios. Esta opción hace que Dspeech elimine los saltos de línea innecesarios (cuando hay varios consecutivos) lo que permite una mayor fluidez en la lectura del documento y su conversión a voz.

Conversión de texto a MP3

Para crear el archivo MP3 a partir del texto solo tenemos que ir al menú Archivo y escoger la opción Guardar wav, mp3 u ogg como… También podemos pulsar la combinación Control + Mayúscula + S.

En la siguiente ventana elegimos la carpeta donde queremos crear el archivo de voz, el nombre del archivo y el formato que deseamos WAV o MP3 en la lista desplegable Tipo.

El programa emitirá un pitido indicando que ha comenzado la conversión. El proceso puede durar algún tiempo durante el que puede parecer que el programa ha dejado de funcionar.

Esperar hasta que se emitan dos pitidos, señal de que la conversión ha finalizado. En ese momento se habrá creado el fichero MP3.

Creación de audiolibros

Este programa también dispone de opciones para crear audiolibros. Las más importantes son las que permiten establecer el modo en el que se va a dividir el texto en más de un fichero MP3. Para ello en el menú Opciones elegimos Crear Audiolibros y Opciones de Corte.

Es posible que durante la conversión se generen ficheros de sonido controlando el tamaño por la duración en tiempo con intervalos de 5, 10, 20 o 30 minutos cada uno. También es posible no cortar el audiolibro o utilizando etiquetas, como veremos en el siguiente apartado controlar los cortes manualmente insertando en el texto del documento en los puntos que deseemos de corte la etiqueta #BREAK.

Funciones Avanzadas

Podemos leer documentos o convertirlos directamente desde el Explorador deWindows. Para ello primero hay que activar esta función desde el menú Opciones, Opciones de accesibilidad, Integrar al explorador.

Podemos activar la casilla Convertir a mp3 con DSpeech.  A partir de este momento, pulsando, desde cualquier ventana del explorador de Windows o Mi PC, con el botón derecho del ratón sobre un archivo TXT, DOC o PDF aparecerá esta opción.

Podemos definir una voz para el texto normal y otra para el texto entrecomillado. Esto es muy útil si queremos que el programa nos lea los títulos de los documentos con una voz diferente a la del resto del documento.  Para ello seleccionamos en el menú Opciones la entrada Personalizar la voz en el texto entrecomillado. En la ventana que se abre marcamos el cuadro Usar una voz diferente para el texto entrecomillado y seleccionamos la voz que deseamos de la lista desplegable. Además podemos configurar la velocidad y el tono.

Etiquetas:

La conversión y la lectura puede controlarse insertando etiquetas entre el texto del documento. Las etiquetas se distinguen porque comienzan por el carácter #.

Algunas de las más interesantes son:

  • #VOICE Nombre de voz: Permite modificar la voz que estamos utilizando en la lectura del texto
  • #OPEN fichero.txt: Intercala en este punto la lectura del fichero TXT especificado
  • #STOP: Detiene la lectura
  • #BREAK: A partir de esta etiqueta realiza un corte y crea un nuevo MP3
  • #PLAY fichero.wav o #PLAY fichero.mp3:  Reproduce el archivo WAV o MP3 especificado
  • #WAIT (1-10): Hace una pausa y detiene la reproducción durante los segundos indicados.

Estas etiquetas se pueden escribir manualmente entre el texto en los lugares apropiados o se pueden seleccionar e insertar desde la ventana de texto del programa pulsando el botón derecho del ratón o la tecla de opciones de menú para acceder al menú contextual y elegir «Insertar palabra clave».

Dspeech permite insertar pequeños fragmentos de código entre el texto del documento a modo de programa para controlar la reproducción y conversión. El lenguaje utilizado es similar al Basic. En el menú contextual anterior existen ejemplos de algunos fragmentos de utilización de este código En la documentación del programa se puede encontrar una referencia más completa.

Otras funciones útiles pueden ser controlar aspectos de la voz como la velocidad, tono, volumen y poder modificarlos de forma dinámica desde el documento podemos pulsar el botón derecho para acceder al menú contextual y elegir Insertar etiquetas especiales.

Enlaces:

Deja una respuesta