OmniPage
Programa que se utiliza para convertir las imágenes de textos tipográficos (letras de máquinas, no manuscritas) que se encuentran en papel, carta, libro, revista, documentos PDF, imágenes, etc. Después de esta conversión es posible editar los textos tal y como se hubieran tecleado.
Este tipo de programas, Reconocedores Ópticos de Caracteres (OCR), son usados por personas ciegas y deficientes visuales para poder leer documentos que les llegan de forma no accesible.
También es utilizado para adaptar los contenidos de libros escolares a las características o código de lecto-escritura de un alumno, Voz, DAISY, Braille, etc…
Desarrollador: Nuance.
Idioma: Se encuentra en multitud de idiomas entre los que se encuentra el español. En Herramientas \ Opciones \ General es posible seleccionar el idioma de OmniPage.
Licencia: El programa es de pago, existiendo distintas versiones dependiendo del uso que se le vaya a dar. Para un uso doméstico sirve la versión más básica, que en el momento de actualizar este artículo tiene un precio aproximado de 70 € a través de la Web del desarrollador.
Requisitos:
- Está disponible para equipos con sistemas operativos Windows 8.1, 8, 7, Vista y Windows XP.
- Para reconocer documentos en papel debe instalar un escáner en el ordenador y sus controladores deben soportar los protocolos WIA, TWAIN o ISIS.
- Precisa conexión a Internet para realizar el registro y activación del programa.
- Se precisa comprensión lectora.
- Es necesario saber desplazarse por los elementos del sistema operativo y los controles de las aplicaciones.
- Es recomendable saber crear y desplazarse por una estructura de carpetas y archivos.
- Es necesario saber editar y desplazarse por textos.
Accesibilidad.
- Se puede manejar con comandos de teclado y puntero del ratón.
- Es accesible con revisores y magnificadores de pantalla, pero antes es recomendable llevar a cabo una serie de configuraciones que se indican más adelante.
- Permite exportar el resultado a otros formatos.
Instalación y configuración.
a continuación se darán unas pautas para configurar el entorno de trabajo de OmniPage de forma que resulte más accesible para Revisores y Magnificadores de Pantalla, teniendo en cuenta que la prioridad sea obtener el mejor entorno para revisar el texto reconocido.
-
- Se aconseja crear un Acceso Directo en el escritorio a OmniPage en el escritorio y asignarle como combinación de teclas rápidas Control + Alt + O.
- En OmniPage 18 desactivar la «Página de inicio«, para ello ejecutar Barra de Menú Ventana Página de inicio.
- En OmniPage 16, 17 y 18 activar la «Vista clásica«, para ello ejecutar Barra de Menú Ventana Vista clásica.
- Deshabilitar “Imagen de la página”, para ello ejecutar Barra de Menú Ventana Imagen de la página.
- Deshabilitar “Administrador de documentos”, para ello ejecutar Barra de Menú Ventana Administrador de documentos.
- Deshabilitar “Miniaturas”, para ello ejecutar Barra de Menú Ventana Miniaturas.
- En OmniPage 18 y 17 seleccionar la Vista de Texto sin formato en el editor para ello ejecutar Barra de Menú Ver Vistas del Editor de Textos Texto sin formato.
- Acceder a las «Opciones» del programa a través de la Barra de menú Herramientas Opciones, y modificar los siguientes parámetros:
-
- En la pestaña «General«:
-
- En OmniPage 18 para que sea posible reconocer imágenes directamente desde procesadores de texto como Microsoft Word, se puede dejar activada la casilla de verificación «Activar Direct OCR«.
- Es posible definir el idioma en el que deseamos se encuentre OmniPage seleccionándolo en el Cuadro Combinado «Idioma» o «Language»
- Desactivar la casilla de verificación «Habilitar detección de actualizaciones«.
-
- En la pestaña «Proceso«:
-
- Desactivar la casilla de verificación «Mantener texto y color de fondo«.
- Desactivar la casilla de verificación «Mantener texto invertido«.
-
- En la pestaña «Verificación«. Desactivar la casilla de verificación «Revisar automáticamente los resultados después del reconocimiento OCR«.
- En la pestaña «General«. Desactivar la casilla de verificación «Habilitar detección de actualizaciones«.
- En la pestaña «General«:
-
- Para ganar velocidad de escaneo en OmniPage, versión inferior a la 18, es posible obtener la imagen en blanco y negro ejecutando Barra de Menú Proceso Obtener página Digitalizar en blanco y negro.
Reconocimiento desde el escáner.
-
- Colocar en el escáner el documento a reconocer.
- Para comenzar los procesos del reconocimiento ejecutando Barra de Menú \ Proceso \ Flujos de trabajo \ Iniciar.
- Para indicar que se desea agregar otra página al documento:
-
- Colocar la nueva página en el escáner.
- Situarse en el botón “Agregar más páginas” pulsando Tabulador y ejecutar la acción pulsando Enter.
-
- Para indicar que la página escaneada era la última situarse en el botón “Dejar de cargar páginas” pulsando Tabulador y confirmar pulsando Enter.
- Para cancelar el Cuadro de Diálogo “Guardar en archivo” si aparece pulsar Escape.
Guardar el documento escaneado en Formato OmniPage.
-
- Sirve para continuar agregando más páginas en otro momento.
- Para que OmniPage pregunte si deseamos guardar los cambios salir del programa pulsando Alt + F4.
- Para que nos pida el nombre del archivo situarnos en el botón “Si” pulsando Tabulador y una vez en él confirmar pulsando Enter.
- Para situarnos en la lista de carpetas y poder seleccionar dónde deseamos dejar el archivo pulsar Mayúscula + Tabulador.
- Para movernos por la lista pulsar Flecha Abajo o Flecha Arriba.
- Para entrar en una carpeta pulsar Enter.
- Para volver a la carpeta anterior pulsar Alt + Flecha izquierda.
- Para volvernos a situar en el nombre del documento pulsar Tabulador.
- Escribir el nombre del archivo para que pueda ser identificado más adelante y pulsar Enter.
Para abrir un documento de OmniPage.
-
- Abrir el Explorador de Windows pulsando Windows + E.
- Para movernos por la lista de carpetas y archivos pulsar Flecha Abajo o Flecha Arriba.
- Para entrar en una carpeta pulsar Enter.
- Para volver a la carpeta anterior pulsar Retroceso.
- Para abrir el archivo de OmniPage en el que nos hemos situado pulsar Enter.
Cargar más páginas al documento actual.
-
- Colocar la nueva página a reconocer en el escáner.
- Para comenzar agregar mas páginas ejecutar Barra de Menú \ Proceso \ Flujos de trabajo \ Iniciar.
- En el Cuadro de diálogo abierto seleccionar “Agregar páginas nuevas y procesarlas junto con todas las existentes sin terminar” pulsando Flecha Abajo o Flecha Arriba. Comenzar la exploración pulsando Enter.
Reconocimiento de un archivo de imagen.
En ocasiones precisamos leer el texto contenido en un archivo de imagen con formatos típicos como son JPG, TIFF, etcétera, pero también esto es extensible a otros tipos de archivos, como por ejemplo PDF.
Hay que recordar que no es posible desplazarse por el texto contenido dentro de una imagen, por ejemplo no es posible desplazarse con el cursor, del mismo modo que una persona que precise un Revisor de Pantalla no podrá leer nada porque se trata de una imagen, que puede o no contener una fotografía de un texto. Por ello, antes de poder acceder al texto, es necesario reconocer la imagen en busca de textos y pasarlos a un formato accesible.
Antes de poder pasar el OCR a un archivo, éste deberá estar en una carpeta a la que podamos acceder desde el Explorador de Archivos. No sirve que esté adjunto en un mensaje de correo electrónico o en un enlace de una página Web, en ambos ejemplos deberíamos antes guardarlo en una carpeta.
Existen varias formas de pasar una imagen a texto, de pendiendo de la versión de OmniPage que dispongamos y de la configuración del mismo nos será posible hacerlo de una u otra manera.
Método 1:
-
- Sin necesidad de entrar en OmniPage, a través del Explorador de Archivos de Windows, seleccionaremos el archivo, pero no lo abriremos.
- Mostraremos el menú contextual asociado al archivo seleccionado pulsando la tecla Menú contextual o de aplicaciones o Mayúscula + F10.
- Seleccionaremos la opción «OmniPage 18 (submenú)» pulsando Flecha Abajo y lo abrimos pulsando Enter.
- En el nuevo submenú seleccionaremos la opción correspondiente al formato en el que deseamos leer el texto, por ejemplo Word, Excell, PDF o RTF, para ello usaremos Flecha Arriba o Flecha Abajo y confirmaremos con Enter.
- El resultado lo podremos ver como un nuevo archivo con el mismo nombre que el original y que se habrá añadido a la misma carpeta.
Método 2:
-
- Estando dentro de OmniPage para que la imagen la cargue de un archivo ejecutar Barra de Menú \ Proceso \ Obtener página \.Cargar archivos.
- Para comenzar los procesos del reconocimiento ejecutar Barra de Menú \ Proceso \ Flujos de trabajo \ Iniciar.
- Solicitará seleccionar los archivos que contienen las imágenes.
- Para situarnos en la lista de carpetas pulsar Mayúscula + Tabulador.
-
- Para moverse por la lista pulsar Flecha Abajo o Flecha Arriba.
- Para entrar en una carpeta pulsar Enter.
- Para volver a la carpeta anterior pulsar Retroceso.
- Para seleccionar archivos consecutivos situarse en el primero y después pulsando Mayúscula + Flecha Abajo seleccionar el resto.
- Para seleccionar archivos salteados situarse en el primero. Para situarse en el siguiente archivo pulsar Control + Flecha Abajo o Control + Flecha Arriba.. Para seleccionar el archivo en el que estamos pulsar Control + Barra espaciadora.
-
- Para comenzar los procesos de reconocimiento pulsar Enter.
Mejorar el reconocimiento.
-
- Sirve para indicar a OmniPage el tipo de documento que se está intentando reconocer y así facilitar la detección de textos y su correcta colocación al editarlo.
- Para seleccionar el formato de documentoejecutar a través de la Barra de Menú Proceso Realizar OCR y seleccionar una de las opciones siguientes:
-
- Automática: El programa intenta deducir las zonas de escaneo y el orden a seguir. Es la opción por defecto.
- Columna única, sin tabla: Para documentos tipo novela con una única columna de texto
- Varias columnas, sin tablas: Para documentos que están formados de varias columnas pero estas no dentro de tablas, por ejemplo Periódicos
- Columna única, con tabla: Para documento escrito a una columna que también incluye tablas, por ejemplo un listado telefónico
- Hoja de cálculo: Para documentos de tipo extracto bancario, facturas o listado de precios
- Documento jurídico.
- Personalizado: Esta opción no es aconsejable si se usa Revisor de Pantalla porque consiste en ir colocando las zonas de textos y el orden con el que tiene que situarse en el texto al reconocerlo.
-
Leer, escribir y modificar textos.
-
- Caracteres:
-
- Un carácter es cada letra, número, signo de puntuación, signo matemático, espacio, etc, que representa, al menos, una pulsación de teclas.
- Para recorrer los caracteres escritos a la derecha pulsamos Flecha Derecha. Se puede mantener apretada la tecla para recorrerlos mas rápido.
- Para comprobar los caracteres escritos a la izquierda pulsamos Flecha Izquierda.
- Para borrar el carácter en el que estamos situados pulsamos la tecla Suprimir.
- Para insertar un carácter delante del carácter en el que estamos situados sólo hay que escribirlo.
-
- Palabras:
-
- Para ir al principio de la palabra siguiente pulsamos Control + Flecha derecha.
- Para ir al principio de la palabra anterior pulsamos Control + Flecha izquierda.
-
- Líneas:
-
- Para leer las líneas siguientes pulsamos Flecha Abajo.
- Para leer las líneas anteriores pulsamos Flecha Arriba.
- Para ir al principio de la línea pulsamos la tecla Inicio.
- Para ir al final de la línea pulsamos la tecla Fin.
-
- Párrafos:
-
- Para desplazarnos al principio del párrafo siguiente pulsamos Control + Flecha abajo.
- Para desplazarnos al principio del párrafo anterior pulsamos Control + Flecha arriba.
-
- Páginas:
-
- Para ir al principio de la página siguiente pulsar Control + Avance de Página.
- Para ir al principio de la página anterior pulsar Control + Retroceso de página.
- Para ir a la primera línea de la página pulsar Control + Inicio.
- Para ir a la última línea de la página pulsar Control + Fin.
- Para eliminar la página actual pulsar Control + D.
-
- Caracteres:
Exportar el texto a un documento a Microsoft Word:
-
- Sirve para:
-
- Realizar modificaciones al texto con el Procesador de Textos Microsoft Word.
- Usar un formato de documento mas extendido que el propio de OmniPage, por ejemplo para enviar el texto por correo electrónico.
-
- Para exportar manualmente el texto ejecutar Barra de Menú \ Exportar \ Resultados \ Guardar en archivos
- Para situarnos en la lista de carpetas pulsar Mayúscula + Tabulador.
- Para movernos por la lista pulsar Flecha Abajo o Flecha Arriba.
- Para entrar en una carpeta pulsar Enter.
- Para volver a la carpeta anterior pulsar Retroceso.
- Para situarnos en el nombre del archivo pulsar Tabulador. Escribir el nombre del archivo para poderlo identificar mas tarde y pulsar Enter.
- Sirve para:
Comandos del lector de OmniPage.
-
- Para activar o desactivar el modo de lenguaje hablado pulsar F5.
- Para realizar una Pausa o Reanudar pulsar Control + 5 del teclado numérico.
- Para leer la palabra actual pulsar Control + uno del teclado numérico.
- Para leer la oración actual pulsar Control + dos del teclado numérico.
- Para leer desde el cursor al final de la oración pulsar Control + seis del teclado numérico.
- Para leer desde el inicio de la oración al cursor pulsar Control + cuatro del teclado numérico.
- Para leer la página actual pulsar Control + tres del teclado numérico.
- Para leer desde el inicio de página al cursor pulsar Control + Inicio.
- Para leer desde el cursor al final de la página pulsar Control + Fin.
- Para aumentar la velocidad pulsar Control + signo de sumar del teclado numérico.
- Para disminuir la velocidad pulsar Control + signo de restar del teclado numérico.
- Para restablecer velocidad pulsar Control + asterisco del teclado numérico.
Comandos de teclado de OmniPage.
-
- Ayuda de la Barra de Herramientas con Control + Mayúscula + L
- Activar Procesamiento Automático con Control + Mayúscula + A
- Activar Procesamiento Manual con Control + Mayúscula + M
- Activar el Asistente de OCR con Control + Mayúscula + O o con Control + Mayúscula + W.
- Ir al cuadro Combinado de Procesamiento Automático con Control + Mayúscula + B
- Seleccionar Obtener Página del Procesamiento Manual con Control + Mayúscula + 1
- Seleccionar Realizar OCR del Procesamiento Manual con Control + Mayúscula + 2
- Seleccionar Exportar Resultados del Procesamiento Manual con Control + Mayúscula + 3
- Ir al Editor de Textos con Control + Mayúscula + T.
Comandos del revisor de pantalla JAWS para OmniPage.
-
- Leer la palabra incorrecta y su sugerencia con JAWSKey + F7.
Reconocer textos directamente desde Microsoft Word:
- Sirve para evitar tener que abrir OmniPage y después exportar desde éste el documento a formato Word para que podamos editarlo desde este procesador de textos.
- Para poderlo llevar a cabo, en las opciones de OmniPage, debe estar activa la opción «Direct OCR»:
- Para activar «Direct OCR» en OmniPage 18 hay que acceder a la Barra de Menú \ Herramientas \ Opciones \ Pestaña «General» y activar la casilla de verificación «Activar Direct OCR«.
- Antes de comenzar el reconocimiento de una imagen debemos ejecutar Microsoft Word.
- En Microsoft Word 2007:
- Para acceder a la barra de cintas pulsar Alt.
- Para desplzarnos hasta «Nuance OCR» pulsar Flecha derecha.
- Para situarse en la opción «Adquirir texto» pulsar Tabulador y ejecutarla pulsando Enter.
Problemas detectados.
Pérdida del foco al terminar reconocimiento.
Para evitar que el foco se pierda en ventanas que no son accesibles cuando se trabaja con revisores de pantalla conviene tener configurada toda la interfaz de OmniPage en forma clásica y lo más limpia posible, a ser posible sólo mostrando el editor de textos, incluso sin la visualización de la Regla de dicho editor.
Si después de haber realizado un reconocimiento de textos y haber concluido la tarea, el foco del sistema operativo desaparece y el revisor de pantalla no responde a los comandos de desplazamiento de texto habituales tendremos que:
-
- Volver a situar el foco en OmniPage, bien accediendo a la lista de tareas abiertas o localizando OmniPage dando sucesivas pulsaciones, a la combinación de teclas Alt + Tabulador (sin levantar la tecla Alt hasta localizar OmniPage).
- Acceder a la Barra de Menú de OmniPage \ Ver \ Editor de textos \ Texto sin formato.
Compatibilidad de escáners.
Con ciertos modelos de escáners para reconocer una imagen siempre es necesario pasar por la interface de usuario que muestra el controlador. Esto ralentiza mucho la tarea al usuario e incluso algunas interfaces de usuario son poco accesibles para manejarlas con un revisor de pantalla.
Hay dos protocolos pensados para evitar estos pasos por las interfaces de los escáneres, el WIA y el TWAIN. Por tanto, el primer paso es adquirir un escáner o dispositivo multifunción cuyo controlador disponga de interface WIA, TWAIN o ambas.
En ocasiones, cuando se usa el alimentador de hojas, el controlador del escáner cambia el comportamiento de las funciones, debe ser comprobado poniendo una hoja directamente en el cristal del escáner y comprobar cómo se comporta al reconocer la imagen.
Para probar el funcionamiento del escáner vía TWAIN o vía WIA se puede seleccionar a través de la Barra de menú de OmniPage accediendo a Herramientas \ Opciones \ pestaña «Escáner«:
- Con el botón «Configuración» es posible añadir el escáner con el controlador TWAIN y WIA. Se pueden instalar ambos, aunque a la hora de seleccionar se decidirá si se quiere hacerlo via TWAIN o vía WIA.
- Con la lista desplegable «Escáner seleccionado» decidiremos el controlador del escáner a utilizar, antes deberemos haberlo configurado con el botón «Configuración».
Conviene probar ambos protocolos WIA y TWAIN. para ver si con alguno se resuelve el problema.
Si OmniPage propone realizar un test del escáner se recomienda realizarlo. Pasará por distintas fases, normalmente: reconocimiento en color, grises, blanco y negro y si dispone de alimentador de páginas una prueba del mismo.
Si con ambas conexiones TWAIN y WIA aparece la interface del usuario al lanzar el reconocmiento del texto desde la Barra de menú de OmniPage \ Procesos \ Flujos de trabajo \ Iniciar, entonces probar la configuración manual de las opciones del escáner:
- Cerrar OmniPage y cualquier aplicación que pueda manejar el escáner.
- Ejecutar el «Asistente de configuración del escáner de Nuance» (ScannerWizardU.exe). Se puede tratar de localizar con el cuadro de búsqueda de Windows o manualmente accediendo a una carpeta similar a «C:\Program Files\Nuance\OmniPage18».
- Seleccionar el escáner con su correspondiente protocolo, para ello también puede ayudarse de los apuntes que se dan un poco más adelante con los escáneres valorados.
- Para acceder a los parámetros de configuración que deberemos manipular pulsar el botón «Configuración…«.
- En la siguiente ventana se informa del escáner que se va a configurar, pulsar el botón «Siguiente«.
- En la siguiente ventana se puede seleccionar el tipo de configuración a realizar. Se supone que ya hemos tratado de realizar la configuración «Modo a prueba de errores» y no ha funcionado, por tanto ahora deberemos seleccionar «Cuestom mode (modo personalizado)«.
- Para poder modificar manualmente cada sugerencia propuesta sobre el escáner, entre ellas la aparición de la interface de usuario, hay que pulsar el botón «Revisar sugerencias…«.
- Para poder modificar cada sugerencia, en la siguiente ventana, pulsar el botón «Editar sugerencias…«.
- En la siguiente ventana se muestran las sugerenicas. Las que son tenidas en cuenta se muestran en la lista de la derecha. Si la sugerencia que debemos modificar no está en la lista de la derecha debemos pasarla con el botón «Agregar =>».
- Para modificar la sugerencia seleccionada en la lista de la derecha pulsar el botón «Modificar sugerencia…«
- Según el modelo del escáner y el protocolo seleccionado el parámetro a modificar varía. Más adelante se proporcionan unas orientaciones.
- Para concluir con las modificaciones pulsar el botón «Aceptar» y volveremos al «Asistente de configuración del escáner de Nuance».
- En la última pantalla se comunicará que la configuración ya se ha realizadao, deberemos pulsar el botón «Finalizar«.
- Después ya se puede volver a probar el reconocimiento de textos desde OmniPage.
Fuentes, colabores y biblioteconomía.
- Luis Alberto Hernández Yebra, Instructor de Tiflotecnología de la ONCE.
Recursos disponibles.
- Web de Nuance OmniPage, Nuace.
- Descargar «Guía de uso básico de OmniPage» escrita por César Lebrón Safra.
- Guía sobre Pautas básicas para uso de OCR. publicada por el CIDAT de la ONCE.
- Guía sobre Programas OCR gratuitos publicada por el CIDAT de la ONCE.
- Herramientas y utilidades similares.