Julio 2005

I KNOW

Reconocimiento Óptico de Caracteres (OCR)
(Línea: Identificación Automática)

El reconocimiento óptico de caracteres, ampliamente conocido como OCR por sus siglas en Inglés, implica sistemas de cómputo diseñados para traducir imágenes de texto mecanografiado (usualmente capturado por un scanner) a texto editable por una máquina, o dicho de otra forma, es traducir la imagen de un caracter en un esquema de codificación estándar que los represente, como ASCII o Unicode. El OCR comenzó como una investigación de campo de inteligencia artificial y visión de máquinas. Aunque la investigación académica en el campo continua, el enfoque dado al OCR ha cambiado hacia la implementación de técnicas probadas, como el hacer editable el texto digitalizado por un scanner de cama plana o la Identificación Automática.

Texto Mecanografiado, Script y en Cursivas

Mientras que el reconocimiento preciso de caracteres script del alfabeto latino es un problema que se considera prácticamente resuelto, el reconocimiento de caracteres escritos a mano y las versiones impresas de otros alfabetos, particularmente los que tienen un gran número de caracteres son aún sujetos de investigación activa.

Los sistemas para el reconocimiento de escritura al escribir han gozado de un buen éxito comercial en los últimos años, entre ellos se encuentran los dispositivos de entrada de las PDA's y terminales portátiles con touch screen. Los algoritmos usados en estos dispositivos toman ventaja de que son bien conocidos el orden, velocidad y dirección de segmentos de líneas individuales. Además, el usuario puede ser restringido al uso de formas de letras específicas.

Estos métodos no pueden ser utilizados en software que digitaliza o "escanea" documentos impresos, por lo cual el reconocimiento de los textos escritos a mano es un gran problema aún. En el mejor de los casos se encuentran decenas de errores por página. En cuanto a las palabras escritas con letras "cursivas" el problema es aún mayor, siendo una mejor opción el identificar palabras completas en un contexto, pero esto aún es muy difícil de lograr.


Lector de Cheques ST8300

MICR

Un área donde la precisión y velocidad de lectura de caracteres de las computadoras exceden por mucho las de los humanos es en la Lectura de Caracteres de Tinta Magnética (MICR), donde las tasas de error rondan una lectura por cada 20,000 a 30,000 cheques.

Algo de Historia

En los E.U. el Servicio Postal ha utilizado máquinas OCR para clasificar el correo desde 1965 basándose principalmente en tecnología del prolífico inventor Jacob Rainbow. Canadá ha utilizado sistemas OCR desde 1971. Los sistemas basados en OCR leen el nombre y domicilio del destinatario del correo en el primer centro de clasificación automatizado e imprimen en el sobre un código de barras para su direccionamiento basándose en el código postal. Después de eso, las cartas sólo necesitan ser clasificadas en otros centros con sistemas menos costosos de código de barras. Para evitar sobreponer el código de barras a la dirección del destinatario, que puede estar en cualquier lugar del sobre, se utiliza tinta ultravioleta para los códigos de barras. Dicha tinta luce de un color anaranjado en condiciones normales de iluminación.

EL OCR Hoy

En la industria de la Identificación Automática, el OCR se utiliza principalmente en los lectores de código de barras tipo imager (con capacidades de captura de imágenes) tales como el IT4620 de Hand Held Products para leer las fuentes OCR-A y OCR-B. Estas dos fuentes fueron diseñadas especialmente para ser leídas por máquinas, por lo que son muy claras y sus caracteres son muy fáciles de distinguir unos de otros, de ese modo la posibilidad de errores es prácticamente cero. Las fuentes OCR-A y B pueden ser utilizadas para imprimir cualquier texto, siendo parte de una gran gama de aplicaciones en donde la máquina y el hombre pueden leer directamente la misma información.

 

Fuente OCR-A

 

Fuente OCR-B


Información Relacionada:

Para mayor información póngase en contacto con nuestro Departamento de Ventas


Todas las marcas y nombres de productos aquí contenidos están registrados en favor de sus respectivos propietarios. TEC Electrónica no se responsabiliza en ninguna forma por que la información aquí mostrada sea imprecisa o incorrecta ni por cualquier tipo de daños ocasionados por su empleo. 

© TEC Electrónica, S.A. de C.V. 2005

http://www.tec-mex.com.mx