Detector de letras

Detector de letras

arte-y-diseño

Detección de texto tensorflow

El detector de texto EAST de OpenCV es un modelo de aprendizaje profundo, basado en una arquitectura y un patrón de entrenamiento novedosos. Es capaz de (1) funcionar casi en tiempo real a 13 FPS en imágenes de 720p y (2) obtener una precisión de detección de texto de última generación.
El detector de texto EAST requiere que estemos ejecutando OpenCV 3.4.2 u OpenCV 4 en nuestros sistemas – si no tienes ya instalado OpenCV 3.4.2 o superior, por favor, consulta mis guías de instalación de OpenCV y sigue la correspondiente a tu respectivo sistema operativo.
A partir de ahí hablaré brevemente del detector de texto EAST, por qué lo usamos y qué hace que el algoritmo sea tan novedoso – también incluiré enlaces al artículo original para que puedas leer los detalles si te apetece.
La detección de texto en entornos limitados y controlados suele realizarse mediante enfoques basados en la heurística, como la explotación de la información del gradiente o el hecho de que el texto suele estar agrupado en párrafos y los caracteres aparecen en línea recta. Un ejemplo de este tipo de detector de texto basado en la heurística puede verse en mi anterior entrada del blog sobre Detección de zonas legibles por máquinas en imágenes de pasaportes.

Detector de letras online

Hoy en día, con el desarrollo de los dispositivos electrónicos, se ha prestado cada vez más atención al procesamiento de texto basado en cámaras. A diferencia de la imagen de la escena, el sistema de reconocimiento de la imagen del documento necesita clasificar los resultados del reconocimiento y almacenarlos en el documento estructurado para el posterior procesamiento de datos. Sin embargo, en las imágenes de documentos, la fusión de las líneas de texto depende en gran medida de su información semántica y no sólo de la distancia entre los caracteres, lo que provoca el problema de la confusión en el aprendizaje. Al mismo tiempo, para los caracteres impresos multidireccionales en las imágenes de documentos, es necesario utilizar información direccional adicional para guiar las tareas de reconocimiento posteriores. Para evitar la confusión en el aprendizaje y obtener resultados de detección favorables al reconocimiento, proponemos un marco de detección de texto a nivel de caracteres, DetectGAN, basado en las redes generativas condicionales adversariales (abreviatura cGAN utilizada en el texto). En el marco propuesto, se eliminan la regresión de posición y el proceso NMS, y el problema de la detección de texto se transforma directamente en un problema de generación de imagen a imagen. Los resultados experimentales muestran que nuestro método tiene un excelente efecto en la detección de texto de imágenes de documentos capturados por cámaras y supera a los algoritmos clásicos y de última generación.

Procesamiento de imágenes de detección de letras

El efecto fue descrito por primera vez por Cattell (1886),[4] y se produjeron importantes contribuciones por parte de Reicher (1969)[5] y Wheeler (1970).[6] Cattell escribió por primera vez: “Encuentro que se tarda aproximadamente el doble de tiempo en leer… palabras que no tienen conexión que palabras que forman frases, y letras que no tienen conexión que letras que forman palabras. Cuando las palabras forman frases y las letras palabras, no sólo se superponen los procesos de ver y nombrar, sino que con un solo esfuerzo mental el sujeto puede reconocer todo un grupo de palabras o letras”[4].
G. Reicher y D. Wheeler desarrollaron el paradigma experimental básico para estudiar el WSE, denominado paradigma Reicher-Wheeler. En este paradigma, se presenta a un observador una cadena de palabras o de no palabras que va seguida de una máscara (estímulo breve para medir los efectos en el comportamiento). A continuación, se pide al observador que nombre una de las letras de la posición indicada en esa palabra o cadena, lo que convierte la prueba en una elección forzada de dos alternativas (2-AFC). Por ejemplo, para la letra R en la palabra “tarjeta”, se puede pedir a un observador que elija entre la letra R y la T, y normalmente será más eficiente al hacerlo que si se le pide que haga la misma elección con la cadena de letras como “cqrd”[1] Cada terminación posible con las dos letras posibles en la condición de palabra produce una palabra.

Explicación de la detección de textos en el este

El detector de metales MB1710A ha sido desarrollado especialmente para detectar artefactos explosivos que contienen metal y partes de dispositivos de ignición en cartas y paquetes pequeños. Como resultado, garantiza un alto nivel de seguridad para las personas que corren un riesgo potencial al recibir y entregar estos envíos. Esto es especialmente apto para centros de correo, embajadas, centros penitenciarios y otras instalaciones de alta seguridad.Otra ventaja de la MB1710A es su rango de uso: La opción de retirar las tiras de guía laterales permite examinar también cartas y paquetes más grandes.