Calidad variable de las imágenes: Se trabajó con imágenes tomadas desde celulares en condiciones no controladas, con baja iluminación, desenfoques, sombras y ángulos irregulares.
Contenido no estructurado: En ocasiones, las imágenes no contenían recetas médicas sino otros tipos de documentos o incluso fotos irrelevantes, lo que exigió implementar filtros previos de clasificación.
Preprocesamiento de imágenes: Mejora de contraste, eliminación de ruido y corrección de perspectiva para optimizar la legibilidad.
Modelo de clasificación de imágenes: Identificamos automáticamente si una imagen contenía o no una receta válida antes de procesarla.
OCR híbrido (impreso y manuscrito): Se testearon modelos de OCR tradicionales (como Tesseract) combinados con modelos de deep learning entrenados específicamente para interpretar escritura médica manuscrita.
Post-procesamiento y validación semántica: Se estructuró la información extraída y se aplicaron reglas de validación para detectar errores, por ejemplo, reconociendo nombres de medicamentos o validando formatos típicos de cédulas y rut.
Desarrollar un sistema capaz de extraer automáticamente información crítica como el nombre del paciente, diagnóstico o patología y datos del médico tratante, a partir de recetas médicas escaneadas o fotografiadas. Esto con el fin de obtener estadística de los pacientes que fuesen relevantes para la toma de decisiones.
Para lo anterior, se desarrolló una solución que cumpliera con lo siguiente:
- Preprocesamiento de imágenes.
- Modelo de clasificación de imágenes.
- OCR híbrido (impreso y manuscrito).
- Post-procesamiento y validación semántica.