• Problemas OCR en .pdf

  • OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #26038  by suruc
 
Buenas tardes, tengo el siguiente problema:
Cuando subo un documento en .pdf con o sin capa de texto en OCR no logra hacer búsqueda por contenido.
Cuando pre visualizo el documento si puedo detectar la capa de texto y seleccionar las letras, pero cuando hago un search al repositorio no me arroja ningun resultado, en cambio si subo un documento .tiff, si me hace el OCR y me indexa la capa de texto y el documento queda con searcheable por contenido.
Quisiera saber como configuro el tesseract para que me haga OCR a todos los archivos .pdf y me deje toda esa capa de texto indexada y lista para poder hacer búsqueda de contenido.

Gracias :wink:

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.