• No hace index

  • OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #14113  by thallusete
 
Estoy usando la version Community 5.1.10 Build 7461 sobre WinXP Profesional

Cuando subo un PDF el log me arroja el siguiente error :
Code: Select all
[PdfTextExtractor] PDF does not contains text layer
[PdfTextExtractor] No OCR engine configured
Y no me indexa el interior del PDF. Si desactivo la linea de Tesseract me desaparece el error y si me indexa el contenido.

Uso tessreact 3 y si lo prueba desde linea de comandos me realiza el OCR sin problemas.

¿Alguna idea?

Por cierto, como se puede controlar el numero de mensajes que arroja el server. Es decir quitar los WARN o los INFO y solo dejar los errores.

Saludos
 #14148  by jllort
 
Lo has configurado - el tesseract3 - en los parametros de configuración. Ojo que tienes que modificar también el CuneiformTextExtractor por la classe del extractor del tesseract, me refiero a esta propiedad registered.text.extractors ( mira los valores ) y contrastalos con los que has de tener si tienes el tesseract3, mira aqui la clase del textextractor que le corresponde http://wiki.openkm.com/index.php/OCR

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.