• Instalación tesseract

  • OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #3163  by Jimmydc
 
hola,
he instalado el paquete Imagemagick y luego tesseract-ocr en Ubuntu 8.04.3
Pero ahora no sé, si realmente está bien istalado. Ya que cuando subo un archivo con texto, en imágenes en pdf, no me indexa las búsquedas.

en OpenKM.cfg tengo la línea:
system.ocr=/usr/bin
que es donde se ha instalado el archivo tesseract.
Es ahí donde tiene que estar? Como puedo comprobar si el OCR funciona correctamente?
Coando arranca el JBoos no aparece ninguna línea que haga mencion al este OCR
Un saludo.
 #3168  by jllort
 
1- Creo que la ruta no la tienes bien, tendria que ser el nombre de la aplicación a la que se la pasa el fichero.

2- Recuerda que cuando modifiques el OpenKM.cfg tienes que reiniciar el jboss, por que la configuración de este fichero unicamente la carga en el momento que arranca el servidor de jboss.
 #3188  by Jimmydc
 
Hola,
he probado a poner todas las URL de los archivos de tesserac y nada.

En /usr/bin tengo el archivo ejecutable tesseract, luego también tengo otra carpeta en
/usr/share/tesseract-ocr.
Pero en ninguna de las dos me aparece ni un apice de que ejecute el OCR una vez reinicio y
subo algún archivo jpg, pdf.
Tengo que activar algo para que me aparezca en consola los errores del tesseract?
Porque no aparece nada de nada.
Un saludo.
 #3268  by pavila
 
En la property \"system.ocr\" tienes que poner la ruta completa hacia al ejecutable de tesseract. Y por defecto sólo hará OCR sobre las imágenes de tipo TIFF.
 #3273  by jllort
 
Acuerdate que despues de meter estra property en el fichero OpenKM.cfg tienes que reiniciar el servidor jboss para que esto tenga efecto.

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.