Page 1 of 1

Instalación tesseract

PostPosted:Thu Sep 24, 2009 11:09 am
by Jimmydc
hola,
he instalado el paquete Imagemagick y luego tesseract-ocr en Ubuntu 8.04.3
Pero ahora no sé, si realmente está bien istalado. Ya que cuando subo un archivo con texto, en imágenes en pdf, no me indexa las búsquedas.

en OpenKM.cfg tengo la línea:
system.ocr=/usr/bin
que es donde se ha instalado el archivo tesseract.
Es ahí donde tiene que estar? Como puedo comprobar si el OCR funciona correctamente?
Coando arranca el JBoos no aparece ninguna línea que haga mencion al este OCR
Un saludo.

Re:Instalación tesseract

PostPosted:Tue Sep 29, 2009 10:56 am
by jllort
1- Creo que la ruta no la tienes bien, tendria que ser el nombre de la aplicación a la que se la pasa el fichero.

2- Recuerda que cuando modifiques el OpenKM.cfg tienes que reiniciar el jboss, por que la configuración de este fichero unicamente la carga en el momento que arranca el servidor de jboss.

Re:Instalación tesseract

PostPosted:Tue Oct 06, 2009 7:58 am
by Jimmydc
Hola,
he probado a poner todas las URL de los archivos de tesserac y nada.

En /usr/bin tengo el archivo ejecutable tesseract, luego también tengo otra carpeta en
/usr/share/tesseract-ocr.
Pero en ninguna de las dos me aparece ni un apice de que ejecute el OCR una vez reinicio y
subo algún archivo jpg, pdf.
Tengo que activar algo para que me aparezca en consola los errores del tesseract?
Porque no aparece nada de nada.
Un saludo.

Re:Instalación tesseract

PostPosted:Mon Nov 02, 2009 1:10 pm
by pavila
En la property \"system.ocr\" tienes que poner la ruta completa hacia al ejecutable de tesseract. Y por defecto sólo hará OCR sobre las imágenes de tipo TIFF.

Re:Instalación tesseract

PostPosted:Mon Nov 02, 2009 6:08 pm
by jllort
Acuerdate que despues de meter estra property en el fichero OpenKM.cfg tienes que reiniciar el servidor jboss para que esto tenga efecto.