Page 1 of 1
Instalación de OCR en Windows
PostPosted:Fri Jun 01, 2012 6:20 pm
by fj.leon
Saludos, he notado que no hay documentación para instalar OCR en Windows. Me baje tesseract 3.01 para windows incluyendo el idioma ingles y español y en el archivo de configuración coloqué:
system.ocr=c:\ocr\tesseract.exe
incluso probé colocando doble barra y nada. Reinicié openkm después de cada prueba.
Se requiere algún componente adicional para hacerlo funcionar?
Una vez que funcione, que diferencia voy a observar en la interfaz de openkm, simplemente que a la hora de hacer una búsqueda de alguna palabra me va a ubicar el documento que la contiene?
Tengo la versión 5.1.8 en windows server 2003 r2.
Re: Instalación de OCR en Windows
PostPosted:Sat Jun 02, 2012 2:24 pm
by jllort
También tienes el cuneiform que da excelentes resultados, yo creo que mejores que el tesseract
http://cognitiveforms.ru/products/cuneiform/
Lo segundo que te aconsejaría es que saltes a la version 5.1.9 pero ten en cuenta que los parametros de configuración para el tesseract o cuneiform aquí cambian un poco
http://wiki.openkm.com/index.php/Migrat ... 8_to_5.1.9 ( te aconsejo subir de versión por que solucionamos algun bug de la 5.1.8 y no recuerdo exactamente si era por un tema de la previsualiación con el openoffice / libreoffice o por el tema del ocr, en cualquier caso es buena idea saltar a la 5.1.9 )
Re: Instalación de OCR en Windows
PostPosted:Sun Jun 03, 2012 4:05 pm
by fj.leon
amigo gracias por responder, pero serias tan amable de decirme si tu has logrado hacer funcionar OCR en windows y cuales son los pasos que seguiste para instalarlo? Yo acabo de montar 5.1.9 en mi propio equipo para comenzar desde cero. Se requiere openoffice, imagemagick u otros componentes? Funcionaria libreoffice? La documentación está muy falla y basicamente solo dice que instales tesseract y coloques una linea en el archivo de configuración y reinicies openkm.
Re: Instalación de OCR en Windows
PostPosted:Tue Jun 05, 2012 7:22 am
by jllort
Lo primero que tienes que hacer es ejecutar desde windows el teserract o el ocr que hayas seleccionado como si se ejecutase desde openkm, para comprobar que no tienes ningun problema con el windows. OpenKM lo único que hace es lanzar esa petición al sistema,es decir si te funciona desde el terminal también te funcionará desde OpenKM.
Relativo a libreoffice, imagemagick, pdf2wfs etc... esto es para la conversión de ficheros. Haz las cosas paso a paso, cuando tengas un tema resuelto pon otro post para la previsualización, pero no mezclemos cosas en el mismo post.