• TextExtraction no selecciona las aplicaciones correctas

  • OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #54331  by fdelvalle
 
Hola,
Recientemente he actualizado hasta la versión 6.3.12 (desde la 6.3.4) y al parecer la extracción de texto ha dejado de funcionar. Es una instalación en un servidor Windows Server 2012.

Por lo que veo en los logs y en la prueba de extracción de texto, parece que no es capaz de seleccionar la herramienta adecuada. Por ejemplo he visto esto en los logs:
Code: Select all
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - Abnormal program termination: 3
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - CommandLine: [C:/programs/Tesseract/tesseract.exe, C:\openkm\tomcat-7.0.61\temp\okm7795325433645057644.pdf, C:\openkm\tomcat-7.0.61\temp\okm1661771326924541704.txt, -l, spa]
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - STDERR: Tesseract Open Source OCR Engine v3.02 with Leptonica

Parece que está intentando convertir un PDF directamente con Tesseract. Por otra parte, probando con la utilidad de test de extracción de texto con un fichero PNG, no saca nada pero además parece que ha intentado usar Abby en lugar de Tesseract:
openkm-tesseract.png
openkm-tesseract.png (46.58 KiB) Viewed 8175 times
¿Alguna idea?
Gracias
 #54359  by jllort
 
Con la resolución de la captura de pantalla no es demasiado buena y se ve todo borroso. Me ha parecido que estabas intentando pasar por el OCR una imagen?

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.