Page 1 of 1

TextExtraction no selecciona las aplicaciones correctas

PostPosted:Wed Jul 05, 2023 8:31 am
by fdelvalle
Hola,
Recientemente he actualizado hasta la versión 6.3.12 (desde la 6.3.4) y al parecer la extracción de texto ha dejado de funcionar. Es una instalación en un servidor Windows Server 2012.

Por lo que veo en los logs y en la prueba de extracción de texto, parece que no es capaz de seleccionar la herramienta adecuada. Por ejemplo he visto esto en los logs:
Code: Select all
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - Abnormal program termination: 3
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - CommandLine: [C:/programs/Tesseract/tesseract.exe, C:\openkm\tomcat-7.0.61\temp\okm7795325433645057644.pdf, C:\openkm\tomcat-7.0.61\temp\okm1661771326924541704.txt, -l, spa]
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - STDERR: Tesseract Open Source OCR Engine v3.02 with Leptonica

Parece que está intentando convertir un PDF directamente con Tesseract. Por otra parte, probando con la utilidad de test de extracción de texto con un fichero PNG, no saca nada pero además parece que ha intentado usar Abby en lugar de Tesseract:
openkm-tesseract.png
openkm-tesseract.png (46.58 KiB) Viewed 8908 times
¿Alguna idea?
Gracias

Re: TextExtraction no selecciona las aplicaciones correctas

PostPosted:Mon Jul 31, 2023 11:29 am
by jllort
Con la resolución de la captura de pantalla no es demasiado buena y se ve todo borroso. Me ha parecido que estabas intentando pasar por el OCR una imagen?