Hola,
Recientemente he actualizado hasta la versión 6.3.12 (desde la 6.3.4) y al parecer la extracción de texto ha dejado de funcionar. Es una instalación en un servidor Windows Server 2012.
Por lo que veo en los logs y en la prueba de extracción de texto, parece que no es capaz de seleccionar la herramienta adecuada. Por ejemplo he visto esto en los logs:
Parece que está intentando convertir un PDF directamente con Tesseract. Por otra parte, probando con la utilidad de test de extracción de texto con un fichero PNG, no saca nada pero además parece que ha intentado usar Abby en lugar de Tesseract:
¿Alguna idea?
Gracias
Recientemente he actualizado hasta la versión 6.3.12 (desde la 6.3.4) y al parecer la extracción de texto ha dejado de funcionar. Es una instalación en un servidor Windows Server 2012.
Por lo que veo en los logs y en la prueba de extracción de texto, parece que no es capaz de seleccionar la herramienta adecuada. Por ejemplo he visto esto en los logs:
Code: Select all
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN com.openkm.util.ExecutionUtils - Abnormal program termination: 3
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN com.openkm.util.ExecutionUtils - CommandLine: [C:/programs/Tesseract/tesseract.exe, C:\openkm\tomcat-7.0.61\temp\okm7795325433645057644.pdf, C:\openkm\tomcat-7.0.61\temp\okm1661771326924541704.txt, -l, spa]
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN com.openkm.util.ExecutionUtils - STDERR: Tesseract Open Source OCR Engine v3.02 with Leptonica
Parece que está intentando convertir un PDF directamente con Tesseract. Por otra parte, probando con la utilidad de test de extracción de texto con un fichero PNG, no saca nada pero además parece que ha intentado usar Abby en lugar de Tesseract:
¿Alguna idea?
Gracias