Open Source Document Management System | OpenKM - TextExtraction no selecciona las aplicaciones correctas

Reply

TextExtraction no selecciona las aplicaciones correctas

#54331 by fdelvalle
Wed Jul 05, 2023 8:31 am

Hola,
Recientemente he actualizado hasta la versión 6.3.12 (desde la 6.3.4) y al parecer la extracción de texto ha dejado de funcionar. Es una instalación en un servidor Windows Server 2012.

Por lo que veo en los logs y en la prueba de extracción de texto, parece que no es capaz de seleccionar la herramienta adecuada. Por ejemplo he visto esto en los logs:

Code: Select all

2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - Abnormal program termination: 3
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - CommandLine: [C:/programs/Tesseract/tesseract.exe, C:\openkm\tomcat-7.0.61\temp\okm7795325433645057644.pdf, C:\openkm\tomcat-7.0.61\temp\okm1661771326924541704.txt, -l, spa]
2023-07-05 09:32:10,088 [http-apr-0.0.0.0-8880-exec-5] [] WARN  com.openkm.util.ExecutionUtils - STDERR: Tesseract Open Source OCR Engine v3.02 with Leptonica

Parece que está intentando convertir un PDF directamente con Tesseract. Por otra parte, probando con la utilidad de test de extracción de texto con un fichero PNG, no saca nada pero además parece que ha intentado usar Abby en lugar de Tesseract:

openkm-tesseract.png (46.58 KiB) Viewed 13772 times

¿Alguna idea?
Gracias

Username

fdelvalle

Rank

Fresh Boarder

Posts

3

Joined

Sat Oct 11, 2014 6:39 pm

Re: TextExtraction no selecciona las aplicaciones correctas

#54359 by jllort
Mon Jul 31, 2023 11:29 am

Con la resolución de la captura de pantalla no es demasiado buena y se ve todo borroso. Me ha parecido que estabas intentando pasar por el OCR una imagen?

Username

jllort

Rank

Moderator

Posts

12099

Joined

Fri Dec 21, 2007 11:23 am

Location

Sineu - ( Illes Balears ) - Spain

Contact

Reply

Page 1 of 1
2 posts