Page 1 of 1

TextExtractorWorker

PostPosted:Tue Sep 15, 2015 2:09 pm
by HGS
Hola,
Tengo una duda sobre la función exacta que realiza el TextExtractorWorker de la aplicación.
Hace unos días que tengo problemas en la cola de trabajos. Se me van quedando ahí los documentos y ya tengo más de 1000. Creo que debido a eso el sistema se está ralentizando.

He leído por ahí que puedo actualizar los documentos en la base de datos con la siguiente consulta:
Code: Select all
UPDATE OKM_DOCUEMENT SET NDC_TEXT_EXTRACTED='T' WHERENDC_TEXT_EXTRACTED='F';
para vaciar la cola. Sin embargo no me atrevo a ejecutar la consulta porque no se que repercusiones puede tener, ¿me puede borrar algún dato de esos documentos?

Os agradezco vuestra ayuda.

Un saludo.

Re: TextExtractorWorker

PostPosted:Thu Sep 17, 2015 11:30 am
by jllort
Esto lo que te va a hacer es marcar todos los documentos pendientes de ser procesados como ya procesados y no se procederá a la extracción de texto ( y por lo tanto no se podrán buscar por contenido ).

Mi sugerencia es que cojas los uuid de los primeros documentos ( que igual son los que estan causando el embudo, alguno debe estar dando problemas por tamaño o complejidad en el mismo ) y realiza un :
Code: Select all
UPDATE OKM_DOCUMENT SET NDC_TEXT_EXTRACTED='T' WHERE NBS_UUID='el uuid del documento'
En vez de desatascar los 1000 documentos, igual siendo un poco mas selectivo el problema te queda mejor resuelto.

Re: TextExtractorWorker

PostPosted:Thu Sep 17, 2015 2:35 pm
by pavila
Sería bueno saber de qué versión de OpenKM estamos hablando, pq puede que el problema se solucione actualizando.