Page 1 of 1

textExtractor

PostPosted:Wed Dec 09, 2015 11:27 am
by gcosta
Buenos días, desde que actualize de la versión Comunity 6.3.0 a la Comunity 6.3.1 he detectado que me han quedado ficheros del proceso textExtractor en cola y no hay manera que salgan.

He intentado ejecutar manualmente el cron pero siguen allí.

Como puedo vaciar la lista?

Gracias.

Re: textExtractor

PostPosted:Thu Dec 10, 2015 2:49 pm
by jllort
Lo interesante seria procesarlos. Primero mira en el log a ver si te aparece algún error ( hay una tarea en el crontab que se llama "text extractor" -> ejecutala y mira el catalina.log a ver si acontece algún error ).

Re: textExtractor

PostPosted:Fri Dec 11, 2015 8:06 am
by gcosta
Buenos días, lo solucione eliminando un archivo pendiente.

Gracias.

Re: textExtractor

PostPosted:Sat Dec 12, 2015 9:40 am
by jllort
Ese fichero te estaba bloqueando la cola, que tipo de fichero era ?
Otro problema es que solo procesas un fichero a la vez, lee esta parte http://wiki.openkm.com/index.php/Applic ... extraction ( para procesar varios documentos en varias cpu's )

Re: textExtractor

PostPosted:Sat Dec 12, 2015 10:25 am
by gcosta
Era un pdf de 9Mb, pero ha leído ficheros más grandes.

Re: textExtractor

PostPosted:Tue Dec 15, 2015 8:05 pm
by jllort
A veces no es tanto el tamaño sino la complejidad a nivel de capas que pueda tener el documento.

Re: textExtractor

PostPosted:Fri Dec 18, 2015 11:57 am
by gcosta
Buenos días, me vuelvo a encontrar con otro documento que me hay manera que salga de la cola del textextractor.

Alguien podría indicarme como quitar el documento de la cola para que el proceso puede seguir con los demás documentos?

Gracias.

Re: textExtractor

PostPosted:Sat Dec 19, 2015 6:42 pm
by jllort
Te vas a la administracion -> Database query
la tabla que te interesa se llaman OKM_NODE_DOCUMENT y ejecutas una consulta del tipo:
update OKM_NODE_DOCUMENT NDC_TEXT_EXTRACTED='T' where NBS_UUID='XXXXXX';

El uuid del documento lo puedes sacar del Desktop -> pestaña de propiedades -> de ahí puedes copiar el uuid o desde la misma ventana del text extractor.

Si nos puedes pasar un documento problemático ( que no sea sensible para tu organización ) igual podemos descubrir que esta pasando con mas detalle.

Re: textExtractor

PostPosted:Mon Dec 21, 2015 11:21 am
by gcosta
Buenos días, perfecto jllort. Solo comentar por si alguien necesita realizar esa acción que el campo es NDC_TEXT_EXTRACTED.

Referente al documento, lo siento pero es información sensible y no puedo compartirla en el foro.

Muchas gracias por la ayuda.

Re: textExtractor

PostPosted:Tue Dec 22, 2015 12:20 pm
by jllort
Si nos lo quieres enviar de forma privada. Ponte en contacto con el formulario de nuestra web en http://www.openkm.com/es/contacto.html indicando la url de este foro y la necesidad de un canal seguro para enviar el mismo y nos lo miraremos.

Nosotros trabajamos con clientes que tienen niveles de seguridad altamente sensibles y para nosotros es muy importante proporcionar garantías totales. Esto lo hacemos extensible no solo a los clientes sino también a los usuarios de la versión community. De hecho si alguna vez has contactado con nosotros preguntando sobre la versión profesional o en la web ( que espero en enero ya tengamos la nueva versión ) veras que damos escasas o ninguna referencia de nuestros clientes. Podemos hablar de sectores como banca, finanzas, sanidad, admistración pública, ingeniería, petroleras y eléctricas entre otras. Pero en general no creo que hayas visto ninguna página ni información con nombres y detalles. Excepto si nos piden referencias, que entonces tenemos algún grupo meridianamente representativo ( al que se le ha solicitado permiso previamente, únicamente con este fin ), no nos gusta proporcinar nombres. Creemos que el mejor marketing que podemos hacer es que no vamos a dar ni el nombre de tu empresa. De todas formas si consigues emular el problema con un documento que no sea crítico mucho mejor y le pegamos un ojo a ver que puede estar pasando.