textExtractor

Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Forum rules
Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
Post Reply
gcosta
Gold Boarder
Gold Boarder
Posts: 214
Joined: Thu Dec 05, 2013 7:43 am

textExtractor

Post by gcosta »

Buenos días, desde que actualize de la versión Comunity 6.3.0 a la Comunity 6.3.1 he detectado que me han quedado ficheros del proceso textExtractor en cola y no hay manera que salgan.

He intentado ejecutar manualmente el cron pero siguen allí.

Como puedo vaciar la lista?

Gracias.
jllort
Moderator
Moderator
Posts: 11286
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: textExtractor

Post by jllort »

Lo interesante seria procesarlos. Primero mira en el log a ver si te aparece algún error ( hay una tarea en el crontab que se llama "text extractor" -> ejecutala y mira el catalina.log a ver si acontece algún error ).
gcosta
Gold Boarder
Gold Boarder
Posts: 214
Joined: Thu Dec 05, 2013 7:43 am

Re: textExtractor

Post by gcosta »

Buenos días, lo solucione eliminando un archivo pendiente.

Gracias.
jllort
Moderator
Moderator
Posts: 11286
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: textExtractor

Post by jllort »

Ese fichero te estaba bloqueando la cola, que tipo de fichero era ?
Otro problema es que solo procesas un fichero a la vez, lee esta parte http://wiki.openkm.com/index.php/Applic ... extraction ( para procesar varios documentos en varias cpu's )
gcosta
Gold Boarder
Gold Boarder
Posts: 214
Joined: Thu Dec 05, 2013 7:43 am

Re: textExtractor

Post by gcosta »

Era un pdf de 9Mb, pero ha leído ficheros más grandes.
jllort
Moderator
Moderator
Posts: 11286
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: textExtractor

Post by jllort »

A veces no es tanto el tamaño sino la complejidad a nivel de capas que pueda tener el documento.
gcosta
Gold Boarder
Gold Boarder
Posts: 214
Joined: Thu Dec 05, 2013 7:43 am

Re: textExtractor

Post by gcosta »

Buenos días, me vuelvo a encontrar con otro documento que me hay manera que salga de la cola del textextractor.

Alguien podría indicarme como quitar el documento de la cola para que el proceso puede seguir con los demás documentos?

Gracias.
jllort
Moderator
Moderator
Posts: 11286
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: textExtractor

Post by jllort »

Te vas a la administracion -> Database query
la tabla que te interesa se llaman OKM_NODE_DOCUMENT y ejecutas una consulta del tipo:
update OKM_NODE_DOCUMENT NDC_TEXT_EXTRACTED='T' where NBS_UUID='XXXXXX';

El uuid del documento lo puedes sacar del Desktop -> pestaña de propiedades -> de ahí puedes copiar el uuid o desde la misma ventana del text extractor.

Si nos puedes pasar un documento problemático ( que no sea sensible para tu organización ) igual podemos descubrir que esta pasando con mas detalle.
gcosta
Gold Boarder
Gold Boarder
Posts: 214
Joined: Thu Dec 05, 2013 7:43 am

Re: textExtractor

Post by gcosta »

Buenos días, perfecto jllort. Solo comentar por si alguien necesita realizar esa acción que el campo es NDC_TEXT_EXTRACTED.

Referente al documento, lo siento pero es información sensible y no puedo compartirla en el foro.

Muchas gracias por la ayuda.
jllort
Moderator
Moderator
Posts: 11286
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: textExtractor

Post by jllort »

Si nos lo quieres enviar de forma privada. Ponte en contacto con el formulario de nuestra web en http://www.openkm.com/es/contacto.html indicando la url de este foro y la necesidad de un canal seguro para enviar el mismo y nos lo miraremos.

Nosotros trabajamos con clientes que tienen niveles de seguridad altamente sensibles y para nosotros es muy importante proporcionar garantías totales. Esto lo hacemos extensible no solo a los clientes sino también a los usuarios de la versión community. De hecho si alguna vez has contactado con nosotros preguntando sobre la versión profesional o en la web ( que espero en enero ya tengamos la nueva versión ) veras que damos escasas o ninguna referencia de nuestros clientes. Podemos hablar de sectores como banca, finanzas, sanidad, admistración pública, ingeniería, petroleras y eléctricas entre otras. Pero en general no creo que hayas visto ninguna página ni información con nombres y detalles. Excepto si nos piden referencias, que entonces tenemos algún grupo meridianamente representativo ( al que se le ha solicitado permiso previamente, únicamente con este fin ), no nos gusta proporcinar nombres. Creemos que el mejor marketing que podemos hacer es que no vamos a dar ni el nombre de tu empresa. De todas formas si consigues emular el problema con un documento que no sea crítico mucho mejor y le pegamos un ojo a ver que puede estar pasando.
Post Reply