TextExtractor

Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Forum rules
Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
Post Reply
gcosta
Gold Boarder
Gold Boarder
Posts: 187
Joined: Thu Dec 05, 2013 7:43 am

TextExtractor

Post by gcosta » Thu Jan 19, 2017 2:28 pm

Buenas tardes, estoy utilizando la versión Community 6.3.2. La pregunta que tengo es porque cuando el textextractor tiene que leer un documento grande, por ejemplo 20MB NO llega a leerlo nunca y tengo que quitarlo de la cola.

Gracias.

jllort
Moderator
Moderator
Posts: 9637
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: TextExtractor

Post by jllort » Fri Jan 20, 2017 7:22 pm

Este documento de 20MB de que tipo es ( PDF, etc... ) ?
Si es un PDF el contenido son imágenes ?
Cuantas páginas tiene el documento ?

Y a partir de tus respuestas te podremos dar unas cuantas pistas de lo que puede estar pasando

gcosta
Gold Boarder
Gold Boarder
Posts: 187
Joined: Thu Dec 05, 2013 7:43 am

Re: TextExtractor

Post by gcosta » Mon Jan 23, 2017 4:12 pm

Buenas tardes, el documento es de 33MB, tiene 722 paginas, formato pdf con imágenes, texto y caracteres en Japones.

Gracias.

jllort
Moderator
Moderator
Posts: 9637
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: TextExtractor

Post by jllort » Wed Jan 25, 2017 8:47 am

El problema es que en la aplicación le ponemos un timeout, tienes un parametro en Administracion > configuration que se llama managed.text.extraction.pool.timeout y el valor que tienes aqui, indica el número de minutos máximos que puede tardar en procesar un documento, si tarda mas, se mata el proceso y vuelta a emprezar. Probablemente incrementando este valor te solucione el problema.

Post Reply

Who is online

Users browsing this forum: No registered users and 2 guests