Page 1 of 1

TextExtractor

PostPosted:Thu Jan 19, 2017 2:28 pm
by gcosta
Buenas tardes, estoy utilizando la versión Community 6.3.2. La pregunta que tengo es porque cuando el textextractor tiene que leer un documento grande, por ejemplo 20MB NO llega a leerlo nunca y tengo que quitarlo de la cola.

Gracias.

Re: TextExtractor

PostPosted:Fri Jan 20, 2017 7:22 pm
by jllort
Este documento de 20MB de que tipo es ( PDF, etc... ) ?
Si es un PDF el contenido son imágenes ?
Cuantas páginas tiene el documento ?

Y a partir de tus respuestas te podremos dar unas cuantas pistas de lo que puede estar pasando

Re: TextExtractor

PostPosted:Mon Jan 23, 2017 4:12 pm
by gcosta
Buenas tardes, el documento es de 33MB, tiene 722 paginas, formato pdf con imágenes, texto y caracteres en Japones.

Gracias.

Re: TextExtractor

PostPosted:Wed Jan 25, 2017 8:47 am
by jllort
El problema es que en la aplicación le ponemos un timeout, tienes un parametro en Administracion > configuration que se llama managed.text.extraction.pool.timeout y el valor que tienes aqui, indica el número de minutos máximos que puede tardar en procesar un documento, si tarda mas, se mata el proceso y vuelta a emprezar. Probablemente incrementando este valor te solucione el problema.