Page 1 of 1

Omitir Documento TextExtractor

PostPosted:Thu Jan 26, 2017 8:36 am
by gcosta
Buenos días, estoy usando la versión Community 6.3.2.

Mi consulta es si hay alguna forma que cuando un documento el TextExtractor no puede leerlo por el motivo que sea salte al siguiente y no quede ese documento en la cola que no permite que el TextExtractor siga leyendo los demás documentos.

Gracias.

Re: Omitir Documento TextExtractor

PostPosted:Fri Jan 27, 2017 9:49 pm
by jllort
Puede tratarse de que no pueda leer el documento ( lo cual es un problema porque quiere decir que no existe o que por alguna razón no se puede abrir el fichero local ) o de que no pueda procesarlo por alguna razón ( timeout o excepcion ). Para que esto se comporte de la forma que tu quieres deberías realizar una pequeña modificación en el código fuente, de tal forma que cuando se dispara una excepción ( si es el caso ), se marque el documento en la base de datos como indexado ( también seria interesante almacenar en un log estos datos ).

Si estas interesado en el tema, podemos guiarte sobre las clases que deberías tocar.

Re: Omitir Documento TextExtractor

PostPosted:Thu Feb 02, 2017 4:23 pm
by assistant
Buena información y directo al grano. Gracias