Page 1 of 1

No me busca por contenido

PostPosted:Fri May 29, 2015 8:42 am
by dvarela
Hola.

Tengo una instalación de pruebas de OpenKm 6.3.0 sobre RedHat EL6. Para la extracción de texto en los documentos he instalado y configurado el tesseract 3. He visto los logs y he comprobado que extrae el texto correctamente. También he hecho pruebas con el Text Extractor de las "Utilidades" y el resultado parece correcto.

Sin embargo si hago una busqueda por contenido no me muestra ningun resultado. ¿Me he dejado algo en el camino?

Un saludo

Re: No me busca por contenido

PostPosted:Fri May 29, 2015 6:00 pm
by jllort
Primero, el contenido no se indexa inmediatamente después de insertar un documento, tiene que ser procesado por la cola. Si el documento ya no está en la cola y no localizas la información entonces si que hay un problema.

Asegurate, aunque tengas el tesseract que en los extractors ( parametro de configuración en la administración ) también tienes puesta la clase que se corresponde con el tesseract y que has eliminado la del cuneiform ( si es que estaba esta presente previamente )

Puedes probar en nuestra demo.openkm.com -> sube el fichero, espera 20-30 minutos y intenta buscar por contenido a ver si te aparece.

Mira en la base de datos :
Code: Select all
select * from OKM_NODE_DOCUMENT WHERE NBS_UUID='UUID del documento';
Hay una fila que te indica ( T o F ) si el texto ya ha sido procesado ( NDC_TEXT_EXTRACTED ) y el contenido extraído ( NDC_TEXT ) si esta a T y el texto esta vacio, entonces hay un problema en algún sitio. Pero primera chequea estos dos puntos.