Page 1 of 1

Búsqueda de texto en contenido no funciona en algunos casos

PostPosted:Sun Dec 16, 2018 10:15 pm
by noesiux
Buen día,

Estoy usando la versión de OpenKM Community Version: 6.3.6 (build: 87d181f).

He cargado 1 documento XML ; ha sido cargado correctamente y la extracción de su texto ha sido exitosa, he podido confirmar la extracción del texto usando la utilidad de "Check text extraction" con el UUID del documento:
buscador_1.png
buscador_1.png (69.01 KiB) Viewed 3219 times
buscador_2.png
buscador_2.png (66.27 KiB) Viewed 3219 times
Cuando utilizo el "Buscador de texto libre" puedo buscar correctamente el texto "EEL961104G96":
buscador_5.png
buscador_5.png (42.6 KiB) Viewed 3219 times
El problema es cuando busco el texto "256CC2CE-94A8-45C3-8388-27CA1A5241AA" o alguna parte de dicho texto p.e. "27CA1A5241AA": el buscador no encuentra ningún archivo.
En el ejemplo anterior de búsqueda "buscador_5.png" se puede observar que el texto buscado sí se encuentra indexado:
buscador_6.png
buscador_6.png (42.83 KiB) Viewed 3219 times
Por otra parte, cuando realizo la consulta vía base de datos ( "okm_node_document"."nbs_uuid" ) sí he podido encontrar el texto buscado "256CC2CE-94A8-45C3-8388-27CA1A5241AA":
buscador_7.png
buscador_7.png (30.46 KiB) Viewed 3219 times
¿Qué podría estar pasando con la búsqueda por texto libre?

Agradeceré mucho sus comentarios.

Saludos

Re: Búsqueda de texto en contenido no funciona en algunos casos

PostPosted:Wed Dec 19, 2018 6:02 pm
by jllort
Esto creo que es debido al tokenizer de lucene, que por defecto esta haciendo un split utilizando el caracter "-" es decir te esta separando en varias palabras esa parte del texto. Tendrías que modificar el tokenizer por el WhitespaceAnalyzer.
https://docs.openkm.com/kcenter/view/ok ... lyzer.html