• Búsqueda de texto en contenido no funciona en algunos casos

  • Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #47165  by noesiux
 
Buen día,

Estoy usando la versión de OpenKM Community Version: 6.3.6 (build: 87d181f).

He cargado 1 documento XML ; ha sido cargado correctamente y la extracción de su texto ha sido exitosa, he podido confirmar la extracción del texto usando la utilidad de "Check text extraction" con el UUID del documento:
buscador_1.png
buscador_1.png (69.01 KiB) Viewed 3214 times
buscador_2.png
buscador_2.png (66.27 KiB) Viewed 3214 times
Cuando utilizo el "Buscador de texto libre" puedo buscar correctamente el texto "EEL961104G96":
buscador_5.png
buscador_5.png (42.6 KiB) Viewed 3214 times
El problema es cuando busco el texto "256CC2CE-94A8-45C3-8388-27CA1A5241AA" o alguna parte de dicho texto p.e. "27CA1A5241AA": el buscador no encuentra ningún archivo.
En el ejemplo anterior de búsqueda "buscador_5.png" se puede observar que el texto buscado sí se encuentra indexado:
buscador_6.png
buscador_6.png (42.83 KiB) Viewed 3214 times
Por otra parte, cuando realizo la consulta vía base de datos ( "okm_node_document"."nbs_uuid" ) sí he podido encontrar el texto buscado "256CC2CE-94A8-45C3-8388-27CA1A5241AA":
buscador_7.png
buscador_7.png (30.46 KiB) Viewed 3214 times
¿Qué podría estar pasando con la búsqueda por texto libre?

Agradeceré mucho sus comentarios.

Saludos
 #47187  by jllort
 
Esto creo que es debido al tokenizer de lucene, que por defecto esta haciendo un split utilizando el caracter "-" es decir te esta separando en varias palabras esa parte del texto. Tendrías que modificar el tokenizer por el WhitespaceAnalyzer.
https://docs.openkm.com/kcenter/view/ok ... lyzer.html

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.