• Busqueda en Metadatos

  • Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #52078  by juanmc
 
Buenos dias,

Necesito una ayudita.

En una version community 6.3.9 he greado un grupo de metadatos en el que uno de los campos es de tipo texto.
Al hacer una busqueda avanzada en ese campo de metadatos por una palabra, no encuentra resultados.
Algo que no acabo de enteneder, si busco ESCRITURA, no encuentra ningun resultado, si busco ESCRITUR, entonces si que encuentra algunos (no todos)
El tipo de analizador que tengo configurado es hibernate.search.analyzer=org.apache.lucene.analysis.es.SpanishAnalyzer.
Por otro lado, he comprobado que hay casos en las que, aun habiendo metadatos asociados a un nodo, en el índice de ese nodo no hay "Terms" Cuando supongo que al menos deberían aparecer los "Terms" extraidos de los metadatos.

Espero haberme explicado.

Muchas gracias.
 #52085  by jllort
 
Piensa que los documentos no se indexan en tiempo real y igual aun los tienes en la cola de extracción https://docs.openkm.com/kcenter/view/ok ... ctionqueue

Los campos de metadatos se búscan separadamente, es decir, si en un campo de metados tienes el valor "escritura" no vas a poder buscar por contenido este valor, porque depende de un campo de metadatos, esto es importante tenerlo en cuenta.

Si nos pasas algun documento de ejemplo con capturas de pantalla - para entender la búsqueda que estas realizando y el documento que debería aparecer y no aparece - podemos intentar en uno de nuestros entornos de desarrollo reproducir el problema.
 #52095  by juanmc
 
Hola Jillort,
Lo primero, Muchas gracias por contestar.
Y ahora al lío. Efectivamente tengo unas 12.000 extracciones pendientes, pero de un repositorio de más de 100.000 documentos, por lo que la cantidad de resultados que se obtienen al hacer una búsqueda, no tiene sentido.

Esta es la definicion del campo de metadatos:
Descripcion okp:archivo.descripcion 300px 100px TextArea Readonly: false
Data:

Esto, lo que contiene ese campo en varios registros:
ESCRITURA DE NOVACION
ESCRITURA DE AMPLIACION
ESCRITURA CONSTITUCION
[...]

Adjunto va una imagen de como realizo la búsqueda, y no aparece ningún resultado.
Como he dicho antes, con esa misma configuración busco por ESCRITUR, y entonces si da resultados.
Attachments
Capture.PNG
Capture.PNG (28.49 KiB) Viewed 12211 times
 #52116  by jllort
 
Los documentos donde debería aparecer este texto ... son PDF de imágenes o documentos PDF con capa de texto ... de que tipo de documento estamos hablando.

Debería ir a Administration > Tools > Check text extractión y comprobar la extracción de texto para uno de estos documentos ... a ver que es lo que realmente esta haciendo el indexador.
 #52134  by juanmc
 
Buenas,

¿Que importancia tiene el tipo de documento o la extracción de texto?

Estoy buscando los documentos en los que el campo de metadados "Descripcion" contiene la palabra "ESCRITURA".
 #52141  by juanmc
 
Por si le sirve a alguien, he averiguado donde estaba el problema.

En el fichero OpenKM.cfg tenía configurado
Code: Select all
hibernate.search.analyzer=org.apache.lucene.analysis.es.SpanishAnalyzer
Lo configuré pensando que tendría mejores resultados en las búsquedas porque los documentos cargados en el gestor están en ese idioma.....ERROR

Volviendo al
Code: Select all
hibernate.search.analyzer=org.apache.lucene.analysis.standard.StandardAnalyzer
y reconstruyendo el indice de lucene, las busquedas se comportan como es de esperar.
 #52150  by jllort
 
En general el analizador standard funciona bien en la mayoría de escenarios, sólo recomendamos cambiarlo en idiomas tales como los orientales, árabes, etc... de todas formas el resultado con este analizador no debería ser tan malo. Aun así no aconsejamos cambiar de analizador a no ser que el standard presente algún tipo de problemática en los resultados ... entonces si que conviene buscar una alternativa.

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.