Busqueda en Metadatos

Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Forum rules
Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
Post Reply
juanmc
Fresh Boarder
Fresh Boarder
Posts: 5
Joined: Fri Jun 05, 2020 3:09 pm

Busqueda en Metadatos

Post by juanmc »

Buenos dias,

Necesito una ayudita.

En una version community 6.3.9 he greado un grupo de metadatos en el que uno de los campos es de tipo texto.
Al hacer una busqueda avanzada en ese campo de metadatos por una palabra, no encuentra resultados.
Algo que no acabo de enteneder, si busco ESCRITURA, no encuentra ningun resultado, si busco ESCRITUR, entonces si que encuentra algunos (no todos)
El tipo de analizador que tengo configurado es hibernate.search.analyzer=org.apache.lucene.analysis.es.SpanishAnalyzer.
Por otro lado, he comprobado que hay casos en las que, aun habiendo metadatos asociados a un nodo, en el índice de ese nodo no hay "Terms" Cuando supongo que al menos deberían aparecer los "Terms" extraidos de los metadatos.

Espero haberme explicado.

Muchas gracias.
jllort
Moderator
Moderator
Posts: 11479
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: Busqueda en Metadatos

Post by jllort »

Piensa que los documentos no se indexan en tiempo real y igual aun los tienes en la cola de extracción https://docs.openkm.com/kcenter/view/ok ... ctionqueue

Los campos de metadatos se búscan separadamente, es decir, si en un campo de metados tienes el valor "escritura" no vas a poder buscar por contenido este valor, porque depende de un campo de metadatos, esto es importante tenerlo en cuenta.

Si nos pasas algun documento de ejemplo con capturas de pantalla - para entender la búsqueda que estas realizando y el documento que debería aparecer y no aparece - podemos intentar en uno de nuestros entornos de desarrollo reproducir el problema.
juanmc
Fresh Boarder
Fresh Boarder
Posts: 5
Joined: Fri Jun 05, 2020 3:09 pm

Re: Busqueda en Metadatos

Post by juanmc »

Hola Jillort,
Lo primero, Muchas gracias por contestar.
Y ahora al lío. Efectivamente tengo unas 12.000 extracciones pendientes, pero de un repositorio de más de 100.000 documentos, por lo que la cantidad de resultados que se obtienen al hacer una búsqueda, no tiene sentido.

Esta es la definicion del campo de metadatos:
Descripcion okp:archivo.descripcion 300px 100px TextArea Readonly: false
Data:

Esto, lo que contiene ese campo en varios registros:
ESCRITURA DE NOVACION
ESCRITURA DE AMPLIACION
ESCRITURA CONSTITUCION
[...]

Adjunto va una imagen de como realizo la búsqueda, y no aparece ningún resultado.
Como he dicho antes, con esa misma configuración busco por ESCRITUR, y entonces si da resultados.
Attachments
Capture.PNG
jllort
Moderator
Moderator
Posts: 11479
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: Busqueda en Metadatos

Post by jllort »

Los documentos donde debería aparecer este texto ... son PDF de imágenes o documentos PDF con capa de texto ... de que tipo de documento estamos hablando.

Debería ir a Administration > Tools > Check text extractión y comprobar la extracción de texto para uno de estos documentos ... a ver que es lo que realmente esta haciendo el indexador.
juanmc
Fresh Boarder
Fresh Boarder
Posts: 5
Joined: Fri Jun 05, 2020 3:09 pm

Re: Busqueda en Metadatos

Post by juanmc »

Buenas,

¿Que importancia tiene el tipo de documento o la extracción de texto?

Estoy buscando los documentos en los que el campo de metadados "Descripcion" contiene la palabra "ESCRITURA".
juanmc
Fresh Boarder
Fresh Boarder
Posts: 5
Joined: Fri Jun 05, 2020 3:09 pm

Re: Busqueda en Metadatos

Post by juanmc »

Por si le sirve a alguien, he averiguado donde estaba el problema.

En el fichero OpenKM.cfg tenía configurado

Code: Select all

hibernate.search.analyzer=org.apache.lucene.analysis.es.SpanishAnalyzer
Lo configuré pensando que tendría mejores resultados en las búsquedas porque los documentos cargados en el gestor están en ese idioma.....ERROR

Volviendo al

Code: Select all

hibernate.search.analyzer=org.apache.lucene.analysis.standard.StandardAnalyzer
y reconstruyendo el indice de lucene, las busquedas se comportan como es de esperar.
jllort
Moderator
Moderator
Posts: 11479
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: Busqueda en Metadatos

Post by jllort »

En general el analizador standard funciona bien en la mayoría de escenarios, sólo recomendamos cambiarlo en idiomas tales como los orientales, árabes, etc... de todas formas el resultado con este analizador no debería ser tan malo. Aun así no aconsejamos cambiar de analizador a no ser que el standard presente algún tipo de problemática en los resultados ... entonces si que conviene buscar una alternativa.
Post Reply