• Resultados de Búsqueda sin considerar la tilde

  • Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Hemos intentado hacer de OpenKM una aplicación lo más intuitiva posible, sin embargo siempre viene bien algún consejo.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #42101  by oswaldochc86
 
Estimados.

Estoy ejecutando la versión 6.3.1 de Openkm. He subido dos documentos

1. educacion uno
2. educación dos (con tilde educación)

Sin embargo al realizar la búsqueda avanzada por nombre, al colocar educacion como parámetro sólo me devuelve el primer documento, me gustaría obtener como resultado los dos documentos, es decir que la búsqueda no considere la tilde.

No quisiera colocar educaci?n* como parámetro.

Es posible realizar esto??

Agradeciendo su atención
 #42105  by jllort
 
Hay que modificar el analizador de lucene que estas utilizando por defecto con uno que no tenga en cuenta los acentos. La versión profesional viene con este analizador por defecto, pero en la community aun no hemos incluido este cambio. Por lo tanto ahora mismo para que esto te funcione en la community deberías crear este analizador ( te podemos intentar orientar sobre este punto ).
 #42136  by oswaldochc86
 
Estimados

He creado un Custom Analizer lo he configurado dentro del parámetro hibernate.search.analyzer
Code: Select all
protected ReusableAnalyzerBase.TokenStreamComponents createComponents(String fieldName, Reader reader) {
    Tokenizer source = new StandardTokenizer(this.matchVersion, reader);
    TokenStream result = new StandardFilter(this.matchVersion, source);
    result = new LowerCaseFilter(this.matchVersion, result);
    result = new StopFilter(this.matchVersion, result, this.stopwords);
    result = new ASCIIFoldingFilter(result);
    
    if (!this.stemExclusionSet.isEmpty()) {
        result = new KeywordMarkerFilter(result, this.stemExclusionSet);
    }
    
    result = new SnowballFilter(result, new SpanishStemmer());
    return new ReusableAnalyzerBase.TokenStreamComponents(source, result);
}
He buscado un problema similar al que tengo y agregaban ISOLatin1AccentFilter si embargo esta función esta deprecated y recomiendan el uso de ASCCIIFoldingFilter, sin embargo no se si esto resolverá el problema que mencione al inicio o si el código que he elaborado le falta ya que al hacer un rebuild indexes igual persiste mi problema.

Agradecería la ayuda que me puedan proporcionar
 #42147  by jllort
 
El rebuild indexes te reconstruye todo el indice, con lo cual si el problema persiste, es que el analizador aun no esta del todo correcto. En el apartado de Administracion > Tools > List indexes
1- click en search indexes
2- pega el uuid de un documento y realiza un click en search
3- te debería aparecer un solo documento, realiza un click en el icono de la derecha
4- en la parte de arriba realiza un click en show terms ( te tienen que aparecer los términos por los que lucene ha indexado el fichero )
 #42148  by oswaldochc86
 
Estimado

Muy agradecido por su respuesta, he realizado los pasos que me ha indicado, he revisado terms y todo se encuentra con minúscula (Adjunto imagen), solamente el campo "name" mantiene la tilde. Tengo que hacer algo adicional para que el nombre del archivo se indexe sin tilde?, o el proceso de búsqueda por nombre solo toma en cuenta los terms.
Attachments
CampoName.jpg
CampoName.jpg (101.92 KiB) Viewed 5047 times
 #42165  by jllort
 
Si deseas compartir el analizador con la comunidad, puedes subir aquí el fichero en cuestión y lo incorporaremos o bien en el código fuente de la versión community o bien en la documentación de la versión 6.3 que estamos terminando.
 #42229  by diegospano
 
@oswaldochc86, podrías comentar como implementaste el nuevo analizador?.

1- cómo lo configuraste?
2- debiste descargar software del sitio de Lucene?.
3- en que path guardaste el analizador?

Muchas gracias.

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.