Open Source Document Management System | OpenKM - Resultados de Búsqueda sin considerar la tilde

Resultados de Búsqueda sin considerar la tilde

Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.

11 posts

11 posts

Resultados de Búsqueda sin considerar la tilde

#42101 by oswaldochc86
Tue Aug 02, 2016 8:08 pm

Estimados.

Estoy ejecutando la versión 6.3.1 de Openkm. He subido dos documentos

1. educacion uno
2. educación dos (con tilde educación)

Sin embargo al realizar la búsqueda avanzada por nombre, al colocar educacion como parámetro sólo me devuelve el primer documento, me gustaría obtener como resultado los dos documentos, es decir que la búsqueda no considere la tilde.

No quisiera colocar educaci?n* como parámetro.

Es posible realizar esto??

Agradeciendo su atención

Username

oswaldochc86

Rank

Fresh Boarder

Posts

Joined

Mon Jun 06, 2016 3:04 pm

Re: Resultados de Búsqueda sin considerar la tilde

#42105 by jllort
Wed Aug 03, 2016 4:13 pm

Hay que modificar el analizador de lucene que estas utilizando por defecto con uno que no tenga en cuenta los acentos. La versión profesional viene con este analizador por defecto, pero en la community aun no hemos incluido este cambio. Por lo tanto ahora mismo para que esto te funcione en la community deberías crear este analizador ( te podemos intentar orientar sobre este punto ).

Username

jllort

Rank

Moderator

Posts

12128

Joined

Fri Dec 21, 2007 11:23 am

Location

Sineu - ( Illes Balears ) - Spain

Contact

Re: Resultados de Búsqueda sin considerar la tilde

#42108 by oswaldochc86
Thu Aug 04, 2016 1:03 pm

Gracias mi estimado, le agradecería mucho la guía que me pudiera ofrecer para modificar el analizador de lucene.

Username

oswaldochc86

Rank

Fresh Boarder

Posts

Joined

Mon Jun 06, 2016 3:04 pm

Re: Resultados de Búsqueda sin considerar la tilde

#42114 by cgarcia
Fri Aug 05, 2016 8:08 am

Para esto hay que crear un custom analyzer basado en StandardAnalyzer:

http://wiki.openkm.com/index.php/Indexing_configuration

https://lucene.apache.org/core/3_1_0/ap ... lyzer.html

Espero que esto te sirva de ayuda

Username

cgarcia

Rank

Fresh Boarder

Posts

Joined

Fri Aug 05, 2016 7:52 am

Re: Resultados de Búsqueda sin considerar la tilde

#42117 by oswaldochc86
Fri Aug 05, 2016 1:09 pm

Gracias cgarcia, voy a revisar la información de los enlaces que me envió

Username

oswaldochc86

Rank

Fresh Boarder

Posts

Joined

Mon Jun 06, 2016 3:04 pm

Re: Resultados de Búsqueda sin considerar la tilde

#42136 by oswaldochc86
Mon Aug 08, 2016 8:10 pm

Estimados

He creado un Custom Analizer lo he configurado dentro del parámetro hibernate.search.analyzer

Code: Select all

protected ReusableAnalyzerBase.TokenStreamComponents createComponents(String fieldName, Reader reader) {
    Tokenizer source = new StandardTokenizer(this.matchVersion, reader);
    TokenStream result = new StandardFilter(this.matchVersion, source);
    result = new LowerCaseFilter(this.matchVersion, result);
    result = new StopFilter(this.matchVersion, result, this.stopwords);
    result = new ASCIIFoldingFilter(result);
    
    if (!this.stemExclusionSet.isEmpty()) {
        result = new KeywordMarkerFilter(result, this.stemExclusionSet);
    }
    
    result = new SnowballFilter(result, new SpanishStemmer());
    return new ReusableAnalyzerBase.TokenStreamComponents(source, result);
}

He buscado un problema similar al que tengo y agregaban ISOLatin1AccentFilter si embargo esta función esta deprecated y recomiendan el uso de ASCCIIFoldingFilter, sin embargo no se si esto resolverá el problema que mencione al inicio o si el código que he elaborado le falta ya que al hacer un rebuild indexes igual persiste mi problema.

Agradecería la ayuda que me puedan proporcionar

Username

oswaldochc86

Rank

Fresh Boarder

Posts

Joined

Mon Jun 06, 2016 3:04 pm

Re: Resultados de Búsqueda sin considerar la tilde

#42147 by jllort
Wed Aug 10, 2016 4:42 pm

El rebuild indexes te reconstruye todo el indice, con lo cual si el problema persiste, es que el analizador aun no esta del todo correcto. En el apartado de Administracion > Tools > List indexes
1- click en search indexes
2- pega el uuid de un documento y realiza un click en search
3- te debería aparecer un solo documento, realiza un click en el icono de la derecha
4- en la parte de arriba realiza un click en show terms ( te tienen que aparecer los términos por los que lucene ha indexado el fichero )

Username

jllort

Rank

Moderator

Posts

12128

Joined

Fri Dec 21, 2007 11:23 am

Location

Sineu - ( Illes Balears ) - Spain

Contact

Re: Resultados de Búsqueda sin considerar la tilde

#42148 by oswaldochc86
Wed Aug 10, 2016 9:45 pm

Estimado

Muy agradecido por su respuesta, he realizado los pasos que me ha indicado, he revisado terms y todo se encuentra con minúscula (Adjunto imagen), solamente el campo "name" mantiene la tilde. Tengo que hacer algo adicional para que el nombre del archivo se indexe sin tilde?, o el proceso de búsqueda por nombre solo toma en cuenta los terms.

Attachments

CampoName.jpg (101.92 KiB) Viewed 7612 times

Username

oswaldochc86

Rank

Fresh Boarder

Posts

Joined

Mon Jun 06, 2016 3:04 pm

Re: Resultados de Búsqueda sin considerar la tilde

#42162 by oswaldochc86
Mon Aug 15, 2016 9:04 pm

Para solucionar el caso planteado revisé el @FieldBridge del campo name y he modificado su impl para que sustituya los caracteres tildados.

Rebuild Indexes y listo.

Agradezco mucho la ayuda que me han brindado.

Username

oswaldochc86

Rank

Fresh Boarder

Posts

Joined

Mon Jun 06, 2016 3:04 pm

Re: Resultados de Búsqueda sin considerar la tilde

#42165 by jllort
Tue Aug 16, 2016 8:43 am

Si deseas compartir el analizador con la comunidad, puedes subir aquí el fichero en cuestión y lo incorporaremos o bien en el código fuente de la versión community o bien en la documentación de la versión 6.3 que estamos terminando.

Username

jllort

Rank

Moderator

Posts

12128

Joined

Fri Dec 21, 2007 11:23 am

Location

Sineu - ( Illes Balears ) - Spain

Contact

Re: Resultados de Búsqueda sin considerar la tilde

#42229 by diegospano
Thu Sep 01, 2016 8:42 pm

@oswaldochc86, podrías comentar como implementaste el nuevo analizador?.

1- cómo lo configuraste?
2- debiste descargar software del sitio de Lucene?.
3- en que path guardaste el analizador?

Muchas gracias.

Username

diegospano

Rank

Senior Boarder

Posts

Joined

Wed Sep 28, 2011 7:12 pm

Page 1 of 1
11 posts

Return to “Uso”

Display:

Sort by:

Jump to: