• No Consigo hacer busquedas en contenido de archivos DOC

  • Problemas con la instalación de OpenKM? No problemo, la solución está más cerca de lo que piensas.
Problemas con la instalación de OpenKM? No problemo, la solución está más cerca de lo que piensas.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #4893  by oviedonazareno
 
Estimados, la verdad que los felicito y les agredezco por lo que han hecho con este sistema, la verdad que es muy bueno.

Escribo para ver si estoy haciendo algo mal yo o hay algun problema con la busqueda en contenidos de archivos .DOC (de word) intente subir a mi instalacion archivos word y buscar alguna palabra dentro del docuemtno (en un archivo muy chico, simplemente tenia 3 palabras adentro) y no funciona no me devuelve nada intente lo mismo en la demo (web) y pasa exactamente lo mismo pueden ver la carpeta pruebadoc y dentro de ella esta el archivo PruebasBusquedas.doc

si es algo que me falta configurar les agradeceria enormemente que me digan que puede ser...
Cualquier otra busqueda en archivos txt, pdf funciona perfecto.

De nuevo muchisimas gracias.

Nazareno
 #4895  by jllort
 
1- para empezar has probado con un fichero de word un poco mas grande ? piensa que no se indexa todo el contenido, es decir palabras del tipo "de por para la lo, etc.." no se indexan, normalmente el indexador tiene un tokenizer que elimina estas palabras
2- que version que word tiene el documento ?

Pásanos el fichero y lo miraremos.
 #4902  by jllort
 
El fichero .ini es normal que no te lo indexe, por que creo que esta extensión no la tenemos definida como extensión de la cual se pueda indexar el contenido.

Un detalle, con que version de word esta hecho este documento 2000, 2003, 2007 ?
 #4904  by oviedonazareno
 
Muchisimas gracias, respecto del .ini seguramente lo agrego el proceso de cmpresion al .zip que mande solo estaba probando con los doc.
Recien hice nuevas pruebas subiendo unos documentos hechos con oppen office y los indexa perfecto, y genere nuevos y diversos archivos word y no los indexa.

Aguardo vuestra respuesta muchisimas gracias.
 #4911  by pavila
 
Edita el fichero $JBOSS_HOME/repository.xml y asegúrate que el parámetro textFilterClasses está configurado así:
Code: Select all
<param name="textFilterClasses" value="
org.apache.jackrabbit.extractor.PlainTextExtractor,
org.apache.jackrabbit.extractor.PdfTextExtractor,
org.apache.jackrabbit.extractor.HTMLTextExtractor,
org.apache.jackrabbit.extractor.XMLTextExtractor,
org.apache.jackrabbit.extractor.RTFTextExtractor,
org.apache.jackrabbit.extractor.OpenOfficeTextExtractor,
es.git.openkm.extractor.MsExcelTextExtractor,
es.git.openkm.extractor.MsPowerPointTextExtractor,
es.git.openkm.extractor.MsWordTextExtractor,
es.git.openkm.extractor.MsOffice2007TextExtractor,
es.git.openkm.extractor.ExifTextExtractor,
es.git.openkm.extractor.TiffTextExtractor,
es.git.openkm.extractor.AudioTextExtractor" />
 #4916  by jllort
 
Dos detalles, has reiniciado el jboss.

Tambien igual tienes que modifica el fichero workspace.xml que esta dentro de repository/default/workspace.xml

Dime cosas si esto te soluciona el problema.

Nota: Estas modificaciones con el jboss parado.
 #4917  by oviedonazareno
 
EXELENTE.....!!!!!!!!!
Las modificaciones previas las habia hecho con el jboss siempre apagado, pero ahora cuando modifique el workspace.xml y luego arranque el sistema, empezo a funcionar perfecto.

Les agradezco muchisimo la colaboracion.

Saludos y sigan adelante.

los felicito por todo esto.

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.