• No me busca por contenido

  • OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #39677  by dvarela
 
Hola.

Tengo una instalación de pruebas de OpenKm 6.3.0 sobre RedHat EL6. Para la extracción de texto en los documentos he instalado y configurado el tesseract 3. He visto los logs y he comprobado que extrae el texto correctamente. También he hecho pruebas con el Text Extractor de las "Utilidades" y el resultado parece correcto.

Sin embargo si hago una busqueda por contenido no me muestra ningun resultado. ¿Me he dejado algo en el camino?

Un saludo
 #39690  by jllort
 
Primero, el contenido no se indexa inmediatamente después de insertar un documento, tiene que ser procesado por la cola. Si el documento ya no está en la cola y no localizas la información entonces si que hay un problema.

Asegurate, aunque tengas el tesseract que en los extractors ( parametro de configuración en la administración ) también tienes puesta la clase que se corresponde con el tesseract y que has eliminado la del cuneiform ( si es que estaba esta presente previamente )

Puedes probar en nuestra demo.openkm.com -> sube el fichero, espera 20-30 minutos y intenta buscar por contenido a ver si te aparece.

Mira en la base de datos :
Code: Select all
select * from OKM_NODE_DOCUMENT WHERE NBS_UUID='UUID del documento';
Hay una fila que te indica ( T o F ) si el texto ya ha sido procesado ( NDC_TEXT_EXTRACTED ) y el contenido extraído ( NDC_TEXT ) si esta a T y el texto esta vacio, entonces hay un problema en algún sitio. Pero primera chequea estos dos puntos.

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.