• Datos duplicados? del NAS al Linux? Problema?

  • OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
Forum rules: Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
 #47758  by CECAM
 
Hola buenas,
En el trabajo nos interesa usar la versión community de openkm, pero nos encontramos con un problema a nuestro parecer, muy grave!

- Tenemos un servidor Linux debian 9.5 con mysql y openkm Version: 6.3.7 (build: 3fc09ed) Con solo 40GB de disco.
- Tenemos un Nas Synology con 21TB de documentos, carpetas, etc...
- Montamos TODO el NAS en la carpeta /media/NAS del Linux debian.

El problema viene aquí: :!:

Si en openkm, en el apartado de "configuración/import" ponemos en "Filesystem path" la ruta de "/media/NAS"
Aquí nos empieza a copiar todos los datos del NAS 21TB en la debian de solo 20GB!!!! :shock: :?

No se puede hacer que el Linux (openkm) solo sirva de "indexación" de documentos y que los datos REALES solo estén en el NAS?? :?:

El openkm solo lo usaremos a modo consulta y para hacer busquedas, pero no para subir documentos.

Los documentos los trabajaremos como hacemos hasta ahora, directamente apuntado las estaciones windows a unidades de red que van a diferentes carpetas que están en el NAS.

Espero que se entienda lo que quiero decir. :D
Gracias por vuestra ayuda, un saludo!
 #47765  by jllort
 
No estas buscando un gestor documental, esta descripción que has realizado es la de un spider.

No encontraras ningún gestor documental ( que yo conozca ) que no importe y controle los documentos. La idea de fondo de un gestor documental es la de consolidar la información en un único punto de acceso, pero controlado bajo el gestor documental ( a nivel de seguridad etc... ).

No es ni la primera ni la última vez que se realiza una consulta de este tipo, pero como te comento en cuanto a gestión documental propiamente se refiere, esta configuración no tiene sentido. La gestión documental tiene varios objetivos a grandes rasgos:
- garantizar almacenamiento
- establecer reglas de acceso , uso etc...
- localizar la información

Y este tipo de configuración rompe la segunda. Si quieres utilizar un gestor documental, el que sea, tienes que importar los datos ahí y olvidarte del resto. Sobre el mapeo del datastore, indice del buscador etc... te interesa que el indice del lucene no este en el NAS ( porque es un disco lento y te interesa que el buscador vaya fluido ) . Hechale un ojo a esta parte de la documentación https://docs.openkm.com/kcenter/view/ok ... -home.html
 #50332  by nargoni
 
Refloto este tema...
He leido la respuesta, pero sigo sin verle el sentido.

Mi idea es parecida a la que apunta el post.
Tengo un Sonology cargado de ficheros, y quiero algo que lo indexe. Que al buscar alguna palabra me haga una lista de ficheros que la contengan, sean PDF (texto) o sean JPG (exif o rutas de las carpetas).
Para nada me interesa duplicar la informacion en openKM, si no que lo que necesito es saber donde estan los ficheros que he buscado. La rapidez me la debe dar en el resultado de la busqueda, y no me importa perder algo de tiempo en descargar el fichero de un NAS que será SOLO de consulta dentro de una LAN.
Y lucene deberia estar, por supuesto, en el servidor donde hay un disco SSD, para que aceda rapido a la indexacion.

Yo lo acabo de poner en marcha y iva a montar el NAS por red cuando he leido esto. Supongo que si esto es asi, (importando documentos) buscaremos otra opción.
 #50341  by jllort
 
Estamos confundiendo lo que es un spider con un gestor documental. Un spider es un motor de indexación puro y duro, que puede indexar varios recursos, mientras que un gestor documental es una aplicación que tiene entre sus objetivos consolidar un repositorio de documentos y establecer unas reglas en estos ( por ejemplo relgas de acceso entre otras características ). Todos los gestores documentales incorporan en su repositorio los documentos, la razón es muy sencilla, para establecer reglas necesitas un control total de aquello sobre el que las quieres establecer.

Si tu objetivo es sólo una funcionalidad de buscar, te has confundido de aplicación, buscas un spider en lugar de un gestor documental. Búsca en google por "web crawler software" o "network spider software for indexing"

About Us

OpenKM is part of the management software. A management software is a program that facilitates the accomplishment of administrative tasks. OpenKM is a document management system that allows you to manage business content and workflow in a more efficient way. Document managers guarantee data protection by establishing information security for business content.