Datos duplicados? del NAS al Linux? Problema?

OpenKM tiene muchas características interesantes, pero es necesario un proceso de configuración para mostrar todo su potencial.
Forum rules
Por favor, antes de preguntar algo consulta el wiki de documentación o utiliza la función de búsqueda del foro. Recuerda que no tenemos una bola de cristal ni poderes mentales, o sea que que para informar sobre un error es necesario que nos indiques tanto la versión de OpenKM que usas como la del navegador y sistema operativo. Para más información consulta Cómo informar de fallos de forma efectiva.
Post Reply
CECAM
Fresh Boarder
Fresh Boarder
Posts: 1
Joined: Fri Apr 12, 2019 7:01 am

Datos duplicados? del NAS al Linux? Problema?

Post by CECAM »

Hola buenas,
En el trabajo nos interesa usar la versión community de openkm, pero nos encontramos con un problema a nuestro parecer, muy grave!

- Tenemos un servidor Linux debian 9.5 con mysql y openkm Version: 6.3.7 (build: 3fc09ed) Con solo 40GB de disco.
- Tenemos un Nas Synology con 21TB de documentos, carpetas, etc...
- Montamos TODO el NAS en la carpeta /media/NAS del Linux debian.

El problema viene aquí: :!:

Si en openkm, en el apartado de "configuración/import" ponemos en "Filesystem path" la ruta de "/media/NAS"
Aquí nos empieza a copiar todos los datos del NAS 21TB en la debian de solo 20GB!!!! :shock: :?

No se puede hacer que el Linux (openkm) solo sirva de "indexación" de documentos y que los datos REALES solo estén en el NAS?? :?:

El openkm solo lo usaremos a modo consulta y para hacer busquedas, pero no para subir documentos.

Los documentos los trabajaremos como hacemos hasta ahora, directamente apuntado las estaciones windows a unidades de red que van a diferentes carpetas que están en el NAS.

Espero que se entienda lo que quiero decir. :D
Gracias por vuestra ayuda, un saludo!
jllort
Moderator
Moderator
Posts: 11512
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: Datos duplicados? del NAS al Linux? Problema?

Post by jllort »

No estas buscando un gestor documental, esta descripción que has realizado es la de un spider.

No encontraras ningún gestor documental ( que yo conozca ) que no importe y controle los documentos. La idea de fondo de un gestor documental es la de consolidar la información en un único punto de acceso, pero controlado bajo el gestor documental ( a nivel de seguridad etc... ).

No es ni la primera ni la última vez que se realiza una consulta de este tipo, pero como te comento en cuanto a gestión documental propiamente se refiere, esta configuración no tiene sentido. La gestión documental tiene varios objetivos a grandes rasgos:
- garantizar almacenamiento
- establecer reglas de acceso , uso etc...
- localizar la información

Y este tipo de configuración rompe la segunda. Si quieres utilizar un gestor documental, el que sea, tienes que importar los datos ahí y olvidarte del resto. Sobre el mapeo del datastore, indice del buscador etc... te interesa que el indice del lucene no este en el NAS ( porque es un disco lento y te interesa que el buscador vaya fluido ) . Hechale un ojo a esta parte de la documentación https://docs.openkm.com/kcenter/view/ok ... -home.html
nargoni
Fresh Boarder
Fresh Boarder
Posts: 3
Joined: Mon Jul 13, 2020 6:55 am

Re: Datos duplicados? del NAS al Linux? Problema?

Post by nargoni »

Refloto este tema...
He leido la respuesta, pero sigo sin verle el sentido.

Mi idea es parecida a la que apunta el post.
Tengo un Sonology cargado de ficheros, y quiero algo que lo indexe. Que al buscar alguna palabra me haga una lista de ficheros que la contengan, sean PDF (texto) o sean JPG (exif o rutas de las carpetas).
Para nada me interesa duplicar la informacion en openKM, si no que lo que necesito es saber donde estan los ficheros que he buscado. La rapidez me la debe dar en el resultado de la busqueda, y no me importa perder algo de tiempo en descargar el fichero de un NAS que será SOLO de consulta dentro de una LAN.
Y lucene deberia estar, por supuesto, en el servidor donde hay un disco SSD, para que aceda rapido a la indexacion.

Yo lo acabo de poner en marcha y iva a montar el NAS por red cuando he leido esto. Supongo que si esto es asi, (importando documentos) buscaremos otra opción.
jllort
Moderator
Moderator
Posts: 11512
Joined: Fri Dec 21, 2007 11:23 am
Location: Sineu - ( Illes Balears ) - Spain
Contact:

Re: Datos duplicados? del NAS al Linux? Problema?

Post by jllort »

Estamos confundiendo lo que es un spider con un gestor documental. Un spider es un motor de indexación puro y duro, que puede indexar varios recursos, mientras que un gestor documental es una aplicación que tiene entre sus objetivos consolidar un repositorio de documentos y establecer unas reglas en estos ( por ejemplo relgas de acceso entre otras características ). Todos los gestores documentales incorporan en su repositorio los documentos, la razón es muy sencilla, para establecer reglas necesitas un control total de aquello sobre el que las quieres establecer.

Si tu objetivo es sólo una funcionalidad de buscar, te has confundido de aplicación, buscas un spider en lugar de un gestor documental. Búsca en google por "web crawler software" o "network spider software for indexing"
Post Reply