Page 1 of 1
Configuración de Repository en NAS DRIVE
PostPosted:Fri Dec 04, 2009 6:22 am
by Shackjm
Buen día
Estoy probando varios sw de DMS y este le gana en mi humilde opinión a alfresco y mylogicaldoc, por su facílidad de uso y cuidado con el usuario finál.
Lo instale en la ultima distro de ubuntu server y funciona perfecto, pero quisiera que los archivos blob se almacenáran en un NAS drive.
La estructura es la siguiente:
Servidor --------------------------------NAS200 Linksys 2TB(Almacenamiento)
|-------------------------------------------------|
Aplicacación >----------------------------< Repository
|
Base de datos>
Preguntas
1. Como enruto el repository al path del filesystem del NAS?
2. Puedo mover un snapshot del repository con un sw de replicación como tivoli o ecostream a otro disco (backup) sin detener el Jboss?
Necesito almacenar 140.000 pdf indexados y garantizar creciemiento por disco, nos va bien con esta solución?
Muchas gracias por sus comentarios.
Re:Configuración de Repository en NAS DRIVE
PostPosted:Fri Dec 04, 2009 3:10 pm
by jllort
En el fichero openkm.cfg puedes configurar la ubicación, si no voy mal a traves de la propiedad # repository.home=repository ( que esta comentada, lo que no recuerdo es si esta ruta es siempre relativa al jboss home o absoluta ).
En cuanto al tema de copias de seguridad, estas dos soluciones de replicacion las desconozco, nosotros lo que hacemos normalmente es utilizar rsync, pero parando un rato el servicio por la noche.
Creo que con 2TB no creo que tengas problemas de crecimiento de disco. Me preocupa mas el tema de memoria de la máquina y procesador, a partir de los 100.000 documentos es cuando empieza la diversión en todos los DMS.
Re:Configuración de Repository en NAS DRIVE
PostPosted:Sun Dec 06, 2009 12:38 am
by Shackjm
Gracias por la Pronta respuesta, ya lo decidimos!!! y nos vamos con OpenKM, por ahora en versión comunity luego veremos si migramos a Pro.
Mira el servidor seria un IBM con la siguiente configuración:
IBM System x3200 M2 4367
Procesador IBM System x3200 M2 4367 - Quad-Core Xeon X3370 3 GHz
Procesador 1 x Intel Dual-Core Xeon X3370 / 3 GHz ( Quad-Core )Expandible a otro similar.
Memoria caché 12 MB L2
Caché por procesador 12 MB
Memoria RAM 4 GB (ampliable a 8)
Disco duro 250 gb SATA (solo para SO y aplicación)
El repositorio de datos es Un NAS drive Linksys NAS200 de 2Tb, la arquitectura de comunicación ente el servidor y el NAS es a 1gb, que te parece?
Tengo otra duda que no he podido resolver en lo que he leido y es como correr la aplicación en segundo plano, parece que es una configuración del Jboss trate de correrlo con el comando \"sh run.sh -b 0.0.0.0 &\" para que lo cargara en segundo plano y nada, trate con \"bg sh run.sh -b 0.0.0.0\" y produce errores de ejecución, como podemos ponerlo a iniciar como un servicio? para dejar la sesión cerrada en el server.
Gracias de nuevo...!
Re:Configuración de Repository en NAS DRIVE
PostPosted:Sun Dec 06, 2009 4:04 pm
by jllort
En la
guia ubuntu te dice como configurar el servicio de jboss
La maquina a veo bien a nivel de memoria, no creo que tengas problemas.
Solo un consejo, mas que por un tema de rendimiento del repositorio, te lo digo para que tengas un buen rendimiento en la interfaz de usuario. Siempre que sea posible, es aconsejable que de un nodo o carpeta, no cuelguen mas de 100 o 150 documentos, pueden colgar mas, pero si quieres que vaya rápida la interfaz de usuario es aconsejable que haya este número por que el componente ajax ( javascript ) que realiza funciones de ordenación, etc... ( el explorador de arriba a la derecha ), cuando tiene que visualizar un gran número de documentos - por un tema de implementación, ordenación etc...- come mucha cpu del usuario. Esto también es un tema de tener un buena taxonomía, es decir tener un mogollon de documentos en un mismo nodo es señal de mala segmentación.
También te aconsejo que siempre que podais dentro de la red utilices cualquier navegador que no sea internet explorer, por que tiene un motor de javascript patético.
Re:Configuración de Repository en NAS DRIVE
PostPosted:Sun Dec 06, 2009 4:30 pm
by Shackjm
Ok, ya lo tengo corriendo en segundo plano por una tarea programada en webmin asi puedo vigilar el consumo facilmente.
Con respecto al tema de los nodos, entiendo que la recomendación es solo a nivel de documento por el proceso de cargue a nivel de codigo entre más documentos mas se demora el loop en llenar el componente explorador, sin embargo siguen las dudas, que recomendaciones a nivel de archivo, tamaño, longitud de nombres, restrición de tipos, etc me puedes dar?
Con respecto al explorer, valla que si! es un fiasco (en todo), estoy buscando la manera de cargarlo por un Jbrowser para mejorar al máximo la experiencia del usuario.
Ahora tengo estas tareas para realizar la implementación sobre el servidor de producción: (revisando documentación)
1. Definir el esquema para utilizar Mysql.
2. Definir el esquema de backup y restore del repositorio ante un evento mayor.
3. Establecer contingencia por clustering o mirror.
4. Definir browser o gui de usuario final.
Como siempre muchas gracias por tus rapidas respuestas... !
Re:Configuración de Repository en NAS DRIVE
PostPosted:Sun Dec 06, 2009 5:03 pm
by jllort
A nivel de archivo no hay restricciones, incluso puedes subir videos. De momento se observa un mejor rendimiento en la configuracion por defecto que almacena los blobs ( fichero binario ) directamente en disco duro, esto parece sensato dejarlo así. La configuracion del lucene ( tambien en repository.xml tampoco la tienes que tocar ), en todo caso si quieres utilizar la mysql para los nodos no es una mala opción. En el foro encontraras información para hacer esto en una postgreSQL, para una mysql es muy parecido. Acuerdate que el repositorio solo se crea al arrancar la primera vez la aplicación, o sea que para recrear el repositorio en una mysql, tienes que borrar el directorio repository, configurar el repository.xml correctamente y luego arrancar ( normalmente no sale bien a la primera ).
El internet explorer 8 parece que funciona un poco mejor, almenos con alguna máquina en el que lo he podido probar, el 5.5 y el 6.0 van horrorosos.
La política de backup debes preguntarte que estas dispuesto a perder y si el sistema se puede parar x tiempo por la noche que te simplificará mucho la vida. Nosotros en general utilizamos rsync y paramos el servicio los sabados o domingos por la noche, como mucho pierdes una semana, conservando ciclos de 4 semanas por separado. Comprueba el backup, es decir, restaura completamente un copia de backup para asegurarte que lo tienes todo bien, si el repositorio se corrompe debido a un fallo del disco duro, después no hay forma de recuperarlo y tendras que tirar del backup, o sea que asegurate que lo estas haciendo bien.
Utilizando tambien rsync hemos configurado servidores en mirror, con la opción de solo lectura, es decir si cae un servidor. Esto creo que en la 3.0 ya esta presente, lo que no recuerdo es si la community lo trae, en todo caso hay que poner en el fichero OpenKM.cfg la propiedad system.readonly=on