Cómo mover contenidos de OpenCMS a Alfresco

/ / Blog, Document Management
alfresco migración
keensoft participa en la I Jornada Universitaria y Profesional Actualíza-T
Android 5 Lollipop

En ocasiones los gestores de contenido son utilizados para depositar información propia de un gestor documental. Ocurre que cuando las organizaciones se deciden a poner en marcha una solución de gestión documental ya disponen de una base de documentos almacenados en otros sistemas de información.

Alfresco dispone de diferentes herramientas para la importación de datos, pero no cuenta con un módulo que pueda comunicarlo con OpenCMS. Los documentos almacenados en OpenCMS, junto con sus metadatos asociados, pueden ser rescatados a través de una API CMIS a partir de la versión 8.5 del producto. Sin embargo en versiones anteriores el único interfaz externo que proporciona OpenCMS es WebDAV y este interfaz no provee los metadatos específicos de los documentos.

Por este motivo, la única alternativa para extraer documentos de OpenCMS en estas condiciones consiste en programar un módulo nativo de OpenCMS que realice una consulta LUCENE para recuperar los documentos deseados. Una vez que disponemos de este conjunto de recursos, podemos realizar las siguientes operaciones para cada uno de ellos:

  • Invocar a la API REST de Alfresco para enviar contenidos y metadatos
  • Reemplazar, mediante la API CORE de OpenCMS, el contenido XML de las páginas que incluían una referencia por Ruta a esos documentos por una referencia por URL al nuevo enlace de acceso al documento en Alfresco
    • En nuestro caso hemos optado por realizar un Quick Share en Alfresco e incluir en este punto la URL compartida
  • Publicar cada uno de estos cambios en OpenCMS
  • Eliminar el documento movido a Alfresco y publicar el cambio en OpenCMS

Desde el punto de vista de Alfresco, deben tenerse en cuenta los siguientes puntos:

  • Los tipos y aspectos del modelo de contenido deben ser compatibles con los datos de origen de los documentos en OpenCMS
  • Si el proceso incluye miles o millones de documentos es necesario aplicar las prevenciones habituales en la configuración de Alfresco (deshabilitar la indexación, proveer espacio adicional en el directorio temporal, deshabilitar reglas de contenido…)
  • Incrementar el número de procesos tanto en la máquina como en el servidor de aplicaciones (los nuevos documentos generarán procesos de transformación y rendition en segundo plano que pueden solaparse en el tiempo)
  • También es recomendable deshabilitar el módulo de auditoría para evitar posibles bloqueos en la base de datos

Una vez terminado el proceso, debemos revisar los resultados con un proceso de verificación que nos permita identificar cada una de las operaciones realizadas y que nos muestre las causas detalladas de los posibles problemas.

Alfresco es un producto pensado fundamentalmente para gestionar documentos. Es importante que las organizaciones tomen conciencia de ello y tengan el valor y la decisión de afrontar una tarea de este calibre.

Unidad de negocio, keensoft