7: Opciones a pequeña escala para sistemas de almacenamiento digital

7.1 Introducción

7.1.1.1      Es posible construir un sistema digital de almacenamiento a pequeña escala capaz de satisfacer los requisitos de archivos para pequeñas colecciones con presupuestos limitados. Hasta hace poco, solo las organizaciones de gran tamaño y recursos comparativamente más importantes podían digitalizar y almacenar sus fondos a gran escala mediante sistemas digitales de almacenamiento masivo (DMSS) en base a conjuntos de discos duros y unidades de cinta. Estos sistemas tendían a ser grandes, caros y específicos para contenido sonoro y audiovisual. De la mano de instituciones universitarias y de educación superior, muchas fonotecas y bibliotecas de ámbito nacional han iniciado y financiado el desarrollo de estándares abiertos y programas informáticos de código abierto que hoy en día facilitan los procesos de archivística digital. Estos sistemas de trabajo son hoy la columna vertebral y el modelo para todas las propuestas de archivística digital. El archivo sonoro se beneficia de ello mediante el uso de estas tecnologías y la aportación de conocimientos específicos para su mejor desarrollo.

7.1.1.2      Al mismo tiempo que aparecen en el mercado soluciones de software de bajo coste o de código abierto, el coste de las cintas y los discos duros decrece, aún más acentuadamente en el caso de estos últimos. Hoy es posible emprender la archivística digital de una forma mucho más profesional que mediante la arriesgada metodología de copia sobre soportes de grabación individuales, tipo CD o DVD.

7.1.1.3      Este capítulo describe cómo establecer y administrar un repositorio digital a pequeña escala que pueda satisfacer los requisitos del estándar OAIS. El capítulo 6, «Formatos de destino y sistemas para la preservación», contiene mucha información pertinente a estos efectos, como también el capítulo 3, «Metadatos», y el capítulo 4, «Identificadores únicos y persistentes».

7.2 Un acercamiento a la archivística digital a pequeña escala

7.2.1 Financiación y conocimientos técnicos

7.2.1.1      Es factible construir un sistema digital de preservación a bajo coste, siempre que se disponga de un mínimo nivel de conocimientos técnicos y algunos recursos ordinarios, aunque sean de bajo nivel. Aparte de su simplicidad o robustez, un sistema requiere administración y mantenimiento, y también habrá que sustituirlo en un momento dado para evitar el riesgo de pérdida del contenido que gestiona.

7.2.1.2      «La preservación digital es un concepto a la par económico y tecnológico. Los requisitos de continua sostenibilidad exigen en esencia una fuente de financiación fiable, necesaria para garantizar el apoyo continuado — aunque sea de bajo nivel — al contenido digital y al mantenimiento de los necesarios repositorios, tecnologías y sistemas asociados, por el tiempo que sea necesario. Esta financiación constante no es en absoluto habitual dentro de las comunidades que construyen estas colecciones digitales, muchas de las cuales suelen depender de subvenciones circunstanciales. Por eso resulta tan necesario el desarrollo de modelos de coste sostenible para materiales digitales según los requisitos de los varios tipos de contenido, acceso y sostenibilidad». (Bradley: 2004)

7.2.1.3      El mantenimiento y gestión del sistema y sus componentes de hardware y software es inevitable e insoslayable. Requiere conocimientos técnicos así como fondos dedicados. Cualquier propuesta de construcción y gestión de un archivo de objetos de audio digital deberá acompañarse de una estrategia que incluya planes de financiación del mantenimiento y reemplazo de componentes, así como una lista de los riesgos asociados con la pérdida de conocimientos técnicos y la manera de abordarlos.

7.2.2 Estrategias alternativas

7.2.2.1      En caso de no poder asumir adecuadamente los riesgos descritos en la sección anterior, el archivo podrá buscar la colaboración de terceros en este aspecto con el fin de poder continuar con la preservación y digitalización de su colección. El archivo podrá optar por el reparto del riesgo mediante una serie de iniciativas: estableciendo colaboraciones locales para distribuir sus fondos entre una serie de colecciones afines, habilitando acuerdos con un archivo estable y financieramente capaz, o contratando un proveedor comercial de servicios de almacenamiento (ver la sección 6.1.6, «Planificación a largo plazo»).

7.2.2.2      Para aprovechar con efectividad las ventajas de las alternativas descritas, serán necesarios acuerdos precisos sobre qué datos y contenidos serán intercambiados entre los firmantes y cómo se realizará el intercambio. Este acuerdo deberá establecerse bastante antes de que sea acuciante la necesidad de llevarlo a cabo. El apartado de intercambio de paquetes deberá considerar toda la información relevante necesaria para continuar la tarea archivística desarrollada por un archivo. Esto incluirá los datos que constituyen el objeto de audio en su formato de archivo, los metadatos técnicos, descriptivos, estructurales y los metadatos sobre derechos, así como los de proveniencia de la grabación y el historial de cambios. Deberán ser agrupados de una forma estandarizada de tal manera que permitan recrear el archivo en caso de pérdida de datos, o que pueda un tercer archivo retomar la gestión del contenido si se estimara necesario.

7.2.2.3      La creación de estos perfiles se hace posible mediante el uso de instrumentos como por ejemplo METS (Metadata Encoding and Transmission Standard), un estándar de codificación y transmisión de metadatos ampliamente utilizado en el entorno bibliotecario. Cualesquiera que sean las estrategias utilizadas, el acuerdo sobre los aspectos formales es esencial para su éxito. Sea como base para una replicación remota de contenidos, o para facilitar la federación de archivos cooperantes, un acuerdo sobre formas e intercambios de información estandarizados es la estrategia de preservación más efectiva posible, pues reparte y reduce el riesgo de fallos debidos a desastres naturales o humanos o a la falta de recursos en un momento crítico del ciclo de vida de un objeto de audio digital.

7.3 Descripción del sistema

7.3.1.1      En la sección 6.1.4, «Aspectos prácticos de las estrategias de protección de datos», se debate la necesidad de abordar las categorías funcionales definidas en el Modelo de Referencia del sistema OAIS (OAIS, ISO 14721:2003). Este marco de referencia es crítico en el desarrollo de sistemas de almacenamiento digital con intercambio interoperable de contenido, por lo que deberá aplicarse igual para colecciones tanto grandes como pequeñas. La siguiente sección, dedicada a sistemas a pequeña escala, adopta los principales componentes funcionales del modelo de referencia OAIS como guía en el análisis de las soluciones de software disponibles y en la propuesta de recomendaciones para un necesario desarrollo. Estos componentes son la transferencia de contenidos, acceso, administración, gestión de datos, planificación de la preservación y almacenamiento en archivo.

7.3.1.2      El sistema descrito se basa en algún tipo de software de repositorio para la gestión del contenido, al menos un conjunto mínimo de metadatos, además de hardware, y finalmente algunas recomendaciones sobre opciones manuales de gestión de la integridad de los datos. La sección de hardware aborda sin entrar en detalles dos escenarios bajo los cuales se pueden implementar sistemas de almacenamiento a pequeña escala: el primero, cuando un solo operario digitaliza contenido a través de un solo dispositivo de almacenamiento; el segundo, cuando más de un operario requiere el acceso al sistema de almacenamiento. Cualquiera de las dos opciones asume el cumplimiento de todos los puntos mencionados en estas Directrices, incluyendo la disponibilidad de conversores A/D, tarjetas de sonido, estaciones digitales de trabajo (DAWs) y equipos de reproducción apropiados.

7.3.1.3      La información que sigue describe sistemas y programas informáticos que permiten a una institución o colección desempeñar autónomamente el conjunto de tareas necesarias para la gestión de fondos de pequeña dimensión. Conviene subrayar que las opciones que a continuación se describen no tienen por qué ser llevadas a cabo por una institución en solitario. Pueden buscarse aliados y proveedores comerciales que ayuden en alguna o en todas las tareas que se describen a continuación. Es igualmente importante recordar que la suma de todas estas tareas conforma el paquete completo de preservación y archivo (AIP) y deben ser llevadas a cabo por alguien, sea mediante una gestión distribuida o local.

7.3.2 Software de repositorio

7.3.2.1      Un software de repositorio bien diseñado incluirá un cierto número de las funciones identificadas en OAIS. Hay proveedores de software comercial y de código abierto. La ventaja del software comercial reside en que se espera del proveedor el compromiso de hacer funcionar el sistema; sin embargo, los sistemas comerciales suponen continuos gastos y el peligro de quedar encasillado en un sistema propietario del que es difícil escapar. Las opciones de software de código abierto tienen a su favor la adhesión a estándares y marcos abiertos que permiten la extracción o migración de contenido en el caso de actualizaciones futuras. Por si esto fuera poco, resultan gratis. Su desventaja está en que, a pesar de disponer de la ayuda de las comunidades de código abierto, la responsabilidad final del mantenimiento recae en el usuario. Sin embargo, pueden hallarse proveedores comerciales que ofrecen asistencia técnica sobre soluciones de código abierto.

7.3.2.2      La mayoría de estos sistemas de software para repositorios permitirán las tareas identificadas en el acceso, la administración, gestión de datos y ciertos aspectos de la transferencia de contenidos. En el momento de la redacción de este documento, los softwares al uso no suelen contemplar la planificación de la preservación y el almacenamiento en archivo. La primera, por ser a menudo muy tecnológica o específica de un formato, y la segunda por su dependencia del hardware asociado. Estas dos tareas se discuten aparte en las siguientes secciones.

7.3.2.3      Se describen aquí brevemente dos soluciones de software de código abierto. Cabe recordar que el software está en constante desarrollo, y las alegaciones y observaciones formuladas a continuación deberán cotejarse con los últimos desarrollos de los proveedores de software. Las soluciones descritas son DSpace y FEDORA.

7.3.2.4      La plataforma DSpace es un repositorio muy popular ampliamente adoptado en los ámbitos de la investigación y la educación superior. Su conocimiento y uso entre museos y sectores del patrimonio cultural es aún limitado, aunque creciente. Una de las razones de la popularidad de DSpace es su instalación y mantenimiento relativamente fáciles y su interfaz de usuario ya configurada, que integra las funciones de gestión de datos y acceso dentro de la arquitectura del sistema. DSpace goza de una importante comunidad internacional de desarrollo que aporta asistencia y añade nuevas características constantemente.

7.3.2.5      Uno de los puntos fuertes de DSpace es su conjunto de características integradas, hecho que permite a los usuarios institucionales la rápida puesta en marcha del repositorio, tras la cual pueden ya añadirse nuevos ítems a la colección. Sin embargo, esta fortaleza es también una de sus mayores debilidades, puesto que ha convertido DSpace en una aplicación de software monolítica, con código base complejo, que supone potenciales limitaciones a la escalabilidad y la capacidad para repositorios institucionales de gran tamaño. Esto no conlleva mayores problemas para colecciones pequeñas o medianas y probablemente no sea inconveniente para colecciones de audio digital. DSpace utiliza actualmente una versión del esquema Dublin Core basada en el Dublin Core Libraries Working Group Application Profile (LAP).

7.3.2.6      FEDORA (Flexible Extensible Digital Object and Repository Architecture o arquitectura de repositorio flexible y extensible para objetos digitales) es un sistema de repositorio de creciente popularidad diseñado como arquitectura de software base sobre la cual se puede construir una amplio abanico de servicios de repositorio, incluidos los servicios de preservación. En comparación con la rápida adopción de DSpace, FEDORA ha ido ganando adeptos de forma más paulatina al no disponer de una interfaz dedicada de usuario y un servicio de acceso inmediato (out-of-the-box). Existe un buen número de proveedores, tanto en el ámbito comercial como de código abierto, que ofrecen interfaces basadas en entorno web para FEDORA.

7.3.2.7      Los principales activos de FEDORA son su flexibilidad y arquitectura escalable. La experiencia recogida de instituciones que han adoptado FEDORA confirma su escalabilidad y capacidad ante grandes colecciones, además de su flexibilidad para almacenar múltiples tipos de ítems digitales junto con sus complejas interrelaciones. Hay pocas limitaciones a las características que puede asumir FEDORA a la vez que mantiene la interoperatividad con otras aplicaciones de software y sistemas. Puede configurarse para aceptar prácticamente cualquier perfil de metadatos, a través de las capacidades de transferencia de contenidos que METS ofrece. El principal escollo de FEDORA es el alto nivel de experiencia en ingeniería de software necesario para contribuir a su desarrollo de base, además de no ofrecer una instalación e implementación inmediatas (Bradley, Lei and Blackall: 2007).
 
7.3.2.8      Se han desarrollado instrumentos para la migración de contenidos desde DSpace a FEDORA y viceversa que en teoría garantizan la compatibilidad y permiten la compartición de datos y flujos de trabajo (ver http://www.apsr.edu.au/currentprojects/index.htm).30


30  DSpace y FEDORA han juntado recientemente esfuerzos mediante DURASPACE, http://www.duraspace.org [último acceso noviembre 2011] (n. de los t.).

7.4 Metadatos básicos

7.4.1.1      El capítulo 3, «Metadatos», describe los requisitos para la documentación y administración de una colección. Como se ha dicho, los metadatos son fundamentales en todos los aspectos del ciclo de vida de un objeto de audio digital. La descripción estricta de todos los aspectos de la colección es uno de los pasos más importantes para su preservación. El registro detallado de metadatos referentes a todos los aspectos técnicos, de proceso, descriptivos y de procedencia es parte vital del proceso de preservación. A menudo aparecen, sin embargo, imperativos técnicos en la preservación del material sonoro que inevitablemente deben priorizarse al desarrollo de las políticas de gestión de metadatos. Las siguientes recomendaciones básicas son solo el primer paso. Pretenden ayudar en la creación de una colección de metadatos que sirva para administrar el fichero, o en la captura de metadatos a partir de los datos para así evitar su pérdida. Escuchar

7.4.1.1.1   Identificador único: debería ser estructurado, con significado y comprensible por humanos, así como único. Un identificador con significado puede ser útil para referirse a objetos como ficheros de preservación o máster, copias de distribución, registros de metadatos, series, etc., aspectos aptos para ser gestionados por un sistema sofisticado.
7.4.1.1.2   Descripción: descripción de la secuencia de sonido. Un breve texto simplemente para identificar el contenido del fichero sonoro.
7.4.1.1.3   Datos técnicos: formato, frecuencia de muestreo, número de bits por muestra, tamaño del fichero. Aunque esta información pueda ser adquirida más tarde, el hecho de explicitarla en el registro de metadatos permite la planificación de la administración y preservación de la colección.
7.4.1.1.4   Historial de codificación: unas pocas líneas de texto en formato BWF con información descriptica sobre el ítem original y el proceso y tecnología utilizados en la creación del fichero digital objeto de archivo.
7.4.1.1.5   Errores de proceso: cualquier error que el sistema de transferencia pueda detectar en el proceso de transferencia de datos (por ejemplo, errores no corregibles en trasferencias de datos vía DAT o CD).

7.4.1.2      La información descrita en los apartados de identificador único, descripción y datos técnicos puede ser almacenada en registros Dublin Core o en cabeceras BWF. El historial de codificación y los errores de proceso pueden guardarse en el fragmento BEXT de la cabecera de BWF, o bien en documentos asociados codificados en XML. La fecha y, si hace falta, la hora del proceso de transferencia deberán guardarse en la cabecera BWF. La fecha y, si es necesario, la hora de transferencia de los datos al repositorio deberán guardarse en la entidad de gestión de metadatos del repositorio. En ciertas circunstancias, la información conjunta de fecha y hora (timestamp) que relaciona los componentes de una grabación multipista entre sí es obligatoria. En general, se recomienda incluir la información de fecha y hora asociada a todo evento u objeto digital.

7.5 Planificación de la preservación

7.5.1.1      Como ya se ha dicho, la planificación de la preservación se refiere a la preparación necesaria para garantizar que el objeto de audio digital permanezca accesible a largo plazo, aunque el entorno informático de almacenamiento y acceso se vuelva obsoleto. Para una colección de pequeño tamaño, interesada únicamente en la preservación de sus propios objetos de audio digital, esta tarea es relativamente directa y sencilla. Una vez capturados, los metadatos mencionados arriba argumentan las decisiones a tomar sobre preservación al establecer claramente las relaciones entre el original y la copia de preservación almacenada en el repositorio digital. La información técnica ayuda en la planificación. La elección de BWF como estándar de preservación responde a la voluntad de asegurar el mayor plazo de tiempo posible antes de que resulte inevitable una nueva migración de formato. Queda en manos de los gestores y conservadores de la colección mantenerse al día sobre los cambios y desarrollos acaecidos en el dominio de los archivos digitales, a través del contacto con asociaciones como la IASA.

7.6 Almacenamiento de archivo

7.6.1.1      Técnicamente hablando, el almacenamiento de archivo se sitúa por debajo del repositorio e incorpora un conjunto de subprocesos tales como la elección del medio de almacenamiento, la transferencia al sistema del almacenamiento del paquete de archivo de información (AIP), la seguridad y validación de los datos así como su restauración y copia de seguridad, y finalmente la reproducción o migración del paquete AIP a un nuevo medio.

7.6.1.2      Los principios básicos del almacenamiento de archivo pueden resumirse en los siguientes puntos:

7.6.1.2.1   Deberán existir múltiples copias. El sistema deberá ser capaz de acoger un cierto número de duplicados de un mismo ítem.
7.6.1.2.2   Las copias deberían ubicarse en lugares alejados del sistema principal u original y también entre sí. Cuanta mayor la distancia física entre copias, mayor la seguridad en caso de desastre.
7.6.1.2.3   Deberían existir copias en diferentes tipos de medios. Si todas las copias están en un mismo tipo de soporte, como pueda ser un disco duro, el riesgo de que un único mecanismo de fallo las destruya todas es grande. Los profesionales de las TIC usan por lo general las cintas de datos para las copias segunda y sucesivas.

7.6.1.3      La mayor parte del coste de un sistema de almacenamiento de datos no se lo lleva el hardware en sí mismo, sino el sistema de administración jerárquica del almacenamiento (Hierarchical Storage Management System, HSM). Las funciones de almacenamiento de archivo en OAIS incluyen la noción de HSM como parte del modelo conceptual. Cuando se definió el estándar OAIS no se concebía aún la posibilidad de manejar cómodamente grandes cantidades de datos de ninguna otra manera. La cuestión práctica que sustenta la opción HSM consiste en la diferencia de coste entre diferentes medios de almacenamiento, es decir, la premisa según la cual el almacenamiento sobre disco duro resulta más caro que sobre cinta. HSM ofrece bajo este escenario un almacén virtual de información, aunque en la realidad las copias de datos puedan estar repartidas en un buen número de tipos de soporte diferentes en función del uso y las velocidades de acceso.

7.6.1.4      Sin embargo, el coste del disco duro ha disminuido a un ritmo mayor que el de la cinta, hasta el punto de resultar equivalentes en cuanto a precio. Consecuentemente, el uso de HSM pasa a ser una opción de implementación. Bajo estas circunstancias, un sistema de almacenamiento que contenga todos sus datos en un conjunto de discos a la vez que una copia completa en un conjunto de cintas resultará un opción muy asequible especialmente para colecciones de audio digital de pequeño o medio tamaño. Para este tipo de escenarios un HSM completamente funcional resultará innecesario. En su lugar podrán contemplarse sistemas mucho más sencillos que administren y mantengan información sobre la localización de las copias y la antigüedad y versión de los formatos (Bradley, Lei y Blackall: 2007).

7.7 Disposiciones prácticas de hardware

7.7.1.1      La información que sigue describe maneras de implementar un sistema práctico. Como ya se ha comentado anteriormente, se supondrá que todos los datos del archivo sonoro se almacenarán sobre discos duros, datos que a su vez serán replicados sobre un formato de cinta tipo LTO.

7.7.2   Unidades de disco duro

7.7.2.1      Una opción común y asequible para el almacenamiento de datos sobre disco se basa en la conexión de un conjunto de discos duros organizados en RAID (ver la sección 6.3.14, «Introducción a los discos duros (HDD)»). El RAID de nivel 1 es poco más que información replicada entre dos discos, siendo uno la copia exacta o «espejo» del otro. Así mantenemos dos copias de los datos en dos hardwares físicos distintos: si un disco falla, los datos seguirán disponibles en el otro. Los RAID de más alto nivel (niveles 2 a 5) implementan sistemas progresivamente más complejos de redundancia de datos y control de paridad que garantizan el mantenimiento de la integridad de los datos. Estos niveles más altos de RAID logran el mismo nivel de seguridad que el nivel 1 (RAID 1) o nivel de espejo, con una cantidad de espacio de disco significativamente más baja. Comparado con el 50% de pérdida de espacio útil en RAID 1, el nivel RAID 5 puede llegar, por ejemplo, al 25% (o menos, en función de su implementación). Los conjuntos o baterías de discos más sofisticados se encuentran con facilidad.

7.7.3   Copia de seguridad sobre cinta

7.7.3.1      No existe ningún componente de un sistema digital que pueda ser considerado fiable. La fiabilidad de un sistema solo se consigue mediante la creación de múltiples copias redundantes en cada fase. El componente final y más importante en la cadena de almacenamiento es la cinta de datos. En los últimos tiempos, el formato LTO ha ganado popularidad para este propósito (ver la sección 6.3.12, «Selección y supervisión del medio de cinta de datos»). Existen sin embargo otros formatos de cinta de datos que pueden ser apropiados en función de las circunstancias particulares.
    
7.7.3.2      Todos los datos almacenados en discos duros deben disponer de duplicados en cintas de almacenamiento adecuadas. Deben producirse un mínimo de dos conjuntos de copias sobre cinta con el objetivo de almacenarlas en ubicaciones físicamente distintas. Puesto que el hecho de utilizar el segundo conjunto de cintas para la restauración de datos no es tan inusual, muchos archivos bien establecidos mantienen tres conjuntos de copias, dos de ellas situadas cerca del sistema a fin de facilitar el acceso, y una tercera almacenada en una ubicación remota para protegerse de desastres físicos. Se ha convertido en norma la producción de tres conjuntos separados de cintas de datos utilizando diferentes productos, de los cuales se adquiere, en una sola compra, un lote considerable. Esta práctica facilita las medidas de control de calidad y rescate, una vez un lote de un cierto producto empiece a fallar. Un adecuado software de gestión de volúmenes (lotes) ayudará en el proceso de copias de seguridad y recuperación de datos, especialmente si el sistema incorpora un buen número de dispositivos de almacenamiento.

7.7.3.3      En entornos de código abierto o soluciones de baja tecnología resulta difícil implementar un control de errores, puesto que esta capacidad está ligada a un hardware específico. A pesar de ello, a continuación se describe una posible alternativa para el control de errores en entornos tecnológicamente poco sofisticados. Supongamos que el software de gestión de datos dispone de un catálogo (con una impresora conectada a este). El disco duro, en configuración RAID, contiene un conjunto completo de los datos. Además, existen copias completas de este conjunto en cintas. Disponemos al menos de dos copias. En el proceso de copia a cinta deberá imprimirse un identificador único (legible por humanos), sobre una etiqueta. Esta etiqueta se pegará al cartucho o casete de cinta. El mismo identificador único se grabará también en la cabecera de datos de la cinta. Se programará el sistema de gestión de datos para recordar al usuario que busque e inserte una cierta cinta identificada por el sistema. Más que chequear la cinta en busca de errores, lo que hará el sistema es verificar el contenido de la cinta contrastándolo con el mismo contenido almacenado en disco. El sistema en disco duro puede verificar la información de sus propios contenidos de datos y es consciente de sus propios fallos. Si la verificación de la cinta falla, el sistema podrá producir una nueva copia en cinta a partir del disco duro. Suponiendo unos 20 terabytes de almacenamiento y un proceso de verificación de dos cintas al día, el sistema sería capaz de verificar cada cinta y su duplicado a razón de tres veces por año. En el caso de un fallo en el disco duro que requiriese de las cintas para el reemplazo, se dispondría de dos cintas chequeadas en los últimos cuatro meses. El riesgo de que tanto las dos copias en cinta como el disco duro fallaran simultáneamente es muy bajo.

7.7.4   Sistema de almacenamiento con un único (o doble) operador

7.7.4.1      El sistema de almacenamiento de archivo más simple consistiría en conectar un conjunto de discos en RAID, con contenido exclusivo de datos, a la estación de audio digital (DAW) principal. Esta configuración solo es adecuada para instituciones con un único operador en el proceso de digitalización. Para el éxito de este enfoque resulta primordial dotarse de un plan de digitalización bien estructurado y una serie dedicada de discos con la que llevar a cabo la tarea sin mayores interrupciones. Esto garantizará que los discos duros conectados a la estación de trabajo realicen copias continuas a cinta siempre que se alcance la cantidad de datos establecida como objetivo para el medio.

7.7.4.2      Si las tareas de digitalización están en manos de dos operadores mediante dos estaciones de trabajo, será necesario facilitar el acceso a una o más unidades de disco compartidas. Se pueden compartir recursos si se define uno de los ordenadores como servidor, configurándolo como gestor de discos y conectándolo al segundo mediante un solo cable de red para permitir el acceso común. Esta opción se implementa de forma relativamente sencilla y permite a los dos operadores compartir la cabina de discos, aunque requiere algunos acuerdos de procedimiento para evitar conflictos. Para sistemas de almacenamiento manual a pequeña escala se requiere en cualquier caso una organización lógica de los datos, así como procedimientos estrictos de denominación.

7.7.4.3      En función del tamaño del sistema puede resultar más eficaz establecer una asociación con una institución de archivo más consolidada, o hasta contratar un proveedor externo de almacenamiento. En cualquier caso, la opción descrita más arriba resulta viable.

7.7.5   Sistema de almacenamiento con múltiples operadores

7.7.5.1      Para cualquier número de conexiones superior a dos, resultará imprescindible implementar un sistema en red para el almacenamiento de datos y copias de seguridad. Los sistemas en red permiten el acceso a múltiples usuarios de acuerdo con las normas establecidas por el sistema de gestión de datos. Las redes de pequeñas dimensiones son relativamente comunes y, con el nivel adecuado de conocimientos, de implementación fácil y asequible. Con un dispositivo anexo de almacenamiento para empresas puede lograrse un espacio de almacén razonable. Los productos y tecnologías de almacenamiento pueden clasificarse en tres tipos: almacenamiento directamente anexado (Direct-Attached Storage, DAS), almacenamiento conectado a red (Network-Attached Storage, NAS), y finalmente red de área de almacenamiento (Storage Area Network, SAN). La tecnología NAS ofrece mejor rendimiento y escalabilidad que DAS y resulta a la vez más asequible y simple de configurar que SAN. Por eso NAS se considera, desde el punto de vista del coste/beneficio, la tecnología escalable más apropiada para los sistemas del tamaño que nos ocupa.

7.7.5.2      La mayoría de los sistemas NAS de bajo coste adolecen de un ancho de banda reducido en comparación con sistemas más caros, lo que depara tiempos de acceso más altos (más lentos) o un menor número de accesos permitidos simultáneamente. Esto no acarreará mayores problemas para colecciones pequeñas, pues los requisitos de acceso simultáneo se mantienen bajos, especialmente si se opta por el formato MP3 para copias de acceso derivadas de los masters de preservación.

7.7.5.3      Un sistema típico de almacenamiento en red a pequeña escala puede consistir en un ordenador de sobremesa de tipo servidor conectado a un dispositivo NAS. El dispositivo NAS será capaz de albergar múltiples discos en una batería RAID. Un sistema NAS estándar de bajo coste albergará entre 0,5 y 20 terabytes de almacenamiento en disco (debido a la configuración en RAID, el almacenamiento útil será menor que el que indica la capacidad de los discos sin formato). La estaciones de trabajo de audio digital (DAW) accederán al dispositivo NAS a través de un conmutador de Ethernet o un dispositivo similar que, configurado adecuadamente, podrá separar el almacenamiento de datos de audio del flujo de datos propio de la red de gestión de oficina (Local Area Network, LAN). Las copias de seguridad de los discos duros se harán sobre cinta de datos.

7.8 Riesgos

7.8.1.1      Los sistemas de almacenamiento automatizados pueden ser configurados para copiar y refrescar datos de manera constante, descartando las cintas de datos que resulten poco fiables. Los sistemas digitales de almacenamiento masivo se diseñan con rigor profesional y están en manos de organizaciones con amplio presupuesto que pueden permitirse y garantizar las medidas necesarias para la seguridad de sus datos. Dado que aquí hablamos de procesos manuales de copia de seguridad y recuperación de datos, los riesgos de pérdidas de datos asociados con sistemas de diseño propio y administración manual o semiautomática no pueden menoscabarse. La responsabilidad de asegurar que el archivo de datos de audio sigue siendo válido y accesible recae sobre los individuos y requiere el chequeo manual, periódico, de las cintas de datos. Esta situación se agrava especialmente por el hecho de que muchas instituciones culturales y de investigación se hallan notoriamente subfinanciadas.

7.8.1.2      Aunque pueda parecer que los sistemas descritos incorporan un alto nivel de redundancia, hay que recordar que los dispositivos y soportes digitales pueden fallar en cualquier momento y sin previo aviso. Por ello es imperativo disponer, en cualquier estadio del proceso de digitalización y almacenamiento, de al menos dos copias de seguridad del fichero lineal archivado. Cualquier pequeño fallo conducirá inevitablemente a la pérdida de una mayor o menor cantidad de datos. Sin embargo, si se han puesto en marcha las estrategias adecuadas, el resultado no será fatal gracias a las copias redundantes disponibles. En vista del tiempo que acarrea el proceso de transferencia a digital, sin mencionar las inevitables pérdidas ocasionadas por viejos soportes, todo esfuerzo será poco para evitar la necesidad de volver a digitalizar materiales por causas derivadas de una arquitectura de seguridad inconsistente o una conducta negligente en acciones concretas.

7.8.2   Complejidad del sistema

7.8.2.1      Una vez implementados e instalados, los sistemas de almacenamiento de datos son relativamente fáciles de operar y mantener. Sin embargo, se recomienda encarecidamente la asistencia técnica de especialistas en TIC en los estadios iniciales de implementación y subsecuentes incidencias o en procesos de actualización para minimizar el riesgo derivado de una instalación deficiente.

7.8.3   Asociaciones y copias de seguridad

7.8.3.1      Como ya se ha comentado, la alianza con una institución de referencia a nivel de archivística digital que pueda facilitar la copia de seguridad de los datos resultará en una gran ventaja en la gestión de riesgos. Una red de repositorios que pueda crear y aceptar paquetes organizados de información redunda en una estrategia de preservación muy efectiva, pues reduce el riesgo de fallos debidos a desastres naturales o humanos o a la falta de recursos en un momento crítico del ciclo de vida de un objeto de audio digital.

7.8.4   Coste y escalabilidad

7.8.4.1      El sistema a pequeña escala que se acaba de describir puede crecer con el objeto de incrementar su capacidad de almacenamiento y gestión. Existen unidades de cinta relativamente pequeñas capaces de manejar un cierto número de cintas, y el uso de sistemas robotizados puede ayudar a expandir el sistema. Si los costes de los discos duros continúan cayendo, el coste del reemplazo y expansión de las baterías de discos seguirá siendo asequible.

7.8.4.2      Las alianzas entre suministradores comerciales y proveedores del ámbito del código abierto posibilitan la integración de sofisticados sistemas de software de repositorio en el marco seguro de un proveedor de servicios comercial. Tanto DSpace como FEDORA, por ejemplo, han presentado un sistema de código abierto que opera con una compañía comercial de soluciones de almacenamiento.
    
7.8.4.3      El coste de establecer un sistema de almacenamiento de datos a pequeña escala podrá parecer alto en comparación con la compra de un grabador de CDs. Sin embargo, la comparación a nivel de coste por bit del almacenamiento de más de unos pocos cientos de horas de audio revela, teniendo en cuenta todos los costes asociados al archivo, que las diferencias se reducen mucho. Además, un sistema de almacenamiento de datos adecuadamente administrado es en su conjunto mucho más fiable y podrá hacer realidad la transferencia de datos de audio a la siguiente tecnología de almacenamiento, cuando esto suceda de forma inevitable.