12. Gerenciamento de dados: princípios de arquivamento num ambiente de arquivos digitais

As principais ações no arquivamento digital dizem respeito à preservação de bits, ou seja, um conjunto de ações que mantém a integridade dos dados digitais (“fluxos de bits”) geridos pela instituição responsável.

Ações para além da preservação de bits serão necessárias quando o formato do conteúdo entrar em obsolescência. A prática mais comum será a migração de formato, embora (conforme observado nos comentários da seção 10) possa haver contextos em que a emulação do sistema seja necessária. Enquanto decisões de preservação de bits podem ser deixadas para especialistas em tecnologia da informação e aplicações de software e hardware apropriadas, as ações além da preservação de bits serão beneficiadas com o envolvimento das pessoas com as responsabilidades curatoriais. O que está em causa exige consideração sobre as propriedades significantes do conteúdo, a composição da comunidade de pesquisa atendida e uma avaliação da obsolescência do formato e das opções para os novos formatos alvo.

O gerenciamento de dados deve observar os seguintes princípios fundamentais:

  • Os arquivos são geralmente colocados em sistemas de armazenamento por cópia. Esse processo deve produzir duplicatas que sejam comprovadamente idênticas aos originais. Esse processo de verificação da integridade de dados pode ser conseguido por meio da criação prévia de uma soma de verificação (checksum), também conhecida como hash ou digest. O processo de verificação deve acontecer imediatamente após a criação da cópia, idealmente como um procedimento automático.
  • A permanente integridade dos dados de conteúdo dos arquivos deve ser checada a intervalos regulares para garantir que possam ser lidos exatamente como foram escritos, sem erros ou alterações.
  • Contudo, dependendo do formato original do arquivo, pode ser desejável transcodificá-lo para um novo formato alvo, em vez de simplesmente copiar o arquivo original (consulte as seções 10 e 11). Esse processo é conhecido como migração de formato.
  • O conteúdo digital, armazenado em arquivos digitais ou suportes físicos, deve ser copiado para novos suportes físicos antes que ocorram erros incorrigíveis. Quando os formatos originais e alvo são os mesmos, esse processo é conhecido como refrescamento ou migração de mídia.
  • É essencial manter pelo menos duas cópias de preservação digital, de preferência mais, e usar cópias adicionais feitas especialmente para acesso. As cópias de preservação devem ser mantidas em diferentes locais geográficos, sempre que possível. Mecanismos de segurança adicionais também podem ser providenciados através do uso de diferentes tecnologias de armazenamento para cada conjunto de cópias de preservação. Ao escolher quais tecnologias usar, deve-se ter em mente que uma estratégia é tão forte quanto seu elo mais fraco.
  • Cópias de acesso devem ser feitas sempre que possível. Diferentemente das matrizes de arquivo, tais cópias de acesso ou de distribuição podem ser subjetivamente modificadas, a depender dos requisitos dos usuários. A redução de dados também pode ser empregada quando compatível com os requisitos do usuário. Assim como na criação de matrizes de arquivo, a cuidadosa documentação de todos os parâmetros e procedimentos empregados é essencial.
  • Onde possível, as verificações de garantia da integridade de dados deve ser automática, como é factível com equipamentos dentro de repositórios digitais confiáveis. Se isso não for possível, as verificações manuais deverão ser realizadas em uma base estatisticamente significativa.

Comentários:

Embora esses princípios se apliquem igualmente a qualquer forma de preservação de arquivos digitais, os tamanhos relativamente grandes e a natureza temporal do conteúdo audiovisual exigem que as capacidades de armazenamento e largura de banda sejam cuidadosamente consideradas.

Essencialmente, estes princípios são os mesmos recomendados para o mundo analógico. No entanto, uma diferença fundamental é a dimensão qualitativa do mundo dos arquivos digitais, que permite a validação objetiva da integridade dos registros. O monitoramento regular da integridade de dados está entre as obrigações centrais das rotinas da preservação digital. Suportes e sistemas digitais podem falhar e falham, sem aviso prévio e a qualquer momento. Estratégias para minimizar riscos a arquivos digitais são grandemente apoiadas pela criação de redes entre a coleção primária, o usuário e os arquivos de backup.