12. SPRÁVA DAT: PRINCIPY ARCHIVACE V PROSTŘEDÍ NA BÁZI SOUBORŮ

Klíčové postupy při archivaci na bázi souborů se týkají uchování bitů, tj. souboru opatření k zachování integrity digitálních dat („bitových toků“), které spravuje odpovědná instituce.

Zásahy nad rámec uchování bitů budou rozhodně potřebné, je-li formát obsahu zastaralý. Nejběžnějším krokem je přenos formátu, ačkoli (jak je uvedeno v poznámce v kapitole 10) mohou existovat kontexty, ve kterých je vyžadována emulace systému. Zatímco rozhodnutí o uchování bitů mohou být ponechána specialistům na informační technologie a příslušným softwarovým a hardwarovým aplikacím, zásahy nad rámec uchování bitů, budou vyžadovat účast osob s kurátorskými pravomocemi. V sázce je zvážení aspektů všech významných vlastností obsahu, názoru komunity vědců, kterým jsou určené, zhodnocení zastaralosti formátu a možností nových cílových formátů.

Správa dat musí dodržovat následující zásadní pravidla:

  • ■ Soubory jsou obecně umístovány do úložných systémů kopírováním. Tento proces musí vytvářet duplikáty, které jsou ověřitelně identické s originály. Tohoto procesu kontroly integrity dat lze dosáhnout pomocí předchozího vytvoření kontrolního součtu, známého také jako hash nebo digest. Proces ověření by měl proběhnout okamžitě po vytvoření kopie, nejlépe jako automatizovaná procedura.
  • Průběžná integrita dat u obsahu na bázi souborů musí být kontrolována v pravidelných intervalech, aby bylo zajištěno, že mohou být přečteny přesně tak, jak byly zapsány, bez chyb a změn.
  • V závislosti na původním formátu souborů však může být žádoucí překódovat soubor do nového cílového formátu, a ne jednoduše zkopírovat původního soubor (viz kapitoly 10 a 11). Tento proces je znám jako přenos (migrace) formátu.
  • Digitální obsah, ať již na bázi souboru nebo nosiče, musí být zkopírován na nový fyzický nosič předtím, než dojde k neodstranitelným chybám. Pokud jsou původní a cílové formáty stejné, je tento proces znám jako obnovení (refreshment) nebo přenos (migrace) médií.
  • Je nezbytné uchovávat alespoň dvě bezpečnostní digitální kopie, v ideálním případě více, a podle potřeby používat další vyhrazené kopie určené k uživatelské práci. Bezpečnostní kopie by měly být uchovávány na geograficky odlišném místě, kdykoli je to možné. Další zabezpečení by mělo být také zajištěno použitím různých uchovávacích technologií pro každou sadu bezpečnostních kopií. Při výběru vhodných technologií je třeba mít na paměti, že strategie bude tak silná jako její nejslabší článek.
  • Kopíe určené k uživatelské práci by měly být vytvořeny vždy, je-li to možné. Na rozdíl od archivních bezpečnostních kopií (master copy), tyto uživatelské kopie mohou být subjektivně upraveny v závislosti na požadavcích uživatelů. Může být použita i reduce dat, je-li to v souladu s požadavky uživatele. Stejně jako při vytváření bezpečnostních kopií, je nezbytná pečlivá dokumentace všech použitých parametrů a postupů.
  • Tam, kde je to možné, by měla kontrola integrity dat být automatizována, což je možné pomocí zařízení v důvěryhodných digitálních repozitářích. Pokud to není možné, je třeba provést manuální kontroly na statisticky významném základě.

Poznámka:

Zatímco se tyto zásady vztahují stejně na jakoukoli formu uchování na bázi souborů, poměrně značné velikosti souborů a časová povaha audiovizuálního obsahu vyžadují, aby byla pečlivě zvážena kapacita úložiště a šířky pásma.

V podstatě jsou tyto zásady stejné jako ty, doporučené pro analogovou oblast. Jedním z hlavních rozdílů je však kvalitativní dimenze souborového digitálního světa, který umožňuje objektivní ověření integrity záznamů. Pravidelné monitorování integrity dat je jednou z klíčových povinností postupů digitálního uchovávání. Digitální nosiče a systémy mohou kdykoli bez varování selhat a také selhávají. Strategie minimalizace rizik pro digitální archivy jsou silně podporovány propojením mezi primární sbírkou a uživatelskými a zálohovými archivy.