- •Архивное хранение электронных документов Методические рекомендации
- •Содержание
- •Введение
- •1 Назначение и область применения
- •2 Особенности электронных документов
- •2.1. Воспроизведение электронных документов
- •2.2 Структура электронных документов
- •2.3. Критерии аутентичности электронных документов
- •2.4 Сохранение электронных документов во времени
- •3 Обеспечение сохранности и доступности электронных документов в организациях
- •3.1 Общие требования
- •3.2 Планирование жизненного цикла эд
- •4 Выбор оптимальных форматов файлов электронных документов
- •4.1 Характеристика проблемы
- •4.2 Текст
- •Хранение простых текстов
- •4.2.2 Сохранение внешнего оформления (форматирования) текста.
- •4.2.3. Сохранение гипертекста.
- •4.3 Электронные таблицы
- •4.4 Базы данных
- •4.5 Графика
- •4.5.1 Хранение эд в виде изображений.
- •4.6 Звук
- •4.7 Видео
- •4.8 Вопросы компрессии данных
- •5 Учет и хранение электронных документов в ведомственном архиве и передача в государственный архив
- •Форматы файлов, поддерживаемые Microsoft Word 97
- •Форматы текстовых файлов
- •Форматы графических файлов
- •2.1 Форматы графических файлов, поддерживаемые Microsoft Word 97
- •Графические фильтры для Microsoft Word 97
- •Термины и определения
- •Перечень сокращений
- •Перечень литературы
4.4 Базы данных
Базы данных, как правило, имеют прежде всего справочную ценность. Они предназначены для поиска информации по нескольким параметрам (ключам) и вывода ее в форме итоговых отчетов. Поэтому данные хранятся в специфичных форматах, сочетающих символьные и двоичные коды, и тесно увязаны с программным обеспечением (СУБД). Отчеты, как правило, представляют собой обычные тексты или таблицы в символьном формате. Информация, содержащаяся в базах данных, может представлять историческую ценность, что требует их архивного хранения. При этом возможны три варианта:
хранение базы данных вместе с исходным программным обеспечением;
хранение содержания базы в фиксированном текстовом формате;
периодическая конвертация базы для новых поколений СУБД с воссозданием поисковых средств на базе исходного алгоритма.
Первый из этих вариантов является полностью программно-зависимым. Информация базы данных будет оставаться доступной лишь до тех пор, пока удастся поддерживать эмуляцию СУБД и созданных с ее помощью поисковых программ в новой информационной среде. Поэтому данный вариант может применяться только как временная мера при непродолжительном (порядка нескольких лет) ведомственном хранении. Даже в этом случае рекомендуется одновременно хранить содержимое базы в фиксированном текстовом формате.
Второй вариант является менее програмно-зависимым. Например, файлы DBF-формата, создаваемые с помощью СУБД класса dBASE, могут быть преобразованы в текстовые файлы с помощью параметра SDF (System Data Format) команд СУБД, изначально предназначенного для организации обмена данными с другими СУБД, программами LOTUS 1-2-3, Word и т.д.. В результате создается файл в фиксированном формате, который является разновидностью формата ASCII и содержит логические записи фиксированной длины, состоящие из полей фиксированной длины.
В случае сложной многофайловой структуры базы необходимо осуществить предварительное формирование отчета, содержащего в одной или нескольких таблицах полную информацию из всех полей и записей базы данных, имеющих историческую ценность. Затем сводные таблицы преобразуются в фиксированный формат. ИПХ при этом должна содержать полное описание структуры с указанием названия каждого поля и его длины в байтах, чтобы иметь возможность найти любую ячейку, отсчитав нужное число байтов от начала файла. В последующем можно восстановить всю таблицу и при желании отформатировать ее. Данный вариант аналогичен вышеизложенному способу хранения простых текстов и близок к идеалу программно-независимого хранения данных. Его единственным недостатком является то, что утрачиваются богатые возможности поиска информации по нескольким ключам одновременно, которыми обладала исходная база данных. Тем не менее сохраняется возможность доступа к данным посредством программ обработки текстов, включая их поисковые средства.
Третий вариант требует конвертации файлов данных в форматы новых версий наиболее перспективных СУБД и одновременной перенастройки, а иногда и полной переделки поисковых программ. Технически эта задача вполне разрешима (при наличии четкого описания алгоритмов поиска и структуры базы), но требует больших трудозатрат и наличия квалифицированных кадров. Поэтому к данному варианту стоит прибегать только в случае особо ценной информации, пользующейся высоким спросом в течение долгого времени.