
- •Архивное хранение электронных документов Методические рекомендации
- •Содержание
- •Введение
- •1 Назначение и область применения
- •2 Особенности электронных документов
- •2.1. Воспроизведение электронных документов
- •2.2 Структура электронных документов
- •2.3. Критерии аутентичности электронных документов
- •2.4 Сохранение электронных документов во времени
- •3 Обеспечение сохранности и доступности электронных документов в организациях
- •3.1 Общие требования
- •3.2 Планирование жизненного цикла эд
- •4 Выбор оптимальных форматов файлов электронных документов
- •4.1 Характеристика проблемы
- •4.2 Текст
- •Хранение простых текстов
- •4.2.2 Сохранение внешнего оформления (форматирования) текста.
- •4.2.3. Сохранение гипертекста.
- •4.3 Электронные таблицы
- •4.4 Базы данных
- •4.5 Графика
- •4.5.1 Хранение эд в виде изображений.
- •4.6 Звук
- •4.7 Видео
- •4.8 Вопросы компрессии данных
- •5 Учет и хранение электронных документов в ведомственном архиве и передача в государственный архив
- •Форматы файлов, поддерживаемые Microsoft Word 97
- •Форматы текстовых файлов
- •Форматы графических файлов
- •2.1 Форматы графических файлов, поддерживаемые Microsoft Word 97
- •Графические фильтры для Microsoft Word 97
- •Термины и определения
- •Перечень сокращений
- •Перечень литературы
4.2 Текст
Текст является неотъемлемой частью практически всех документов - как традиционных, так и электронных. Даже если основное содержание ЭД составляет графическая или аудиовизуальная информация, текст присутствует в его названии, реквизитах, информационно-поисковой характеристике. Этот текст, хранимый на носителе в закодированном виде, должен быть пригодным для воспроизведения.
С точки зрения архивного хранения следует различать три вида текстовых документов:
простые тексты, для которых имеет значение прежде всего информация, а не внешнее оформление (форматирование);
отформатированные тексты, которые необходимо сохранить в первоначальном виде с сохранением типов и размеров шрифтов, отступов, разбиения на страницы и т. п.;
гипертекстовые документы.
Хранение простых текстов
Оптимальным способом хранения текстовой информации считается так называемый формат ASCII (American Standard Code for Information Interchange), разработанный Американским национальным институтом стандартизации в 1968 г. Все символы текста (буквы, цифры, пробелы, знаки препинания), а также управляющие символы (знаки конца строки, конца абзаца, начала и конца выделенного текста и т.п.) в этом формате задаются восьмизначными кодами в соответствии с избранной кодовой таблицей. Таким образом, кодирование каждого символа требует восьми битов или одного байта машинной памяти, что бывает очень удобно при определении размеров текста. Формат ASCII является программно-независимым и воспроизводится практически всеми текстовыми редакторами.
Кодовые таблицы содержат разные символьные эквиваленты для одних и тех же восьмизначных двоичных кодов. Программы, использующие разные кодовые таблицы, по-разному воспроизводят на экране или на печати одни и те же символы. Поэтому в создаваемом ЭД или его информационно-поисковой характеристике должно в явном виде указываться, какие кодовые таблицы в нем использованы.
При сохранении текста в данном формате следует учитывать, что при воспроизведении он может быть отображен шрифтами разных типов и размеров, а также выведен на печать при разных значениях параметров страницы (длина и количество строк, величина полей и междустрочных интервалов и пр.). При этом внешний вид одного и того же текста может сильно различаться. Это может затруднить возможность ссылаться на определенное место документа (например, при его цитировании). Поэтому целесообразно использовать нумерацию разделов и подразделов документа, при необходимости – вплоть до нумерации абзацев.
Одним из способов избежать проблем при воспроизведении может быть сведение форматирования к минимуму, т. е. представление текста в виде линейной последовательности символов, разбитой на строки. Единственным управляющим символом в этом случае является «конец строки», отражаемый кодом клавиши «Ввод» («Enter»). Абзацы начинаются от левого края без отступа и отделяются друг от друга пустой строкой (двойным нажатием клавиши «Ввод»), между словами всегда ставится строго один пробел, отсутствуют переносы, выделения курсивом, подчеркивания и т. п. Заголовки и примечания оформляются, как обычные абзацы, разбивка на страницы отсутствует.Текст, сохраненный таким способом, может быть одинаково воспроизведен практически любым текстовым редактором, а затем при необходимости отформатирован средствами этого редактора. Рекомендуется хранить таким образом всю сопроводительную документацию к ЭД.