Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МР_арх_хран.doc
Скачиваний:
17
Добавлен:
21.11.2019
Размер:
270.85 Кб
Скачать

4.2 Текст

Текст является неотъемлемой частью практически всех документов - как традиционных, так и электронных. Даже если основное содержание ЭД составляет графическая или аудиовизуальная информация, текст присутствует в его названии, реквизитах, информационно-поисковой характеристике. Этот текст, хранимый на носителе в закодированном виде, должен быть пригодным для воспроизведения.

С точки зрения архивного хранения следует различать три вида текстовых документов:

  • простые тексты, для которых имеет значение прежде всего информация, а не внешнее оформление (форматирование);

  • отформатированные тексты, которые необходимо сохранить в первоначальном виде с сохранением типов и размеров шрифтов, отступов, разбиения на страницы и т. п.;

  • гипертекстовые документы.

      1. Хранение простых текстов

Оптимальным способом хранения текстовой информации считается так называемый формат ASCII (American Standard Code for Information Interchange), разработанный Американским национальным институтом стандартизации в 1968 г. Все символы текста (буквы, цифры, пробелы, знаки препинания), а также управляющие символы (знаки конца строки, конца абзаца, начала и конца выделенного текста и т.п.) в этом формате задаются восьмизначными кодами в соответствии с избранной кодовой таблицей. Таким образом, кодирование каждого символа требует восьми битов или одного байта машинной памяти, что бывает очень удобно при определении размеров текста. Формат ASCII является программно-независимым и воспроизводится практически всеми текстовыми редакторами.

Кодовые таблицы содержат разные символьные эквиваленты для одних и тех же восьмизначных двоичных кодов. Программы, использующие разные кодовые таблицы, по-разному воспроизводят на экране или на печати одни и те же символы. Поэтому в создаваемом ЭД или его информационно-поисковой характеристике должно в явном виде указываться, какие кодовые таблицы в нем использованы.

При сохранении текста в данном формате следует учитывать, что при воспроизведении он может быть отображен шрифтами разных типов и размеров, а также выведен на печать при разных значениях параметров страницы (длина и количество строк, величина полей и междустрочных интервалов и пр.). При этом внешний вид одного и того же текста может сильно различаться. Это может затруднить возможность ссылаться на определенное место документа (например, при его цитировании). Поэтому целесообразно использовать нумерацию разделов и подразделов документа, при необходимости – вплоть до нумерации абзацев.

Одним из способов избежать проблем при воспроизведении может быть сведение форматирования к минимуму, т. е. представление текста в виде линейной последовательности символов, разбитой на строки. Единственным управляющим символом в этом случае является «конец строки», отражаемый кодом клавиши «Ввод» («Enter»). Абзацы начинаются от левого края без отступа и отделяются друг от друга пустой строкой (двойным нажатием клавиши «Ввод»), между словами всегда ставится строго один пробел, отсутствуют переносы, выделения курсивом, подчеркивания и т. п. Заголовки и примечания оформляются, как обычные абзацы, разбивка на страницы отсутствует.Текст, сохраненный таким способом, может быть одинаково воспроизведен практически любым текстовым редактором, а затем при необходимости отформатирован средствами этого редактора. Рекомендуется хранить таким образом всю сопроводительную документацию к ЭД.