Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МР_арх_хран.doc
Скачиваний:
5
Добавлен:
21.11.2019
Размер:
270.85 Кб
Скачать

4.2.2 Сохранение внешнего оформления (форматирования) текста.

Выделяют два основных способа форматирования текста: физическую и логическую разметку. Физическая разметка предполагает встраивание в текст кодов разметки (как правило, в двоичном формате, не совпадающем с 8-битовыми кодами ASCII, хотя возможно и символьное представление разметки). Коды разметки задают конкретные параметры шрифтов, величину отступов и междустрочных интервалов, дополнительные пробелы при выравнивании строк и т. п. Логическая разметка означает, что указываются не конкретные виды и размеры шрифтов, выделений, отступов и т. п., а логическое значение каждого фрагмента: «заголовок документа», «заголовок раздела», «абзац», «примечание» и т. д. Каждый такой фрагмент предваряется или обрамляется специальными маркерами – операторами разметки в символьной форме. Многие форматы сочетают возможности физической и логической разметки.

Для сохраниния текста в том виде, в котором он изначально создавался, могут быть рекомендованы варианты, окончательный выбор между которыми зависит от предполагаемого способа использования текста и имеющихся возможностей:

  • хранение данных в символьном формате;

  • хранение данных в графическом формате;

  • хранение данных в выходном формате.

В случае, когда решающим фактором является справочная ценность ЭД, т. е. предполагается активно работать с ним – вести поиск внутри текста, вставлять фрагменты из него в новые документы и т. п., - оптимальным является хранение в символьном формате с сохранением физической разметки. Наиболее предпочтительным в сегодняшних условиях представляется формат RTF (Rich Text Format), разработанный фирмой Microsoft и предназначенный для обмена данными между приложениями операционной системы Windows.

Для воспроизведения текста, сохраненного в формате RTF, потребуется текстовый редактор, способный конвертировать его в собственный внутренний формат, т. е. данный формат является в определенной степени программно-зависимым. Тем ни менее он может эффективно применяться при временном (порядка нескольких лет) хранении текста. Немаловажно, что конвертор формата RTF встроен в редактор Microsoft Word, являющийся на сегодня самым распространенным текстовым редактором в мире. Учитывая повсеместность операционной системы Windows, в которой Word является основным способом работы с текстом, можно не опасаться его отмирания в ближайшие годы. К тому же более поздние версии этого редактора позволяют открыть документ, созданный ранними версиями (но не наоборот). При дальнейшем развитии программного обеспечения фирмы Microsoft эта преемственность наверняка будет сохраняться. Преимуществами формата RTF перед собственным форматом Word является то, что его использование существенно уменьшает размеры файла и он более устойчив к разрушению,так как исключает возможность встраивания в документ макровирусов.

Если предназначенный для сохранения текст имеет прежде всего доказательную ценность, т. е. должен быть сохранен его первоначальный внешний вид, наиболее радикальным способом является хранение в графическом формате. Это предполагает сканирование предварительно распечатанного документа, т. е. превращение его в оцифрованное факсимильное изображение, с учетом общих требований к форматам графических файлов, изложенных ниже в разделе 4.5. При этом резко снижается возможность внесения в ЭД нераспознаваемых изменений, но одновременно исчезают и возможности поиска внутри текста или его вторичного использования для создания новых ЭД. Вся информация, необходимая для идентификации и обеспечения автоматизированного поиска, должна в таком случае быть продублирована в текстовом формате и включена в ИПХ.

Данный способ хранения предполагает наличие в организации определенных аппаратно-программных средств, осуществляющих преобразование текста в изображение (сканера, графического редактора). При отсутствии таких средств может быть рекомендован промежуточный вариант - хранение в выходном формате. В настоящее время сформировались общие принципы управления устройствами вывода, что дает возможность хранения данных в формате, независимом от типа компьютера, операционной системы или марки принтера. Текст, подготовленный к выводу на печать, может быть сохранен в таком виде на машинном носителе. Этот способ сохранения стал возможным после появления в 1984 г. языка программирования PostScript, разработанного фирмой Adobe Systems. Поскольку на печать выводится уже полностью отформатированный документ, он приобретает жестко заданную физическую разметку и подлежит только воспроизведению, но не редактированию. Таким образом, полностью сохраняется внешний облик документа, а возможности его использования (кроме просмотра) сильно ограничиваются. Правда, при обеспечении доказательной ценности ЭД следует учитывать, что текст в формате PostScript представляет собой набор символьных кодов и в принципе может быть изменен. Поэтому использование данного формата не отменяет необходимость мероприятий по защите информации.

Хранение в формате PostScript следует расценивать только как временную меру, т. к. нет гарантий, что его современный стандарт останется совместимым с принтерами будущих поколений.

В 1992 г. фирма Adobe Systems разработана на базе формата PostScript новый формат, претендующий на роль универсального средства обмена – PDF (Portable Document Format). Документ, преобразованный в данный формат, предназначен не для печати, а для отображения практически в неизменном виде разными программами просмотра, включая распространенные Интернет-браузеры. Это придает ему платформенную независимость (документ, созданный в операционной системе Windows, может быть воспроизведен на компьютере в среде UNIX или другой, и наоборот). Важным преимуществом является также совместимость с Интернет-технологиями, широкая распространенность которых в известной мере гарантирует, что в нужный момент удастся найти средство для просмотра.

Недостатком формата PDF представляется программная зависимость (для конвертации в него требуется программное обеспечение, собственником которого является фирма Adobe Systems). К тому же этот формат, несмотря на широкое распространение в Интернете, не стал пока общепризнанным стандартом. Жизнеспособность его и перспективность для архивного хранения, очевидно, можно будет оценить только по прошествии нескольких лет.