Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
224
Добавлен:
11.06.2015
Размер:
9.28 Mб
Скачать

Способы передачи информации о форматировании текста

Кроме различия в кодировках самого текста, отличаются еще способы, которыми передается информация о форматировании текста. Существуют три способа передачи отформатированного текста на другой компьютер или в Internet).

1. Сохранение разметки путем включения ее описания в текст.

Например, фрагмент текста «Это жирный шрифт» можно представить в виде «Это <bold>жирный<endbold>шрифт». Такой подход применяется в языке HTML, который используется в World Wide Web, в издательских системах ТеХ и LaTeX и т. д. Файл по-прежнему остается только текстовым, его легко передавать с компьютера на компьютер, читать и править практически в любом текстовом редакторе (с учетом кодировки символов).

2. Сохранение разметки путем передачи графического изображения каждой страницы.

Так работает язык PostScript. Файлы в формате PostScript выглядят на другом компьютере точно там как их создали, но их практически нельзя редактировать.

3. Сохранение разметки путем записи в файл не только символов (числовые коды символов), но и информации о том, как он должен быть оформлен (дополнительные управляющие коды).

Различные форматы текстовых файлов (документов)

Способ кодировки информации о форматировании называется форматом. Большинство текстовых процессоров, в том числе популярный Microsoft Word, используют этот метод. Недостаток его в том, что почти все текстовые процессоры и настольные издательские системы используют свои форматы. Обычно в них входит также конвертер, позволяющий читать «чужие» форматы, но при конвертировании форматирование часто теряется. Более того, даже разные версии документов того же Microsoft Word имеют разные форматы.

На примере конвертера, входящего в состав Microsoft Word, рассмотрим некоторые из форматов, которые можно открыть в Word или, наоборот, сохранить в них созданный в Microsoft Word файл.

– Текст в формате MS-DOS – текст в кодировке ASCII (CP 866), форматирование не сохраняется.

Далее все форматы используют кодировку, принятую в Windows. В зависимости от версии это ANSI (CP 1251) или Unicode.

– Только текст (ТХТ) – форматирование не сохраняется.

– Текст в формате Rich Text Format (RTF) – кроме текста сохраняется также форматирование. Все управляющие коды форматирования преобразуются в текстовые команды (например, «Это жирный шрифт» преобразуется примерно в такой текст: «Это {\b жирный} шрифт»).

– Документ Word (DOC) – оригинальный формат Используемой версии Microsoft Word. Форматирование сохраняется. Для правильного прочтения необходим Microsoft Word той же или более старшей версии, а также соответствующие шрифты.

– Word 2.0, Word 6.0/95 – оригинальные форматы предшествующих версий Microsoft Word. Из формата Word 97 форматирование сохраняется не полностью.

Works для Windows – оригинальный формат системы Works. Из формата Word форматирование сохраняется не полностью.

HTML – формат хранения Web-страниц. Все управляющие коды форматирования преобразуются в текстовые команды (теги). Например, «<р>Это < bold >жирный</ bold > шрифт</р>« вместо «Это жирный шрифт».

Бывают конвертеры из/в другие форматы.

Соседние файлы в папке К экзамену