Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции / Л-8(ИЭТР) / Конспект лекции.doc
Скачиваний:
147
Добавлен:
16.05.2015
Размер:
4.06 Mб
Скачать

Слайд 13. Язык sgml(StandardGeneralizedMarkupLanguage, стандартный обобщенный язык разметки документов)iso8879

Пояснения

Исторически, разметка текста представляла собой внесение автором специальных инструкций в текст документа, которые описывали правила отображения данных на странице при распечатке. Далее, тот же подход (с небольшими изменениями) стали применять при подготовке электронных документов, предназначенных для просмотра на электронных средствах отображения.

Существуют два принципиально различных вида разметки – это физическая и логическая разметка. При использовании физической разметки указывается точный вид каждого фрагмента текста. Например, «центрированный текст, 14-м кеглем, жирный, гарнитура Times». При логической разметке указывается логическое значение данного фрагмента, например, «это заголовок главы».

Эти два способа разметки предназначаются для использования в разных ситуациях. Чтобы распечатать текст на принтере, необходимо использовать физическую разметку. То есть должно быть принято решение о размере полей, формате примечаний, а также о величине абзацного отступа в начале каждого параграфа. При этом необходимо для каждого фрагмента текста указать его шрифт, размер и стиль.

При обмене информацией с другими людьми на физическое оформление текста накладывается ряд ограничений. Например, стандартный лист бумаги в разных странах имеет различный размер. С чисто электронными документами, например онлайновой документацией, ситуация обстоит еще хуже. Размер экрана, его разрешение, шрифты и поддержка графики – все эти параметры широко варьируют от системы к системе.

К примеру, язык HTML – это, в основном, язык физической разметки.

В чем заключается идея логической разметки?

Начнем с того, что идея эта не нова. Она появилась еще в конце 60-х годов под названием обобщенного кодирования. В то время многие начали разграничивать содержимое документа и его представление. Эта точка зрения легла в основу работ фирм IBM и других.

Эти различия могут показаться формальными лишь при создании документа на страничку, который сразу же распечатывается и удаляется. Но предположим, вы выполняете заказ военного министерства по разработке документации на линкор. В этом случае, мало того, что объем документа будет исчисляться сотнями, а то и тысячами страниц, вы должны будете убедиться в том, что эта документация сможет служить все время существования судна, то есть не менее пятидесяти лет. Формата текстового редактора будет явно недостаточно. Кто может поручиться, что этот текстовый редактор все еще будет существовать через пятьдесят лет? Не будете же вы при каждом изменении текстового редактора конвертировать все документы, ведь тогда вам придется этим заниматься не реже, чем раз в два года. Кроме того, могут быть различные требования к распечатанным и онлайновым версиям документа. То есть надо будет использовать различные виды представления документации для вывода на экран и для печати. Хуже того, эти требования могут периодически меняться, заставляя вас переформатировать все документы в соответствии с новыми указаниями.

Подобные проблемы возникают и перед многими книгоиздателями. Книжные стили изменяются из года в год, и, переиздавая книги пяти- или десятилетней давности, хочется, с одной стороны, чтобы они выглядели современно, а с другой – чтобы не надо было всю книгу форматировать заново.

Решение кроется в корректном определении трех отдельных частей, так, чтобы при необходимости можно было изменить любую из них.

Язык разметки SGML (Standard Generalized Markup Language) был разработан в 60-х годах группой энтузиастов из компании IBM, которых интересовали вопросы переноса документов между различными платформами и операционными системами. В результате был создан язык разметки GML (General Markup Language), который предназначался для использования на ЭВМ семейства IBM. Создатели GML спустя несколько лет поняли, что нашли решение, позволяющее создавать документы, которые можно легко переносить с компьютера на компьютер и обрабатывать не только на компьютерах IBM. Со временем GML попал под патронаж Международной организации по стандартизации ISO и в 1986 году был утвержден как международный стандарт ISO 8879 (SGML).

Данный стандарт позволяет полностью описать структуру и содержание документа. Язык SGML является метаязыком, который описывает лишь общие правила построения документов и предоставляет следующие возможности:

  1. Описание логической структуры и содержания документа при помощи несложных механизмов.

  2. Контроль качества документа и проверка соответствия структура-содержание.

  3. Переносимость данных (независимость от аппаратно-программной платформы).

Некоторое время спустя Министерство обороны США приняло язык SGML в качестве формата технической спецификации. Подрядчики были обязаны разрабатывать всю документацию в формате SGML с целью обеспечения простоты распространения и совместимости.

В общем случае, различные SGML документы, удовлетворяющие стандарту, могут по разному восприниматься разными системами. Вследствие этого возникла необходимость разработки стандартов, жестко закрепляющих принципы использование языка SGML в конкретных отраслях. В частности, стандарт MIL 28001 описывает принципы использования языка SGML в публикациях министерства обороны США. Таким образом, для использования языка SGML необходимо опираться на некоторый стандарт (CALS стандарт) описывающий специфику применения языка SGML в заданной отрасли.

Соседние файлы в папке Л-8(ИЭТР)