
- •Лекция 401
- •Компоненты документа
- •Язык SGML
- •Язык HTML. Термины
- •Язык HTML. Недостатки
- •Язык HTML. Преодоление недостатков
- •Язык XML. Задачи, поставленные при разработке
- •Язык XML. Спецификации
- •Общие компоненты технологии XML
- •Основные классы задач с использованием XML. 1. Создание новых языков
- •Основные классы задач с использованием XML. 2. Хранение данных
- •Основные классы задач с использованием XML. 3. Обмен данными и интеграция данных (1)
- •Основные классы задач с использованием XML. 3. Обмен данными и интеграция данных (2)
- •Документ XML. Имя XML
- •Документ XML. Пробельные символы и литералы
- •Документ XML. Представления структуры
- •Документ XML. Компоненты разметки
- •Документ XML. Пролог
- •Документ XML. Атрибуты пролога
- •Документ XML.
- •Документ XML. Атрибуты и содержимое элементов
- •Документ XML. Содержимое элемента
- •Документ XML. Инструкция по обработке
- •Документ XML. Секции CDATA
- •Документ XML. Ссылки на символы
- •Документ XML. Ссылки на сущности - 1
- •Документ XML. Ссылки на сущности - 2
- •Документ XML. Комментарии
- •Пространства имен XML - 1
- •Пространства имен XML - 2
- •Пространства имен XML - 3
- •Пространства имен XML - 4
- •Пространства имен XML - 5
- •Пространства имен XML - 6
- •Пространства имен XML - 7
- •Пространства имен XML - 8

Лекция 401
Язык XML (введение)
1

Компоненты документа
Три компонента документа:
содержание;
структура;
стиль.
Содержание – текст, изображения и (в электронном виде) мультимедийные данные, а также ссылки на другие документы. Документы можно классифицировать по типам, например, книга или железнодорожный билет. Структура – это состав и порядок следования частей (блоков) документа.
Стиль – определяет форму вывода его содержания на то или иное устройство (например, принтер или дисплей). Один и тот же документ может выводиться разными стилями 2
как на разные носители, так и на один и тот же

Язык SGML
Язык разметки документов – искусственный |
|
|
язык, предназначенный для описания структуры |
|
|
документа и отношений между различными |
|
|
объектами структуры. Данные разметки |
|
|
называются также метаданными. |
|
|
Язык SGML (Standard Generalized Markup |
|
|
Language – стандартный обобщенный язык |
|
|
разметки), определяющий правила записи |
|
|
элементов разметки документа. Документ, |
|
|
соответствующий правилам языка, называется |
|
|
документом SGML. |
|
|
Определение: стандарт ISO 8879. |
|
|
Использование: |
|
|
|
создание технической документации; |
3 |
|
в автомобильной промышленности; |

Язык HTML. Термины
Язык гипертекстовой разметки – HTML |
|
(HyperText Markup Language) – широко |
|
используется в Web-технологиях. |
|
Разработчик: Тим Бернерс Ли (1991 г). |
|
Cпецификация HTML – содержит |
|
фиксированный набор элементов и |
|
соответствующих им атрибутов языка HTML в |
|
соответствиями с правилами SGML, т.е. язык |
|
HTML является приложением SGML. |
|
Документ HTML – текстовый файл, в котором |
|
содержание структурировано элементов, |
|
определенных в спецификации HTML. |
|
Web-браузер – программа обработки |
4 |
документов HTML. |

Язык HTML. Недостатки
По мере развития языка HTML и расширения области применения стали все более проявляться его недостатки:
отсутствие средств отображения сложных структур;
невозможность введения новых элементов языка (например, для отображения математических формул);
некоторые элементы языка стали
избыточными (например, с появлением |
|
таблиц стилей стилевые элементы языка |
|
HTML стали ненужными). |
5 |

Язык HTML. Преодоление недостатков |
|
Для преодоления недостатков необходимо было |
|
создание новых типов документов для |
|
использования в сети (например, для |
|
математических формул). Эти типы дополняли |
|
или расширяли документы HTML. |
|
Первоначально новые типы документов |
|
предполагалось создавать с помощью языка |
|
SGML. |
|
Однако из-за сложности языка SGML было |
|
принято решение для использования в Internet |
|
разработать новый язык – XML (Extensible Markup |
|
Language – расширенный язык разметки). Этот |
|
язык является подмножеством языка SGML, |
|
полностью совместимым с ним. |
6 |
Соответственно новые типы документов, |

Язык XML. Задачи, поставленные при разработке
Разработчик: группа XML Working Group (первоначально называлась SGML Editorial Review Board), сформированная в 1996 году под руководством World Wide Web Consortium (W3C). При разработке языка XML ставились следующие задачи:
1. XML должен быть пригоден для непосредственного использования в Internet.
2. XML должен иметь широкий круг применения.
3. XML должен быть совместим с SGML.
4. обработчики документов XML должны быть просты в написании.
5. количество необязательных свойств в XML должно быть сведено к абсолютному минимуму, в идеале число их
вообще должно быть нулевым.
6. XML документы должны быть удобны для чтения и достаточно понятны.
7. подготовка XML документа должна осуществляться быстро.
8. процедура построения XML документа должна быть
формальной и точной. 7
9. процедура создания XML документов должна быть проста.

Язык XML. Спецификации
Первая спецификация языка XML – XML 1.0 была
принята в феврале 1998 г.
Вторая редакция XML 1.0 – XML 1.0 (Second Edition)
принята в октябре 2000 г.,
Третья редакция XML 1.0 – XML 1.0 (Third Edition) в
феврале 2004 г.
Последняя версия XML 1.0 (Fourth Edition –
четвертая редакция) была принята в августе 2006 г.
В этом же году в апреле была принята новая версия языка – XML 1.1. Эта версия не содержит
существенных отличий от версии 1.0, за исключением изменений в допустимых именах элементов и атрибутов, связанных с вводом в 8
действие новой версии кодировки Unicode –

Общие компоненты технологии XML
Помимо языка XML в состав основных компонент технологии XML входят следующие общие компоненты:
Схемы XML (XML Schema) – средства описания документа XML;
Объектная модель документа (DOM) для XML;
XPath (XML Path Language) – поддержка адресации в документе XML;
XLink (XML Linking Language) – средства добавления гиперссылок
в документ XML;
XQuery (XML Query Language) – язык запросов к документам XML. Кроме того, в состав технологии XML входят также:
расширяемый язык стилей XSL (Extensible Stylesheet Language);язык преобразований XSL – XSLT (XSL Transformation);
язык масштабируемой векторной графики – SVG (Scalable Vector Graphics)
и другие компоненты, как принятые консорциумом W3C, так и находящиеся в стадии разработки.
9

Основные классы задач с использованием XML. 1. Создание новых языков
Язык XML – это набор синтаксических правил, для формирования документов XML, т.е. фактически XML – это язык, который описывает другие языки. Такие языки называются метаязыками. Таким образом, при описании логической схемы документа, создается новый язык со своим синтаксисом и семантикой.
Наиболее известные языки, созданные с использованием XML :
WML (Wireless Markup Language) – язык разметки для беспроводных устройств, основной формат данных для беспроводного протокола WAP (Wireless Application Protocol);
XHTML – совместимая с XML версия языка HTML;
SOAP (Simple Object Access Protocol) – протокол XML для обмена информацией в распределенных системах;
RDF (Resource Description Framework) – система описания ресурсов;
MathML (Mathematical Markup Language) – язык для описания математических выражений;
SVG (Scalable Vector Graphics) – язык масштабируемой векторной графики.
10