
- •Лекция 4-01
- •4.1.2. Основные классы задач xml
- •4.1.2.1. Создание новых языков
- •4.1.2.2. Хранение данных
- •4.1.2.3. Обмен данными и проекты интеграции
- •4.1.3. ДокументыXmLи их компоненты
- •4.1.3.1. Структура документаXml
- •4.1.3.2. Объявления
- •4.1.3.3. Элемент
- •4.1.3.4. Инструкция по обработке
- •4.1.3.5. СекцииCdata
- •4.1.3.6. Ссылки
- •4.1.3.7. Комментарии
- •4.1.4. Пространства именXml
4.1.3.4. Инструкция по обработке
В XML-документы могут быть включены не относящиеся к содержимому документа инструкции, несущие информацию для приложения, которое будет этот документ обрабатывать. Инструкции по обработке имеют вид:
<?приложениесодержимое?>
Инструкция по обработке всегда заключается в угловые скобки со знаками вопроса. Первая часть инструкции, приложение, определяет программу или систему, которой предназначена вторая часть, ее содержимое, например
<?serv cache-document?>
В данном случае целевое приложение имеет имя "serv", а сама инструкция может быть интерпретирована как указание серверу на то, что документ нужно сохранить в кэш-памяти.
Целевое приложение может иметь любое имя (кроме "xml" в любом регистре символов).
4.1.3.5. СекцииCdata
Секции CDATA выделяют части документа, внутри которых текст не должен восприниматься как разметка и могут задаваться в тех местах документа, в которых размещается текст. Секции CDATA задаются следующим образом:
<![CDATA[содержимое]]>
Например, если текст документа содержит синтаксис разметки документов, для того, чтобы он воспринимался именно как текст, можно поместить такие данные внутрь секции CDATA:
<![CDATA[<text>Содержимое</text>]]>
Раздел CDATA не может содержать последовательность символов]]>, поскольку она используется для завершения раздела CDATA.
4.1.3.6. Ссылки
В текст документа могут вставляться ссылки на символы и ссылки на сущности.
Ссылки на символы обычно используются, когда необходимо вставить в текст документа, символы, отсутствующие на клавиатуре (например, греческие буквы или символы математических операций). Эти ссылки формируются одним из следующих способов:
&#xHH;– гдеHHпредставляет собой шестнадцатеричный код символа в кодировке, указанной в атрибутеencodingобъявления документаXML(в представлении кода можно использовать буквыa-fкак в нижнем, так и в верхнем регистре);
&#DD;– гдеDDпредставляет собой десятичный код символа в кодировке, указанной в атрибутеencodingобъявления документаXML.
Пример:
Для кодировки Windows-1251 следующая строка документаXML:
В уравненииα ≠ β.
будет выведена на экран как
В уравнении.
Ссылка на сущность определяется следующим образом:
&имя;
где имя– это имя сущности.
Ссылки на сущности используются, если документ XMLсодержит повторяющиеся части или если документXMLразбивается на отдельные модули.
В табл. 4.1.1. приведены встроенные сущности языка XML:
Таблица 4.1.1. Встроенные сущности языка XML
Имя сущности
|
Значение
|
Описание
|
lt
|
<
|
знак "меньше"
|
gt
|
>
|
знак "больше"
|
amp
|
&
|
амперсант
|
apos
|
'
|
апостроф или одинарные кавычки
|
quot
|
" |
двойные кавычки
|
Все остальные сущности должны быть определены в предложении <!ENTITY …>вDTD.
Пример:
Элемент <hr> выводит горизонтальную линию в документе HTML.
При выводе документа на экран строка примет следующий вид:
Элемент <hr> выводит горизонтальную линию в документе HTML.