
- •ЛЕКЦИЯ 9. ВВЕДЕНИЕ В XML
- •ДОСТОИНСТВА XML
- •Широко используется для хранения и обработки документов;
- •НЕДОСТАТКИ XML
- •XML не содержит встроенной в язык поддержки типов данных. В нём нет понятий
- •ВЗАИМОСВЯЗЬ МЕЖДУ SGML, XML И
- •ПРАВИЛЬНО ПОСТРОЕННЫЕ И ДЕЙСТВИТЕЛЬНЫЕ ДОКУМЕНТЫ
- •СИНТАКСИС XML
- •СТРУКТУРА XML ДОКУМЕНТА
- •Остальная часть этого XML-документа состоит из вложенных элементов, некоторые из которых имеют
- •Кроме содержания у элемента могут быть атрибуты
- •СХЕМА XML
- •ЯЗЫКИ ОПИСАНИЯ СХЕМ
- •Без использования CSS или XSL XML-документ отображается как простой текст в большинстве веб-

ЛЕКЦИЯ 9. ВВЕДЕНИЕ В XML

XML
XML (eXtensible Markup Language) — рекомендованный W3C язык разметки.
XML — текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе специализированных языков разметки.
XML является упрощённым подмножеством языка
SGML

ДОСТОИНСТВА XML
Это человеко-ориентированный формат документа, он понятен как человеку так и компьютеру;
Поддерживает Юникод;
В формате XML могут быть описаны основные структуры данных — такие как записи, списки и деревья;
Это самодокументируемый формат, который описывает структуру и имена полей также как и значения полей;
Имеет строго определённый синтаксис и требования к анализу, что позволяет ему оставаться простым, эффективным и непротиворечивым;

Широко используется для хранения и обработки документов;
Это формат, основанный на международных стандартах;
Иерархическая структура XML подходит для описания практически любых типов документов;
Представляет собой простой текст, свободный от лицензирования и каких-либо ограничений;
Не зависит от платформы;
Является подмножеством SGML, для которого накоплен большой опыт работы и созданы специализированные приложения;

НЕДОСТАТКИ XML
Синтаксис XML избыточен.
•Размер XML документа существенно больше бинарного представления тех же данных (порядка 10 раз).
•Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON, YAML) и особенно в форматах данных, оптимизированных для конкретного случая использования.
•Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.
•Для большого количества задач не нужна вся мощь синтаксиса XML и можно использовать значительно более простые и производительные решения.
Пространства имён XML сложно использовать и их сложно реализовывать в XML парсерах .

XML не содержит встроенной в язык поддержки типов данных. В нём нет понятий «целых чисел», «строк», «дат», «булевых значений» и т. д.
Иерархическая модель данных, предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами.

|
ТЕХНОЛОГИИ XML |
|
1 |
XML |
Технические рекомендации об |
|
|
использовании XML |
2 |
DTD |
Определение типа документа (схема) |
3 |
XDR |
Формат XML Reduced (схема Microsoft) |
4 |
XSD |
Определение схемы XML (схемы конс. W3C) |
5 |
Пространство |
Метод определения имен элементов и |
|
имен |
атрибутов |
6 |
XPath |
Язык путей XML |
7 |
XLink |
Язык ссылок XML |
8 |
XPointer |
Язык указателей XML |
9 |
DOM |
API для объектной модели документа |
10 |
SAX |
Простой API для XML |
11 |
XSL |
Расширяемый язык таблиц стилей |
12 |
XSL-FO |
Объекты форматирования XSL |
13 |
XSLT |
Язык преобразований XSL |
14 |
XInclude |
Синтаксис XML Include |

ВЗАИМОСВЯЗЬ МЕЖДУ SGML, XML И
HTML
Приложения SGML
Метаязыки
Text Encoding
Initiative
DocBook
SGML XML
Edgar
HTML
HTML как приложение XML
Приложения XML
Формат
определения каналов CDF
MML
CML
XHTML

ПРАВИЛЬНО ПОСТРОЕННЫЕ И ДЕЙСТВИТЕЛЬНЫЕ ДОКУМЕНТЫ
Документ XML считается правильно построенным, если он соответствует всем синтаксическим правилам XML
Проверка действительности документа предполагает выполнение следующих действий:
oПроверка использования только заданного набора дескрипторов
oПроверка полного соответствия порядка следования элементов и атрибутов содержанию документа или определенным
правилам.
o Контроль типов данных (достигается при использовании соответствующей схемы)
oКонтроль целостности данных для обеспечения оптимального обмена информацией через Веб с помощью транзакций

СИНТАКСИС XML
XML документ содержит один и только один корневой элемент, содержащий все остальные элементы
Дочерние элементы, содержащиеся в корневом элементе, должны быть правильно вложены
Имена элементов подчиняются правилам:
Имя начинается с буквы, знака подчеркивания или двоеточия
После первого символа в имени могут быть буквы, цифры, знаки переноса, подчеркивания, точка или двоеточие
Имена не могут начинаться с буквосочетания XML