Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
BD_KL_2010_14.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
28.97 Mб
Скачать

7.2.Язык xml и его основы

В последние годы консорциум W3C (WWW Consorcium) ведет активную деятельность, направленную на радикальный пересмотр основ Web-технологий. В результате был создан язык разметки XML (Extensible Markup Language  расширяемый язык разметки), служащий для опи­сания и обработки информационных ресурсов Web.

Основная цель создания XML  обеспечение совместимости при передаче структурированных данных между разными системами обработки информации, особенно при передаче таких данных через Интернет. Этого удалось добиться путем возврата к разметке документов на логическом уровне, а не на уровне формати­рования отдельных элементов.

У языка XML много общего с языком HTML, так как концепции обоих языков базируются на понятии разметки документа. Таким образом, XML и HTML являются родственным языками, происходящими от общего предка  языка SGML. На основе XML могут быть созданы другие специализированные языки разметки (например, MathML), иногда называемые словарями.

XML  это иерархическая структура, предназначенная для хранения любых данных. Визуально эта структура может быть представлена как дерево. Важнейшее синтаксическое требование заключается в том, что документ имеет только один корневой элемент. Это означает, что текст или другие данные всего документа должны быть расположены между единственным начальным корневым тегом и соответствующим ему конечным тегом.

В XML реализованы более жесткие правила определения структуры документа, чем в HTML, и большинство компонентов и возможностей данного языка ориентированы на представление логической струк­туры документа. Эту ориентацию еще больше усиливают сопутствующие стан­дарты, такие как XML Schema.

На Рис. 1.1. приведен фрагмен­т типичного XML-документа, содержащего описание второй части нашего учебного пособия. Продемонстрируем на основе этого примера основные концепции XML.

7.2.1.Объявление xml

Первая строка XML-документа называется объявлением XML. Это необязательная строка, указывающая версию стандарта XML (обычно это 1.0), также здесь может быть указана кодировка символов и внешние зависимости.

Спецификация требует, чтобы процессоры XML обязательно поддерживали Юникод-кодировки UTF-8 и UTF-16 (UTF-32 не обязателен). Признаются допустимыми, поддерживаются и широко используются (но не обязательны) другие кодировки, основанные на стандарте ISO/IEC 8859. Также допустимы другие кодировки, например, русские Windows-1251, KOI-8.

Объявление типа доку­мента решает три задачи:

  • задает корневой элемент документа (для XML-документа корневым элементом является xml, а для HTML-документа  html);

  • определяет элементы, атрибуты и сущности, используемые в документе.

Первая строка XML-документа на Рис. 1.1. идентифицирует его как документ XML 1.0. Остальные его части определяют структуру, атрибуты и содержимое элементов.

7.2.2.Элементы и теги

Остальная часть этого XML-документа состоит из вложенных элементов. Некоторые из этих элементов имеют атрибуты и содержимое. Элемент обычно состоит из открывающего и закрывающего тегов, обрамляющих текст и другие элементы. Открывающий тег состоит из имени элемента в угловых скобках. Например, в рассмотренном примере абзацы идентифицируются открывающим тегом <para>, а заголов­ки ­- открывающим тегом <header>.

Конец каждого элемента в XML-документе идентифицируется закрывающим тегом, содержащим символ косой черты ‘/’ и имя типа элемента, заключенные между символами угловыми скобками. Так, на Рис. 1.1. абзацы заканчиваются тегом </para>, а заголовки  тегом </header>.

Рис. 1.1. XML-документ, содержащий описание фрагмен­та второй части учебного пособия

Содержимым элемента (англ. content) называется все, что расположено между открывающим и закрывающим тегами, включая текст и другие (вложенные) элементы. Содержимое элемента может быть пустым, может быть некоторым значением или содержать экземпляры элементов других типов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]