
- •Лекция 4-01
- •4.1.2. Основные классы задач xml
- •4.1.2.1. Создание новых языков
- •4.1.2.2. Хранение данных
- •4.1.2.3. Обмен данными и проекты интеграции
- •4.1.3. ДокументыXmLи их компоненты
- •4.1.3.1. Структура документаXml
- •4.1.3.2. Объявления
- •4.1.3.3. Элемент
- •4.1.3.4. Инструкция по обработке
- •4.1.3.5. СекцииCdata
- •4.1.3.6. Ссылки
- •4.1.3.7. Комментарии
- •4.1.4. Пространства именXml
4.1.2.3. Обмен данными и проекты интеграции
Большое количество систем, стандартов и технологий, используемых при обработке данных, приводит к тому, что эффективно связать разные источники данных в одну систему часто не удается. Даже такие в СУБД применяют языки запросов и форматы представления выбираемой информации, которые редко полностью совместимы между собой. Поэтому интеграция данных в таких условиях требуют знания деталей функционирования различных баз данных, протоколов, операционных систем и так далее.
В результате интеграция нескольких приложений или систем реализуется по схеме, показанной на рис. 4.1.3.
Рис. 4.1.3. Типичная схема интеграции нескольких приложений
Идея использования XML в интеграции информационных систем сводится к созданию общего языка XML, которым могла бы пользоваться каждая из них. При этом реализуются несколько упаковщиков (wrappers), которые будут переводить со стандартного языка XML для интегрированной системы на язык, понятный каждой системе в отдельности (рис. 4.1.4).
Интеграция с использованием XMLимеет следующие преимущества:
языки XML не зависят от аппаратных и программных платформ, что позволяет связывать разнородные системы;
выразительная мощность XML достаточно велика для того, чтобы описать данные практически любой сложности;
средства разработки и стандартные библиотеки для XML существуют практически на всех платформах и для большинства популярных языков программирования;
методы работы с XML достаточно стандартны для того, чтобы в разных системах можно было пользоваться одинаковыми приемами;
информация, оформленная в виде XML, может обрабатываться не только машинами, но и человеком (что намного облегчает отладку).
Рис. 4.1.4. Интеграция на основе XML
4.1.3. ДокументыXmLи их компоненты
4.1.3.1. Структура документаXml
Язык XML– это язык разметки, описывающий целый класс объектов данных, называемыхдокументами XML. Документы XML обычно хранятся в виде текстовых файлов с расширением.xml.
Документ XMLсодержит текст – последовательность символовUnicode, которая может представлять символьные данные или разметку.
Имена в XMLпредставляют собой последовательность букв, цифр, а также символов '.', '-', '_' и ':'. В именах могут использоваться (в кодировкеUnicode) буквенные символы различных языков (включая буквы кириллицы). Первым символом имени должна быть буква или символ '_' или символ ':'. Имена в XML являются зависящими от регистра, то есть именаMessage,messageиMESSAGEразличаются.
Имена, начинающиеся строкой "xml" или строкой, в которой последовательность буквxmlпредставлена в любом регистре (например, "XML" или "Xml"),зарезервированы для целей стандартизации.
В качестве пробельных символов в документе XMLиспользуются символы пробела, возврата каретки, перевода строки и табуляции.
Литералы заключаются в апострофы (одинарные или двойные). Если в значениях литералов используются апострофы, для ограничения атрибутов используются другие апострофы, например:
'"scott"' или "'123'"
Литералы не должны содержать символов "<" и "&", которые используются в XML как управляющие символы.
Каждый документ XML имеет физическую и логическую структуру.
Физическидокумент состоит из единиц хранения, называемыхсущностями(см.4.1.8). Сущность может ссылаться на другие сущности (см.4.1.3.6), что вызывает их включение в документ. Документ начинается в "корне" – сущности документа, который служит корневым объектом дерева сущностей. В отличие от других сущностей, сущность документа не имеет имени.
Логическидокумент содержит текстовые данные и разметку. Компонентами разметки являются:
объявления (declarations);
элементы (elements);
инструкции по обработке (processing instructions);
секции CDATA;
ссылки (references);
комментарии (comments).
Документы XML, которые удовлетворяют требованием к формированию имен и синтаксису элементов документа, называютсяправильными(well-formed)документами XML.
Рассмотрим подробнее компоненты документа.