Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ППТС-2 / Лекции / Lect4-01.doc
Скачиваний:
5
Добавлен:
12.05.2015
Размер:
181.25 Кб
Скачать

13

Прикладное программирование в ТС (2)

Лекция 4-01

Лекция 4-01

Раздел 4. Общие компоненты технологии XML

Тема 4.1. Язык XML

4.1.1. Компоненты технологии XML

4.1.2. Основные классы задач XML

4.1.2.1. Создание новых языков

4.1.2.2. Хранение данных

4.1.2.3. Обмен данными и проекты интеграции

4.1.3. Документы XML и их компоненты

4.1.3.1. Структура документа XML

4.1.3.2. Объявления

4.1.3.3. Элемент

4.1.3.4. Инструкция по обработке

4.1.3.5. Секции CDATA

4.1.3.6. Ссылки

4.1.3.7. Комментарии

4.1.4. Пространства имен XML

Раздел 4. общие компоненты технологииXML

Тема 4.1. ЯзыкXML

4.1.1. Компоненты технологииXML

Любой документ имеет три составляющих:

  • содержание;

  • структуру;

  • стиль.

Содержаниедокумента на бумаге может быть сугубо текстовым, а также содержать изображения. Если документ представлен в электронном виде, он может содержать и мультимедийные данные, а также ссылки на другие документы. Хотя содержимое разных документов различно, их можно классифицировать по типам, например, книга или железнодорожный билет.

Обычно содержание документа представляется не в произвольном порядке, а имеет определенную структуру. Структура – это состав и порядок следования частей (блоков) документа.

Стильдокумента определяет форму вывода его содержания на то или иное устройство (например, принтер или дисплей). В понятие стиль входят характеристики шрифта (наименование, размер, цвет) всего выводимого документа или отдельных его блоков, порядок разбивки на страницы, расположение блоков на страницах и другие параметры. Один и тот же документ может выводиться разными стилями как на разные носители, так и на один и тот же носитель.

Языки разметки документовявляются искусственными языками, предназначенными для описания структуры документа и отношений между различными объектами структуры. Данные разметки называются такжеметаданными.

Первым языком разметки является язык GML(GeneralizedMarkupLanguage–обобщенный язык разметки), разработанный сотрудниками фирмыIBM еще в 60-х годах прошлого века. Его непосредственным наследником сталязык SGML(StandardGeneralizedMarkupLanguage– стандартный обобщенный язык разметки), определяющий правила записи элементов разметки документа. Документ, соответствующий правилам языка, называетсядокументом SGML.

Язык SGML определен в стандарте ISO 8879 и широко применяется в области создания технической документации, где обычно имеет место управление большими сложными документами на базе различных платформ; в автомобильной промышленности, в области здравоохранения, во многих областях телекоммуникационных индустрии и почти везде, где требуются большие объемы структурированного текста.

Широко используемый в Web-технологиях язык гипертекстовой разметки HTML(HyperTextMarkupLanguage), так же, как и сама технологияWeb, была разработана Тимом Бернерсом Ли в 1991 г. Язык HTML является приложением SGML для типа документов, которые были названыдокументами HTML. Язык задает фиксированную структуру, фиксированный набор элементов и их атрибутов, а также фиксированный набор сущностей. Программы обработки документов HTML были названыWeb-браузерами, а результаты обработки документаWeb-браузером, выводимые на экран дисплея, были названыWeb-страницами.

Отсутствие в HTMLсредств отображения сложных структур, а также средств саморасширения, т.е. возможности введения новых элементов языка (например, для отображения математических формул), со временем все более превращалоHTMLв тупиковую ветвь. Добавление новых элементов не решало проблемы, поскольку языкHTMLстал содержать достаточно много элементов. Кроме того, по мере развития языка и средств описания стилей вывода элементов, некоторые элементы языка стали излишними.

Поэтому стало необходимым создание новых типов документов для использования в сети, которые дополняли или расширяли документы HTML. Первоначально новые типы документов предполагалось создавать с помощью языка SGML, но из-за сложности этого языка (его спецификация содержит свыше 500 страниц), было принято решение для использования в Internetразработать новый язык –XML(ExtensibleMarkupLanguage– расширенный язык разметки). Этот язык является подмножеством языка SGML, полностью совместимым с ним.

Язык XMLбыл разработан группойXMLWorkingGroup(первоначально называемойSGMLEditorialReviewBoard), сформированной в 1996 году под руководствомWorldWideWebConsortium(W3C).

При разработке языка XML ставились следующие задачи:

  • XML должен быть пригоден для непосредственного использования в Интернет.

  • XML должен иметь широкий круг применения.

  • XML должен быть совместим с SGML.

  • обработчики документов XML должны быть просты в написании.

  • количество необязательных свойств в XML должно быть сведено к абсолютному минимуму, в идеале число их вообще должно быть нулевым.

  • документы XML должны быть удобны для чтения и достаточно понятны.

  • подготовка документа XML должна осуществляться быстро.

  • процедура построения документа XML должна быть формальной и точной.

  • процедура создания документов XML должна быть проста.

  • краткость записей при разметке документа XML не является существенной.

В результате создания языка XMLу разработчиков появилась возможность определять собственные элементы, позволяющие им наиболее эффективно определять данные, содержащиеся в документе. Автор документа создает его структуру, строит необходимые связи между элементами, используя созданные элементы, и получает такой тип разметки, который необходим ему для выполнения операций просмотра, поиска, анализа документа.

Первая спецификация языка XML–XML1.0 была принята в феврале 1998 г.

Вторая редакция XML 1.0 – XML1.0 (SecondEdition) принята в октябре 2000 г., третья –XML1.0 (ThirdEdition) в феврале 2004 г. Последняя версияXML1.0 (FourthEdition– четвертая редакция) была принята в августе 2006 г.

В этом же году в апреле была принята новая версия языка – XML 1.1. Эта версия не содержит существенных отличий от версии 1.0, за исключением изменений в допустимых именах элементов и атрибутов, связанных с вводом в действие новой версии кодировки Unicode – Unicode4.0.

Помимо языка XML в состав основных компонент технологии XMLвходят следующие общие компоненты:

  • Схемы XML(XMLSchema) – средства описания документаXML;

  • Объектная модель документа (DOM) дляXML;

  • XPath(XMLPathLanguage) – поддержка адресации в документеXML;

  • XQuery(XMLQueryLanguage) – язык запросов к данным в документахXML;

  • XLink(XMLLinkingLanguage) – средства добавления гиперссылок в документ XML.

Кроме того, в состав технологии XMLвходят также расширяемый язык стилейXSL(ExtensibleStylesheetLanguage), язык преобразований XSL –XSLT(XSLTransformation), язык масштабируемой векторной графики –SVG(ScalableVectorGraphics) и другие компоненты, как принятые консорциумомW3C, так и находящиеся в стадии разработки.

Соседние файлы в папке Лекции