Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник_Палагута.doc
Скачиваний:
10
Добавлен:
13.11.2019
Размер:
6.6 Mб
Скачать

Розділ 3. Розширювана мова розмітки xml, обробка xml – документів

Тема 9. Створення xml – документів, опис шаблону документа

9.1. Загальні відомості

Мова XML (Extensible Markup Language – розширювана мова розмітки) є складовою частиною мови SGML (Standard Generalized Markup Language – стандартна узагальнена мова розмітки), містить більшість можливостей SGML, однак значно простіша.

Мова XML призначена для структурування, зберігання та передачі інформації. Вона не призначена для виконання якихось дій. Мова XML була створена для опису даних. Як і HTML XML є мовою розмітки, однак теги у XML заздалегідь не визначені, а створюються розробником документа для опису елементів даних. Основні відмінності мов HTML і XML полягають у тому, що:

Мова HTML

Мова XML

Мова HTML призначена для демонстрації даних, зосереджена на тому, як дані виглядають.

Застосовується для форматування та подання даних.

Теги мови визначені заздалегідь.

Мова XML описує данні, фокусується та тому, чим дані є.

Застосовується для опису даних.

Можна створювати власні теги.

Можна розглядати мову XML як незалежний від платформи, від апаратного та програмного забезпечення інструмент для обміну інформацією. У реальних умовах комп’ютерні системи і бази даних зберігають дані у несумісних форматах. Важливою та складною задачею для розробників є забезпечення обміну даними між різними системами через Інтернет. У теперішній час виникає багато B2B - технологій (Business To Business), які засновані на XML. Мова XML стає основною мовою обміну фінансовою інформацією через Інтернет. Зокрема в Україні звітність суб’єктів господарювання, що в електронному вигляді по каналах зв’язку передається до податкових органів, готується в форматі XML.

9.2. Структура xml - документа

XML - документ вміщує пролог і основну частину документа – тіло документа. Пролог знаходиться у верхній частині документа, містить ідентифікаційну інформацію про XML – документ, до якої належать оголошення XML, поточного стандарту XML, типу документа.

Наприклад:

<?xml version=”1.0” ?>

<!DOCTYPE simpledoc[>

Пролог може вміщувати також коментарі, інструкції по обробці.

Оголошення XML – документа потрібно, оскільки не всім операційним системам достатньо розширення файлу xml для його ідентифікації. Крім того іноді створюються XML – документи з іншими розширеннями.

Атрибут version визначає, до якої версії специфікації XML належить даний документ. На теперішній час існують дві версії XML – специфікації 1.0 і 1.1. Версія 1.1 є більш новою, однак можуть виникнути проблеми, пов’язані з тим, що не всі браузери її підтримують. Якщо браузер стикається з документом, версія якого йому невідома, він ігнорує даний документ. Тому у оголошенні документа доцільно визначати version="1.0".

Оголошення XML – документа може також вміщувати оголошення кодування (encoding declaration), яке вказує форму символів Unicode.

Атрибут standalone призначено для оголошення самостійності (standalone declaration), він вказує є документ самостійним (standalone=”yes”) або він асоційований з зовнішнім файлом (standalone=”no”) /наприклад, з зовнішнім описом типу документа DTD або зовнішньою таблицею стилів.

До основної частини документа відноситься все крім прологу, вона вміщує визначення елементів і їх атрибутів. Елементи документа визначають структуру документі і вміщують данні про певні об’єкти. Елементи документа підпорядковані один одному, структуру документа можна уявити у вигляді ієрархії елементів як на рис. 9.1.

Рисунок 9.1 – Дерево елементів XML – документа

При створенні XML – документа слід дотримуватися таких правил:

  • Кожний документ повинен мати лише один кореневий елемент.

  • Кожний елемент починається з відкриваючого тегу, який його визначає, і після вмісту елементу обов’язково повинен слідувати закриваючий тег.

  • У тегах визначається ім’я елемента, яке вводиться у кутових дужках. Закриваючий тег починається з символу /, за яким слідує ім’я елементу.

  • Назви XML – елементів можуть вміщувати букви, цифри та інші символи. Імена не повинні включати пробіл, двокрапку, починатися з послідовності символів xml, цифри або знака пунктуації.

  • XML чуттєва до регістру символів, тому імена Name, name i NAME є трьома різними іменами.

  • Під час визначення вмісту документа теги обов’язково повинні відображати структуру документа, тобто всередині елемента слід описати усі вкладені елементи.

  • Припустимим є застосування так званих порожніх тегів, коли згідно зі структурою документа елемент має бути присутнім, однак він не має вмісту. Такі теги включають ім’я елемента та символ /. Наприклад, тег <name /> є порожнім.

Як і в HTML XML – документ може вміщувати коментарі, які не обробляються додатками, що працюють з документом, роблять документ більш зрозумілим для тих, хто працює з його кодом. Коментарі вводяться так:

<!-- текст коментаря -->

Розглянемо приклад простого XML –документа, у якому зберігаються відомості про студентів згідно такої структури:

Рисунок 9.2 – Структура простого XML – документа

Приклад простого XML – документа:

<?xml version="1.0" encoding="UTF-8"?>

<students>

<student>

<name><first_name>Іван</first_name>

<last_name>Петренко</last_name></name>

<birthday>8 грудня 1990 року</birthday></student>

<student>

<name><first_name>Марія</first_name>

<last_name>Смірнова</last_name></name>

<birthday>20 липня 1989 року</birthday></student>

</students>

XML – документи створюються за допомогою будь-якого текстового редактора (у тому числі, програми Блокнот), зберігаються у файлах з розширенням xml. XML – документ можна розчинити, переглянути, відредагувати у встановленому браузері, наприклад Internet Erplorer.

Рисунок 9.3 – Вид простого XML – документа у вікні браузера ІЕ