Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ППТС-2 / Лекции / Lect4-06.doc
Скачиваний:
5
Добавлен:
12.05.2015
Размер:
287.23 Кб
Скачать

30

Прикладное программирование в ТС (2)

Лекция 4-06

Лекция 4-06

Тема 5.2. Обработка документов xml с использованием Java

5.2.1. Обработка документов XML

5.2.2. Синтаксические SAX-анализаторы XML

5.2.3. Реализация DOM XML в языке Java

5.2.3.1. Доступ к документу XML

5.2.3.1.1. Класс DocumentBuilder

5.2.3.1.2. Класс DocumentBuilderFactory

5.2.3.2. Интерфейсы DOM XML в языке Java

5.2.3.2.1. Интерфейс DOMImplementation

5.2.3.2.2. Интерфейс NodeList

5.2.3.2.3. Интерфейс NamedNodeMap

5.2.3.2.4. Интерфейс Node

5.2.3.2.5. Интерфейсы Document, DocumentFragment и DocumentType

5.2.3.2.6. Интерфейс Element

5.2.3.2.7. Интерфейс Attr

5.2.3.2.8. Интерфейсы CharacterData, Text, Comment и CDATASection

5.2.3.2.9. Интерфейсы Entity, EntityReference, Notation и ProcessingInstruction

5.2.3.2.10. Исключение DOMException

5.2.3.3. Средства выполнения преобразований документов XML в языке Java

5.2.3.3.1. Общие средства выполнения преобразований документов XML

5.2.3.3.2. Средства преобразования для DOM-анализатора

5.2.3.3.3. Средства преобразования для потоков ввода-вывода

Тема 5.2. Обработка документов xml с использованием Java

5.2.1. Обработка документов xml

Стандартизованный набор элементов и атрибутов HTMLпозволяет создавать программы просмотра (Web-браузеры) и графические редакторы документовHTML, пригодные для обработки любого документаHTML.

В отличие от HTML, для документа какого-либо приложенияXMLнеобходимо каким-то образом определить обработку этого документаXML, например, формат вывода документа на экран дисплея или на печать. Самым общим способом решения этой задачи является создания программы для обработки документов данного приложения. Примером такой программы для документовXML, описываемых с помощьюDTDдляHTMLиXHTML, являетсяWeb-браузер.

Для подготовки структуры и содержания документа к отображению (на экран или на печать) или к передаче в другое приложение для последующей обработки необ­ходимо выполнить следующие этапы:

  1. Создать DTDили схему для документаXML;

  2. Создать документ XMLв соответствии сDTDили схемой;

  3. Проанализировать, является ли документ правильным (well-formed) и действительным (valid);

  4. В случае отсутствия ошибок выполнить обработку документа.

Рассмотрим прикладные и инструментальные программные средства, используемые в приведенных выше этапах.

На первом и втором этапах необходимо создать и отредактировать DTDили схему документа, а также сам документXML. ПосколькуDTD, схема и сам документ являются текстовыми файлами, для их создания и модификации можно использовать любой текстовый редактор, например Блокнот (Notepad) вWindows. Однако лучше воспользоваться для обработки приложения специализированнымредактором XML, например,MicrosoftXMLNotepad. Кроме того, редакторXMLвходит в состав многих интегрированных средств разработки (IDE) документовXML, например,XMLSpy.

Редакторы XMLобычно выполняют следующие основные функции:

  • поддержка возможности отображения и редактирования документа XMLв виде древовидной структуры (основной режим);

  • поддержка возможности отображения и редактирования документа XMLв текстовом виде (вспомогательный режим);

  • возможность редактирования (вставки, изменения или удаления элементов или атрибутов документа) с учетом DTD(внутреннего или внешнего) или схемы;

  • поддержка различных кодировок документа.

К дополнительным возможностям редакторов XMLотносятся:

  • средства создания и редактирования DTDи схем;

  • наличие «мастеров» (wizards) для облегчения процесса создания документаXML,DTDи схем;

  • наличие справочной информации по XML, DTD и схемам.

Для проверки действительности и правильности документа XML используются так называемые синтаксические анализа­торы(parsers). Существуют два вида синтаксических анализаторов: анализаторы, проверяющие только правильность документа, т.е. соблюдения правил спецификацииXMLи анализаторы, которые проверяют не только правильность документа, но и его действительность, т.е. соответствие документа своемуDTDили своей схеме. Синтаксические анализаторы могут быть самостоятельными приложениями или компонентамиIDEили встроенными в приложениеXML. В настоящее время существует два основных типа анализаторов XML:

  • SAX-анализаторы;

  • DOM-анализаторы.

В общем, обработка документа XMLвыполняется с помощью индивидуальной программы, разработанной для данного документаXML. Эту программу называютпроцессором XML (процессором XMLтакже иногда называют программу, которая выполняет и анализ, и обработку документаXML). В некоторых языках программирования имеются средства, облегчающие разработку приложенийXML. Ниже будут рассмотрены такие средства для языкаJava. Кроме того, для стандартных определенных функциональных задач, например, для форматированного вывода документовXMLна экран и печать существуют специальные средства, например, использование таблиц стилей или расширенного языка стилей –XSL(eXtensibleStylesheetLanguage). Существуют и другие специализированные приложенияXML, например, для вывода математических формул –MathMLили масштабируемой векторной графики –SVG.

Соседние файлы в папке Лекции