Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
BD_KL_2010_14.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
28.97 Mб
Скачать

Глава 7.Xml как способ логического представления информации

В конце 80-х годов в стенах CERN (Европейский центр ядерных исследований, Женева) возникла идея, которая в короткие сроки воплотились в интенсивно развивающуюся глобальную, бесконечно масштабируемую и распределенную систему. Эта система получила название Всемирной паутины (World Wide Web  сокращенно Web) и предоставляла пользователям свободный доступ к большинству информационных ресурсов в любой момент времени.

Среда Web представляет собой очень привлекательную платформу для доступа к сведениям, содержащимся в базах данных, по всему миру, обеспечивая возможность глобального доступа к данным для пользователей и организаций. При этом:

  • традиционная двухуровневая архитектура «клиент/сервер» требует применения «толстых» клиентов, недостаточно эффективно реализующих как функции интерфейса пользователя, так и прикладные алгоритмы. В отличие от этого, решения на основе технологии Web позволяют создать более естественную трехуровневую архитектуру «клиент/сервер приложений/ сервер баз данных», обеспечивающую масштабируемость системы. Поэтому все функциональные средства приложения можно разместить на отдельном Web-сервере, удаляя их из клиентской части приложения. Этим обеспечивается глобальный доступ к приложениям баз данных и экономия времени и затрат при развертывании приложений;

  • Web-клиенты (или браузеры) обладают независимостью от платформы. Поскольку браузеры имеются практически для всех существующих вычислительных платформ, при условии поддержки ими стандартов HTML/Java пользователи могут получить доступ к приложению баз данных независимо от того, в какой вычислительной платформе они работают. Кроме этого, разработчикам не потребуется вносить в приложения изменения для того, чтобы они могли работать с разными операционными системами или различными интерфейсами.

Таким образом, при наличии Web-сервера приложения и Web-клиента доступ к функциям приложения легко осуществить с любого компьютера, расположенного в любой точке планеты. Но при этом появляется проблема согласованности данных, обрабатываемых в различных вычислительных платформах. В случае использования традиционных баз данных для переноса приложений на другие платформы потребуется выполнить существенную модификацию (или даже полную реорганизацию) клиентской части каждого приложения.

В свое время базы данных развивались как способ интеграции систем хранения данных в рамках компании. Теперь, с появлением Всемирной паутины решается эта же проблема, но уже в глобальных масштабах. В этой части учебного пособия рассмотрим решение вопроса интеграции данных с целью обеспечения совместимости при передаче структурированных данных через Интернет.

7.1.Язык html и его недостатки

Решающую роль в информационной революции, вызванной Web-технологиями, сыграли так называемые языки разметки, получившие свое развитие в печатном деле. При подготовке к печати, в соответствии с технологическими требованиями, документ представлялся в виде трех логических частей:

  • содержимого, т. е. данных документа, состоящего из текста и графики;

  • структуры, представленной заголовками, абзацами, подписями и т. д.;

  • форматирования, т. е. визуального представления, определяемого шрифтами, отступами, оформлением страницы документа.

Таким образом, в описании документа вырисовывается следующая формула:

Документ = Данные + Структура + Форматирование

Для определения структуры документа редакторы использовали специальные символы, а для представления, т. е. форматирования,  разметки и пометки, которые включались прямо в содержимое документа. С появлением компьютерных издательских систем команды разметки, встроенные в содержимое документа, стали использоваться в издательских программах. При этом каждый тип издательского программного обеспечения или оборудования поддерживал свой набор команд разметки, что затрудняло переход от одной системы к другой. Поэтому для стандартизации разметки был разработан язык SGML (Standard Generalized Markup Language  стандартный обобщенный язык разметки), который со временем был принят как стандарт ISO.

После стандартизации общих элементов появилась возможность генерировать семейство языков разметки. Одним из таких языков стал HTML (HyperText Markup Language  язык гипертекстовой разметки), предназначенный для создания гипертекста, связывающего между собой отдельные документы.

Сегодня основная часть информации в среде Web хранится в документах, созданных на языке HTML, поэтому браузеры при отображении документов должны понимать и правильно интерпретировать дескрипторы этого языка. Но за несколько лет интенсивного развития потенциал качественного совершенствования технологий существующей версии Web оказался в значительной мере исчерпанным. Сдерживающее влияние на дальнейшую эволюцию приложений Web-технологий стали оказывать, прежде всего, слабые стороны языка HTML.

Основная проблема этого языка заключается в том, что изначально в этом языке данные, которые необходимо отобразить, и указание на то, как следует отобразить эти данные, содержатся в одном файле. Из-за того, что данные не выделены в самостоятельный слой, изменение данных неизбежно приводит к изменению самого HTML-документа.

Этот недостаток приводит и к другой проблеме: при создании сайтов, работающих с базами данных, требуется наличие программистов, имеющих навыки как в области программирования, так и в области представления данных. Но представление данных, т. е. дизайн  это совершенно другая область знаний.

Главный недостаток HTML состоит в том, что он был разработан с прицелом на возможности человека, который в состоянии понять значение и назначение большинства документов, отображаемых в графическом виде. Машина, к сожалению, сделать этого не может. Теги в этом документе говорят браузеру, как отображать информацию, но не говорят о характере информации.

В языке HTML отсутствует поддержка метаданных, а это делает невозможной эффективную интеграцию информационных ресурсов, поддерживаемых в Web-среде и в других взаимодействующих с Web средах. Технически средства языка HTML позволяют интегрировать в среду Web ресурсы баз данных, большие архивы текстовых документов, различные мультимедийные ресурсы. Но эти инородные для гипертекста ресурсы, хотя и становятся доступными пользователю, с точки зрения их семантики остаются для среды Web «черным ящиком». Такая интеграция сводится по существу лишь к обеспечению доступа к «внешним» ресурсам посредством Web.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]