
Публикация баз данных в Internet
Можно выделить три основных подхода к опубликованию баз данных через World-Wide Web, хотя, конечно же, существуют десятки разновидностей для каждой стратегии.
Первая и самая простая стратегия заключается в том, чтобы разложить содержимое базы данных на отдельные логически жестко связанные выборки, или представления, экспортировать их в ASCII-файлы, разместить эти файлы соответствующими управляющими кодами, или маркерами языка разметки гипертекста HTML (вручную или программно) и поместить созданные HTML-документы на Web-сервер (рис.1). Можно приложить еще немного усилий и создать одно- или многоуровневую систему индексных файлов, или оглавлений базы данных - путем ее сортировки по различным ключевым полям и последующего экспорта ключевых полей и номеров записей в ASCII-файлы для разметки маркерами HTML.
База данных
ASCII- файлы
HTML -файлы
Web- сервер
Экспорт Разметка HTTP
Программа просмотра
Web
H
TTP
Рис. 1. Схема наиболее простого способа организации публикации баз данных в World-Wide Web
Вторая, немного более сложная, стратегия состоит в том, чтобы разложить базу данных на представления, экспортировать их в ASCII-файлы и использовать для индексации и поиска данных программное обеспечение WAIS-сервера. Таким образом, задача поиска и извлечения нужной информации перекладывается с Web-сервера на WAIS-сервер; за первым остается лишь возобновление связи с удаленным пользователем после завершени операции поиска (рис. 2). На ранних этапах развития World-Wide Web этот метод пользовался большой популярностью при поиске информации - главным образом из-за того, что инструментальные средства WAIS тогда уже существовали и были просты в обращении.
База данных
ASCII- файлы
Экспорт
Индексация с помощью WAIS-утилиты
Текстовая база
данных WAIS
WAIS- сервер
Web - сервер
Программа просмотра
Web
Рис. 2. Немного более сложный вариант организации публикации баз данных в World-Wide Web по сравнению с показанным на рис. 1.
Однако оба только что описанных подхода имеют несколько недостатков. Самый существенный из них заключается в том, что информация в форматах HTML или WAIS не подвергается изменениям в промежутках между последовательными операциями экспорта и, следовательно, не всегда отражает текущее состояние базы данных. Кроме того, процессы экспорта данных и разметки маркерами HTML сопряжены с немалыми временными и трудозатратами, даже если применяются лучшие методы автоматизации; это вынуждает пользователей выполнять операции экспорта реже, чем обновляется сама база данных. Еще одна проблема: при разбиении базы данных на представления в процессе экспорта в значительной мере утрачивается ее реляционная природа - если какие-либо представления не участвуют в экспорте, то они просто оказываются недоступными для конечного пользователя.
Наконец третий, наиболее эффективный способ организации публикации баз данных заключается в том, чтобы обеспечить для конечного пользователя возможность напрямую, в режиме реального времени выполнять запросы к базе данных через специальную "шлюзовую" программу. В настоящее время для этих целей используются, как правило, Web-сервер и SQL-сервер баз данных, которые работают в высокопроизводительной среде UNIX. Web-сервер через программу просмотра Web предоставляет конечному пользователю форму, считывает с нее заданные параметры поиска и передает их через стандартизированный интерфейс CGI SQL-клиенту. Программа SQL-клиента преобразует полученные параметры в соответствующее предложение SQL-запроса, направляет запрос SQL-серверу, получает от него результаты, преобразует их в HTML-файл и передает обратно на Web-сервер имя итогового файла. После этого Web-сервер пересылает HTML-файл с результатами выполненного запроса программе просмотра Web конечного пользователя (рис. 3).
База данных
SQL- сервер базы
данных
SQL- клиент базы
даннных
Web - сервер
SQL CGI HTTP
Программа просмотра
Web
H TTP
Рис. 3 Наиболее сложный и эффективный способ организации публикации баз данных в Web
Стремительное распространение сети Internet, появление системы World-Wide Web, создание Web-серверов и программ просмотра Web, содержащих средства работы с формами, подготовленными на языке HTML, версия 2.0, - все это фактически устранило препятствие для разработки и сопровождения баз данных.