
- •Интернет. Поиск и просмотр информации
- •Как родился Интернет
- •Виды доступа к Интернету
- •Общая характеристика программного обеспечения Интернета
- •Сервисы и прикладные протоколы сети Интернет
- •Новые технологии и тенденции развития сети Интернет
- •World Wide Web и его основные компоненты
- •Адресация в Интернете
- •Структура региональной системы имен
- •Адресация web-документов
- •Как местный сервер может разузнать запрошенный адрес? -
- •Поиск информации в Интернете
- •Соединение с Интернетом
- •Просмотр информации в www
- •Работа в автономном режиме
World Wide Web и его основные компоненты
В 1991 г. физик Тим Бернерс-Ли из Женевского ЦЕРНа (Европейской лаборатории физики элементарных частиц) предложил создать систему, которая позволяла бы всем физикам в Европе обмениваться по Интернету результатами своих исследований в виде иллюстрированного текста, включающего ссылки на другие публикации. Так было положено начало WWW. Технология WWW состоит из четырех компонентов:
язык гипертекстовой разметки документов HTML (Hyper-Text Markup Language);
универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);
протокол обмена гипертекстовой информацией HTTP(HyperText Transfer Protocol);
универсальный интерфейс шлюзов CGI (Common GatewayInterface).
1. Идея HTML - пример чрезвычайно удачного решения проблемы построения гипертекстовой системы при помощи специального средства управления отображением. На разработку языка гипертекстовой разметки существенное влияние оказали два фактора: исследования в области интерфейсов гипертекстовых систем и желание обеспечить простой и быстрый способ создания гипертекстовой базы данных, распределенной на сети. Фактически в настоящее время HTML развивается в сторону создания стандартного языка разработки интерфейсов как локальных, так и распределенных систем.
2. Вторым компонентом WWW стала универсальная форма адресации информационных ресурсов. Universal Resource Identification (URI) представляет собой довольно стройную систему, учитывающую опыт адресации и идентификации e-mail, Gopher, WAIS, telnet, FTP и т.п. Для организации баз данных в WWW требуется Universal Resource Locator (URL). B URL можно адресовать как другие гипертекстовые документы формата HTML, так и ресурсы e-mail, telnet, FTP, Gopher, WAIS.
3. Третьим компонентом World Wide Web является протокол обмена данными – Hyper Text Transfer Protocol (HTTP). Данный протокол предназначен для обмена гипертекстовыми документами и учитывает специфику такого обмена. Так, в процессе взаимодействия клиент может получить новый адрес ресурса на сети(relocation), запросить встроенную графику, принять и передать параметры и т.п.
4. Последняя составляющая технологии WWW - спецификация Common Gateway Interface. CGI была специально разработана для расширения возможностей WWW за счет подключения всевозможного внешнего программного обеспечения. Такой подход логично продолжал принцип публичности и простоты разработки и наращивания возможностей WWW. Предложенный и описанный в CGI способ подключения не требовал дополнительных библиотек. Сервер взаимодействовал с программами через стандартные потоки ввода/вывода, что упрощает программирование до предела. Программа, написанная в соответствии со спецификацией Common Gateway Interface, называется CGI-скрип-том. CGI-скрипты могут быть написаны на любом языке программирования (С, C++, PASCAL, FORTRAN и т.п.) или командном языке (shell, cshell, командный язык MS-DOS, Perl и т.п.).
WWW часто называют распределенной информационной системой мультимедиа, основанной на гипертексте. Определение распределенная означает, что информация не сконцентрирована на одном компьютере, а распределена на огромном множестве компьютеров. Слово «мультимедиа» включено в определение, так как информация включает не только текст, но и 2-3-мерную графику, видео, звук, анимацию. Как показано на рис. 2, гипертекст - это структурированный текст, в котором могут осуществляться переходы по выделенным меткам - гиперссылкам.
Наименьший документ WWW, имеющий собственный адрес, называется web-страницей. Расширение файла, являющегося web-страницей, - *.html или *.htm.
Группа web-страниц, объединенных одной темой, называется web-узлом (сайтом). Обычно сайт имеет титул - головную страницу, от которой по гиперссылкам или указателям «вперед-назад» можно двигаться по страницам сайта.
Рис. 2. Схема гиперссылок в гипертексте из трех документов
Примечание. Гиперссылка - выделенная область документа (например, часть текста, фото, картинка, кнопка и т.д.), позволяющая переходить к другому документу, содержащая связанную информацию.
Web-сайты размещаются на WWW-серверах - компьютерах, принадлежащих отдельным организациям и частным лицам. С помощью гипертекстовых ссылок, встроенных в документы WWW, пользователь может быстро переходить от одного документа к другому, от сайта к сайту, от сервера к серверу.
Для работы с WWW используются специальные программы-клиенты, которые по-английски называются browsers (browsers-от английского глагола "browse" - просматривать), а по-русски - браузерами, навигаторами, обозревателями, просмотрщиками. Наиболее популярные в настоящий момент браузеры Microsoft Internet Explorer, Netscape Navigator и Opera. Основная задача браузера - обращение к web-серверу за искомой страницей и вывод страницы на экран. Простейший способ получения нужной информации из Интернета - указание адреса искомого ресурса.