Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика лекции.doc
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
2.39 Mб
Скачать

5.5.2 World Wide Web  всемирная паутина

Всемирная паутина построена на специальном протоколе передачи данных, который называется протоколом передачи гипертекста HTTP (HyperText Transfer Protocol).

Всё содержимое системы WWW состоит из WWW-страниц, которые создаются с помощью языка разметки гипертекста HTML (Hypertext markup language).

Язык HTML позволяет добавлять к текстовым документам специальные командные фрагменты – тэги (англ. tag – этикетка, ярлык) – таким образом, что становится возможным связывать с этими документами другие тексты, графику, звук и видео, задавать заголовки раз-личных уровней, разделять текст на абзацы, строить таблицы и т.д. Например, заголовок документа может иметь такой вид: <TITLE> Клуб любителей природы </TITLE>.

Одну WWW-страницу обычно составляет набор гипермедийных документов, расположенных на одном сервере, переплетенных взаимными ссылками и связанных по смыслу (например, содержащих информацию об одном учебном заведении или об одном музее). Каждый документ страницы, в свою очередь, может содержать несколько экранных страниц текста и иллюстраций. Каждая WWW-страница имеет свой «титульный лист» (англ. homepage) – гипермедийный документ, содержащий ссылки на главные составные части страницы. Адреса «титульных листов» распространяются в Интернет в качестве адресов страниц.

Личные страницы – это WWW-страницы, которые принадлежат не фирмам и организациям, а отдельным людям. Содержание и оформление такой страницы зависит только от ее автора.

При работе с системой WWW пользователи имеют дело с программами-клиентами системы, называемыми браузерами.

Браузеры (англ. browse – листать, просматривать) – программы, с помощью которых пользователь организует диалог с системой WWW: просматривает WWW-страницы, взаимодействует с WWW-cерверами и другими ресурсами в Интернет.

Существуют сотни программ-браузеров. Самые популярные браузеры: Netscape Navigator и Microsoft Internet Explorer.

Браузеры WWW умеют взаимодействовать с любыми типами серверов, используя при этом их собственные протоколы. Информацию, полученную от любого сервера, браузер WWW выводит на экран в стандартной, удобной для восприятия форме. При этом переключения с одного протокола на другой для пользователя часто остаются незамеченными.

Совокупность огромного числа гипертекстовых электронных документов, хранящихся на серверах WWW, образует своеобразное гиперпространство документов, между которыми возможно перемещение. Произвольное перемещение между документами в Web-пространстве называют Web-серфингом. Целенаправленное перемещение между Web-документами называют Web-навигацией (выполняется с целью поиска нужной информации).

Гипертекстовая связь между миллиардами документов, хранящихся на физических серверах Интернета, является основой существования логического пространства World Wide Web. Однако такая связь не могла бы существовать, если бы каждый документ в этом пространстве не обладал своим уникальным адресом. Известно, что каждый файл одного локального компьютера обладает уникальным полным именем, в которое входит собственное имя файла (включая расширение имени) и путь доступа к файлу, начиная от имени устройства, на котором он хранится. Можно расширить представление об уникальном имени файла и развить его до Всемирной сети. Адрес любого файла во всемирном масштабе определяется унифицированным указателем ресурса URL.

Адрес URL состоит из трех частей:

  1. Указание службы, которая осуществляет доступ к данному ресурсу (обычно обозначается именем прикладного протокола, соответствующего данной службе). Так, например, для службы WWW прикладным является протокол HTTP (HyperText Transfer Protocol — протокол передачи гипертекста). После имени протокола ставится двоеточие (:) и два знака «/» (косая черта):

http://

  1. Указание доменного имени компьютера (сервера), на котором хранится данный ресурс, например:

sci-lib.com

  1. Указания полного пути доступа к файлу на данном компьютере. В качестве разделителя используется символ «/» (косая черта), например:

/subject.php?subject=1&pp=9

Полное имя файла:

http://sci-lib.com/subject.php?subject=1&pp=9

При записи URL-адреса прописные и строчные символы считаются разными.

Именно в форме URL и связывают адрес ресурса с гипертекстовыми ссылками на Web-страницах. При щелчке на гиперссылке браузер посылает запрос для поиска и доставки ресурса, указанного в ссылке. Если по каким-то причинам он не найден, выдается сообщение о том, что ресурс недоступен (возможно, что сервер временно отключен или изменился адрес ресурса).

Поисковые системы и каталоги.

Поисковые системы можно разбить на два типа:

- предметные каталоги, формируемые людьми-редакторами;

- автоматические индексы, формируемые специальными компьютерными программами без участия людей.

Компании, владеющие предметными каталогами, непрерывно исследуют, описывают и систематизируют содержимое WWW-cерверов и других сетевых ресурсов, разбросанных в Интернете. В результате этой работы клиенты Интернета имеют постоянно обновляющиеся иерархические (древовидные) каталоги, на верхнем уровне которых собраны самые общие категории, такие как «бизнес», «наука», «искусство» и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и серверы вместе с кратким описанием их содержимого.

Пример. Если нужно выяснить, какая в мире имеется информация об истории ЭВМ, достаточно спуститься по иерархии:

Образование => Информатика => История ЭВМ

Автоматический индекс состоит из трех частей:

- программы-робота, которую иногда называют пауком (spider). Она передвигается по web, исследуя ее содержимое;

- базы данных, собираемой этими программами;

- интерфейса для поиска, с которым работает пользователь.

Все эти компоненты функционируют без вмешательства чело-века.

К автоматическим индексам прибегают обычно, когда ключевые слова точно известны, например, фамилия человека или несколько специфических терминов из соответствующей области. Индексы получают информацию из каждого отдельного узла, регистрируют и индексируют её и добавляют к своим базам данных.

Среди известных поисковых систем можно выделить:

AltaVista – www.altavista.com

Infoseek – www.infoseek.go.com

Яndex – www.yandex.ru

Rambler – www.rambler.ru

Апорт – www.aport.ru