Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика_ЗФ / Учебное пособие_Информатика.doc
Скачиваний:
237
Добавлен:
22.03.2016
Размер:
6.18 Mб
Скачать

9.5.5 Задание местоположения документов в www.

Виртуальный мир WWW населен миллионами документов, обитающих на сотнях тысячах серверов. Задача WWW-путешественника — найти среди них тот, который содержит необходимую информацию, и прочитать его при помощи программы просмотра, — а для этого программа просмотра должна точное местоположение данного документа. Оно однозначно определяется адресом сервера, номером порта, именем директории и именем файла с этим документом. Для успешной загрузки требуемого документа с сервера программе просмотра также нужно указать протокол, используемый этим сервером. Это связано с тем, что кроме WWW-серверов, программы просмотра могут обращаться к серверам пересылки файлов (так называемым FTP-серверам), серверам телеконференций и некоторым другим типам серверов. Комбинация протокола, адреса сервера, номера порта, имени директории и имени файла получила название Uniform Resource Locator, или сокращенно URL. Синтаксис показан ниже:

протокол:// адрес_сервера:номер_порта/имя_директории/имя_файла

Рассмотрим составляющие URL на конкретном примере:

http://www.ssu.runnet.ru/~dima/index.html

Протокол, как уже было сказано выше, это совокупность правил, по которым происходит взаимодействие клиент-сервер. Протоколом WWW является протокол http. Кроме http, WWW-клиенты могут обращаться с серверами, поддерживающими протоколы ftp, gopher и некоторыми другими. Название протокола отделяется от остальной части URL двоеточием. В названии протокола прописные латинские буквы и соответствующие им строчные буквы эквивалентны.

Начало адреса сервера отмечается двумя косыми чертами //. Он состоит из нескольких частей (не обязательно четырех, как в нашем примере) - так называемых поддоменов. Поддомены, представляющие собой сочетания букв и цифр, разделяются точками, причем, “уточнение координат адресата” от более крупных к более мелким поддоменам происходит справо налево. Так же как и в названии протокола, в адресе сервера прописные латинские буквы и соответствующие им строчные буквы эквивалентны.

В приведенном выше примере URL адрес принадлежит WWW серверу Саратовского государственного университета. Давайте рассмотрим его более подробно.

www.ssu.runnet.ru

4 3 2 1

ru – домен верхнего уровня. Он обозначает либо код страны как в данном случае, либо, код сети, или «Организационный» домен. В сети Internet имеется семь «организационных» доменов верхнего уровня : com – коммерческие организации, еdu –образовательные учреждения, gov – правительственные организации США, int – международные организации, mil – вооруженные силы США, net – системы опорных сетей и информационные центры, org – некоммерческие организации. Имеются также домены, сформированные по географическому признаку: au –Австралия, at – Австрия, uk – Англия, de – Германия, dk – Дания, is – Исландия, it – Италия, es – Испания, ca – Канада, kr – Корея, nz - Новая Зеландия, ru – Россия, us – США, tw – Тайвань, fi – Финляндия, fr – Франция, cl – Чили, se – Швеция, ec – Эквадор, jp – Япония, su – страны СНГ.

runnet.ru – поддомен второго уровня. Имена поддоменов второго уровня утверждаются в соответствии с правилами, выработанными доменами верхнего уровня. В данном случае, абревиатура означает Russia University Network.

ssu.runnet.ru – поддомен третьего уровня. Имена поддоменов третьего уровня утверждаются в соответствии с правилами, выработанными доменами верхнего уровня. В данном случае ssu означает Saratov State University.

www.ssu.runnet.ru – поддомен четвёртого, в данном случае, самого младшего уровня. Аналогично, имена поддоменов четвертого уровня утверждаются в соответствии с правилами, выработанными доменами третьего уровня. В нашем примере поддомен назван www, потому что на данной машине расположен WWW сервер. Заметим, что адреса WWW серверов довольно часто, но далеко не всегда, начинаются с www.

Номер порта выражается целым положительным числом и отделяется от адреса двоеточием. Порт – это как бы “дверь”, через которую можно зайти на сервер. Сервер может иметь несколько доступных портов; если номер порта WWW сервера равен 80, то в URL его можно не указывать.

Имя директории и имя файла для пользователей IBM PC - совместимых компьютеров с операционной системой DOS выглядит знакомо. Однако, в связи с тем, что подавляющее большинство серверов WWW работает под управлением операционной системой UNIX, в URL имеют место следующие отличия от DOS’овского стиля:

  • не указывается имя дисковода;

  • имена файлов и директорий могут быть гораздо длиннее, чем в DOS (8+3 символа);

  • в именах директорий и файлов прописные и строчные символы различаются. Например, Letter.txt и letter.txt являются различными файлами;

  • имена файлов и директорий могут содержать несколько точек. Часть имени, следующая за последней встречающейся точкой, обычно называется суффиксом или расширением. Расширение, как правило, указывает на тип файла. Файлы с документами, публикуемые в WWW, часто имеют суффиксы .html или .htm. Эти суффиксы является аббревиатурой от названия языка, на котором пишут WWW-документы, HyperText Makeup Language, о котором будет рассказано позже.