Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1573

.pdf
Скачиваний:
3
Добавлен:
07.01.2021
Размер:
1.33 Mб
Скачать

минимальная задержка, высокая надежность, низкая цена передачи данных. В промежуточных сетях пакеты могут делиться на несколько фрагментов в соответствии с протоколами этих сетей. Идентификация нужна для определения принадлежности фрагмента определенной дейтаграмме. Фрагменты различаются своими номерами, а дейтаграммы – идентификаторами. Всего в сети одновременно может быть 216 = 65 тысяч дейтаграмм сообщения с разными идентификаторами, т.е. за отрезок времени, равный времени жизни дейтаграммы, может быть передано не более 216 дейтаграмм. Это один из факторов, ограничивающих пропускную способность сетей с протоколом IP. Действительно, при времени жизни в 120 с имеем предельную скорость 216/ 120 = 546 дейтаграмм в секунду, что при размере дейтаграммы до 65 тысяч байт дает ограничение скорости приблизительно в 300 Мбит/с (такое же значение одного из ограничений предельной скорости получено выше и для протокола ТСР). Время жизни может измеряться как в единицах времени Т , так и в хопах Р (числом пройденных маршрутизаторов). В первом случае контроль ведется по записанному в заголовке значению Т, которое уменьшается на единицу каждую секунду. Во втором случае каждый маршрутизатор уменьшает число Р, записанное в поле "Время жизни", на единицу. При Т = 0 или при Р = 0 дейтаграмма сбрасывается.

Поле "Тип протокола" определяет структуру данных в дейтаграмме. Примерами протоколов могут служить UDP, SNA, IGP и т.п. После доставки по адресу этот признак позволит определить, какой сервер должен обрабатывать поступивший пакет.

Поле "Опции" в настоящее время рассматривается как резерв-

ное.

В соответствии с протоколом IP в маршрутизаторах производятся следующие действия. Сначала проверяется поле "Время жизни", и если оно равно нулю, то дейтаграмма ликвидируется. Далее по таблице маршрутизации устанавливается IP-адрес следующего маршрутизатора. Затем этот адрес переводится в МАС-адрес по АRP-таблице и пакет посылается по этому адресу к следующему маршрутизатору.

Протокол ICMP

Протокол управления сообщениями ICMP (Internet Control Message Protocol) используется IP и другими протоколами высокого уровня для отправки и получения отчетов о состоянии переданной информации. Этот протокол применяется для контроля скорости

121

передачи информации между двумя системами. Если маршрутизатор, соединяющий две системы, перегружен трафиком, он может отправить специальное сообщение ICMP-ошибку для уменьшения скорости отправления сообщений. Является частью сетевого уровня стека протоколов TCP/IP.

Протокол ICMP для своих целей использует сообщения, два изкоторых называются эхо-запрос ICMP и эхо-ответ ICMP. Эхо-запрос подразумевает, что компьютер, которому он был отправлен, должен ответить на этот пакет. Эхо-ответ – тип ICMP-сообщения, которое используется для ответа на такой запрос. Эти сообщения отправляются и принимаются с помощью команды ping (Packet Internet Groper).

С помощью специальных пакетов ICMP можно получить информацию:

о невозможности доставки пакета;

о превышении времени жизни пакета;

о превышении продолжительности сборки пакета из фрагментов;

об аномальных величинах параметров;

об изменении маршрута пересылки и типа обслуживания;

о состоянии системы и т. п.

Протокол IGMP

Узлы локальной сети используют протокол управления груп-

пами Интернет (IGMP – Internet Group Management Protocol), чтобы зарегистрировать себя в группе. Информация о группах содержится на маршрутизаторах локальной сети. Маршрутизаторы используют эту информацию для передачи групповых сообщений. Групповое сообщение, как и широковещательное, используется для отправки данных сразу нескольким узлам.

Уровень сетевого интерфейса

Этот уровень модели TCP/IP отвечает за распределение IPдейтаграмм. Он работает с ARP для определения информации, которая должна быть помещена в заголовок каждого кадра. Затем на этом уровне создается кадр, подходящий для используемого типа сети, такого как Ethernet, Token Ring или ATM, затем IP-дейтаграмма помещается в область данных этого кадра, и он отправляется в сеть.

122

6.3. Распределенная информационная система WWW

Информационная система WWW (World Wide Web – Всемирная паутина), или Web – гипертекстовая информационная система Интернет, построенная по схеме "клиент-сервер"[9]. Гипертекст представляет собой структурированный текст с введением в него перекрестных ссылок, отражающих смысловые связи частей текста. Слова-ссылки выделяются цветом и/или подчеркиванием. Выбор ссылки вызывает на экран связанную со словом-ссылкой страницу с текстовой, графической и (или) мультимедийной информацией. Информация, доступная по Web-технологии, хранится в Web-серверах, называемых также сайтами сети Интернет. C помощью гипертекстовых ссылок можно переходить от одного Web-сервера к другому, "путешествуя" по Web-пространству, включающему миллионы сайтов сети Интернет и охватывающему весь земной шар. Для подготовки материалов для их включения в базу Web-серверов разработаны спе-

циальный язык HTML (Hypertext Markup Language) и реализующие его программные редакторы. Взаимодействие программных элементов в информационной системе WWW строго стандартизировано и соответствует документу RFC (Request for Comment) организации Интернет-сообщества IETF, определяющему технические спецификации и стандарты, применяемые во Всемирной сети.

Клиентские программы WWW называются браузерами (brousers). Наиболее известны браузеры Internet Explorer фирмы

Microsoft, Opera фирмы Opera Software. В браузерах имеются коман-

ды листания, перехода к предыдущему или последующему документу, печати полученного текста, перехода по гипертекстовой ссылке и т.п. Из браузеров доступны различные сервисы - FTP, Gopher, USENET, E-mail и др. Браузер является мультипротокольным клиентом и интерпретатором HTML. И как типичный интерпретатор клиент в зависимости от команд (тегов) выполняет различные функции. В круг этих функций входит не только размещение текста на экране, но обмен информацией с сервером по мере анализа полученного HTMLтекста, что наиболее наглядно происходит при отображении встроенных в текст графических образов.

Схема функциональной структуры распределенной информационной системы WWW представлена на рис. 6.3.

123

 

 

 

 

HTPP

 

 

 

 

Сервер

 

 

Клиент

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

URL

 

 

HTML -

 

URL

 

 

документы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

HTML -

 

 

Внешние

 

 

 

 

формы

 

 

программы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Программы

 

 

 

 

 

 

 

 

- шлюзы

 

 

 

 

CGI

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Внешние

 

 

 

 

 

 

 

 

программы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 6.3. Схема функциональной структуры

Сервер системы обрабатывает запросы клиента на получение файла. При этом используются следующие программные средства:

HTML (HyperText Markup Lan-guage) – язык гипертекстовой разметки документов;

URL (Universal Resource Locator) – универсальный способ ад-

ресации ресурсов в сети;

HTTP (HyperText Transfer Protocol) – протокол обмена гипер-

текстовой информацией;

– CGI (Common Gateway Interface) – универсальный интерфейс шлюзов, созданный для взаимодействия HTTP - сервера с другими программами, установленными на сервере (например, СУБД).

Web-сервер получает запрос от браузера, находит соответствующий запросу файл и передает его для просмотра в браузер. Популярными серверными программами Web-технологии являются Apache Digital для ОС Unix, Netscape Enterprise Server и Microsoft Internet Information Server (IIS), которые могут работать как в Unix, так и в Windows, и Netware Web Server, предназначенный для работы в ОС

124

Netware. Для защиты данных от несанкционированного доступа

программными средствами CGI обеспечивается шифрование передаваемой по сети информации.

Обработка HTTP-запросов

При работе в Интернет для обслуживания HTTP-запросов используется 80 порт TCP/IP. По запросу клиент устанавливает соединение и ждет ответа сервера. После отправки ответа сервер инициирует разрыв соединения. Таким образом, при передаче сложных гипертекстовых страниц соединение может устанавливаться несколько раз.

Форма запроса клиента. Программа-клиент посылает после установления соединения запрос серверу. Этот запрос может быть в двух формах: в форме полного запроса и в форме простого запроса. Простой запрос содержит метод доступа и запрос ресурса. Например:

GET http://polyn.net.kiae.su/

Вэтой записи слово GET обозначает метод доступа GET, а http://polyn.net.kiae.su/ – это запрос ресурса.

Полная форма содержит тип протокола доступа, адрес сервера ресурса и адрес ресурса на сервере. Общий вид полного запроса:

<Полный запрос>:= <Строка запроса> (<Общий заголовок > |<Заголовок запроса>|<Заголовок обозначения ресурса>)<Символ новой строки>[<Тело ресурса>]

Квадратные скобки здесь обозначают необязательные элементы заголовка. Строка запроса – это, практически, простой запрос ресурса. Отличие состоит в том, что в строке запроса можно указывать различные методы доступа и за запросом ресурса следует указывать версию протокола. Например, для вызова внешней программы можно использовать следующую строку запроса:

Вданном случае используется метод POST и протокол версии

1.0.В обеих формах запроса важное место занимает форма запроса ресурса, которая кодируется в соответствии со спецификацией URL.

Методы доступа. В информационной системе WWW используются методы доступа POST, GET, HEAD.

GET – метод, позволяющий получить данные, заданные в форме URL в запросе ресурса. Если ссылаются на программу, то возвращается результат выполнения этой программы, но не текст программы.

125

Дополнительные данные, которые надо передать для обработки, кодируются в запрос ресурса. При использовании метода GET в поле тела ресурса возвращается собственно затребованная информация, например текст HTML-документа.

HEAD – метод, аналогичный GET, но не возвращает тела ресурса. Используется для получения информации о ресурсе и для тестирования гипертекстовых ссылок.

POST – этот метод разработан для передачи большого объема информации на сервер. Им пользуются для аннотирования существующих ресурсов, посылки почтовых сообщений, работы с формами интерфейсов к внешним базам данных и внешним исполняемым программам. В отличие от GET и HEAD, в POST передается тело ресурса, которое и является информацией из поля форм или других источников ввода.

Ответ сервера. Ответ сервера может быть, как и запрос, упрощенным или полным. При упрощенном ответе сервер возвращает только тело ресурса (например, текст HTML-документа). При полном ответе клиенту возвращаются строка состояния, общий заголовок, заголовок ответа, заголовок ресурса и тело ресурса. Полный ответ представляется следующим образом:

<Полный ответ>:= <Строка состояния> (<Общий заголовок>|< Заголовок ответа>|<Заголовок ресурса>)<Символ новой строки >[<Тело ресурса>]

Строка состояния состоит из версии протокола, кода возврата и краткого описания этого кода. Например, она может выглядеть так:

"HTTP/1.0 200 Success".

Заголовок ответа сервера может состоять из адреса URL запрашиваемого ресурса, и/или наименования программы сервера, и/или кода идентификации для работы в защищенном режиме. Состав полей заголовка ресурса является общим и для запроса клиента, и для ответа сервера и состоит из разрешения на метод доступа, типа кодировки тела ресурса (содержания ресурса), длины тела ресурса, типа ресурса, время действия данной копии ресурса, времени последнего изменения ресурса и расширения заголовка.

126

Информационно-поисковые системы

Информационно-поисковые системы (ИПС) – программно-

аппаратный комплекс, предоставляющий возможность поиска информации в Интернете. Большинство поисковых систем осуществляют поиск информации по сайтам Всемирной паутины. В основе ИПС с полнотекстовым поиском лежит автоматический сбор информации. Он осуществляется специальными программами. Эти программы, называемые роботами или спайдерами (Spider – паук), периодически исследуют содержимое всех ресурсов. В последнее время используются другие названия: автоматические индексы или директории. Все эти программы исследуют и «скачивают» информацию с разных URLадресов. Программы указанного типа посещают каждый ресурс через определенное время. Ни одна поисковая система не в состоянии проиндексировать весь Интернет. Поэтому базы данных (БД), в которых собраны адреса проиндексированных ресурсов, у разных поисковых систем разные. Тем не менее многие из них стремятся, по возможности, охватывать в своей работе все пространство мировой Сети. Это универсальные системы.

Мощные поисковые системы универсального типа созданы для работы на всех основных языках мира. Каждая страна старается создать хотя бы одну собственную поисковую систему. К наиболее распространенным отечественным и зарубежным поисковым системам можно отнести следующие.

Яndex (http://www.yandex.ru) – самая популярная в настоящее время отечественная поисковая система. Начала работу в 1997 году. Она содержит более 33 миллионов документов, поддерживает собственный каталог интернет-ресурсов. Также является лучшей поисковой системой для выявления иллюстраций. Англоязычный вариант снабжен справочником ресурсов Интернет. Обладает развернутой системой формирования запроса. В частности, допускается ввод поискового предписания на естественном языке – в этом случае все необходимые расширения производятся автоматически. Более детальный запрос может быть составлен с помощью режима «Расширенный поиск» (знак +), в котором применяется система многоступенчатых меню. Яндекс – единственная российская поисковая система, индексирующая документы в форматах PDF, DOC, RTF, SWF, PPT и XLS. Актуализация базы осуществляется еженедельно.

127

Rambler (http://www.rambler.ru) – одна из первых российских ИПС, открыта в 1996 году. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим «Детальный запрос», который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню.

Aport (http://www.aport.ru). На сегодняшний день объем ее ба-

зы составляет более 20 миллионов документов. Система обладает широким спектром поисковых возможностей. Aport обладает функцией встроенного переводчика, это дает пользователю возможность формулировать запросы как на русском, так и на английском языках. Кроме того, Aport имеет специальные режимы для поиска иллюстраций и аудиофайлов.

Поисковая система компании Mail.ru начала работать в 2007

году. Объем индексного файла весной 2009 года составлял более 1,5 миллиарда страниц, расположенных на русскоязычных серверах. Помимо разыскания текстов системой осуществляется поиск иллюстраций и видеофрагментов, размещенных на специализированных "самонаполняемых" российских серверах: Фото@Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Видео@Mail.Ru, RuTube, Loadup, Rambler Vision и им подобных. Gogo.ru позволяет ограничивать область поиска сайтами коммерческой направленности, информационными сайтами, а также форумами и блогами. Форма "Расширенного поиска" также дает возможность ограничить разыскания определенными типами файлов (PDF, DOC, XLS, PPT), местом положения искомых слов в документе или определенным доменом.

Google (http://www.google.com) — одна из самых полных зару-

бежных ИПС. Объем ее базы составляет более 560 миллионов документов. Отличительной особенностью ИПС Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Чем больше ссылок на какую-либо страницу имеется на других страницах, тем выше ее рейтинг в ИПС Google.

AltaVista (http://www.altavista.com) – одна из старейших поис-

ковых систем занимает одно из первых мест по объему документов – более 350 миллионов. AltaVista позволяет осуществлять простой и

128

расширенный поиск. «Help» позволяет даже неподготовленным пользователям правильно составлять простые и сложные запросы.

6.4. Электронная почта

Электронная почта (E-mail) – средство обмена сообщениями в вычислительных сетях в режиме off-line. Электронной почтой можно пересылать текстовые сообщения, архивированные и присоединенные файлы. В этих файлах могут содержаться данные в различных форматах (тексты программ, графические звуковые и видеофайлы ). Электронное письмо приходит сразу же после его отправления и хранится в почтовом ящике почтового сервера до получения адресатом. Пользователи Интернет с помощью электронной почты получают доступ к различным услугам Всемирной сети, так как основные сервисные программы имеют интерфейс с данной службой. Из множества программных систем электронной почты, получивших широкое распространение, можно назвать такие, как Outlook Express, используемой совместно с браузером MS Internet Explorer; The Bat, Mail.ru, Eudora, Elm, Pine, Mail.sibnet.ru и многие др.

В различных доменах могут быть свои, независимые друг от друга, почтовые системы. У каждого почтового домена может быть несколько пользователей. Поведение систем при связи друг с другом строго стандартизировано, для этого используется протокол SMTP наравне с всеобщей поддержкой DNS всеми участниками. Взаимодействие почтовой системы и пользователей, в общем случае, никак не регламентируется и может быть произвольным, хотя существуют как открытые, так и закрытые (завязанные на ПО конкретных производителей) протоколы взаимодействия между пользователями и почтовой системой.

Клиентская почтовая программа, с помощью которой пользователь осуществляет доступ, называется пользовательским агентом [12] MUA (Mail User Agent). Агент MUA отправителя формирует заголовок сообщения, кодирует сообщение в соответствии со стандартом так, чтобы MUA принимающей стороны смог правильно интерпретировать и представить текст и вложения письма. Так как MUA обычно устанавливается на машине пользователя, он, как правило, запускается только на время работы пользователя, а компьютер, на котором запущен MUA , может не иметь постоянного подключения к сети.

129

Поэтому MUA не может выступать в качестве сервера – он может быть только инициатором соединения, то есть клиентом. Входящие письма MUA забирает из хранилища сообщений по протоколу, предназначенному для получения почты. Как правило, для этой цели используется один из двух протоколов:

Post Office Protocol - Version 3 ( POP3) – протокол почтового отделения, версия 3, позволяющий просматривать сообщения в почтовом ящике, забирать и удалять их;

Internet Message Access Protocol ( IMAP ) – протокол доступа

ксообщениям, обладающий более широкими возможностями. Сообщение, сформированное MUA отправителя, по протоколу

SMTP посылается агенту подачи сообщения MSA (Message Submission Agent) . Агент MSA проверяет, имеет ли данный MUA или пользователь право посылать почту из этой почтовой системы. В случае положительного результата, сообщение принимается для дальнейшей доставки. MSA проверяет заголовок сообщения и, при необходимости, исправляет его. Готовое к отправке сообщение по протоколу SMTP отправляется на почтовый сервер или транспортному агенту MTA (Mail Transfer Agent) исходящей почты.

MTA исходящей почты анализирует адрес получателя. Если сообщение предназначено для получателя домена, обслуживаемого данной почтовой системой, то оно доставляется получателю, в противном случае MTA запрашивает информацию о почтовом домене, указанном в адресе получателя, сервер DNS. Получив запрашиваемые данные, сервер DNS сообщает MTA, какие узлы принимают почту для данного домена, их адреса IP и приоритеты.

MTA отправителя пытается установить соединение по протоколу с принимающими почту узлами в соответствии с приоритетами, указанными в записях, полученных от сервера DNS. Если соединение ни с одним узлом не удается установить, сообщение помещается в очередь и через некоторое время попытки установить соединение повторяются. Если соединение установлено, то принимающий MTA, удостоверившись, что сообщение предназначено для пользователя его домена и что почтовый ящик с указанным адресом действительно существует, принимает сообщение.

В почтовых системах, использующих интерфейс Всемирной паутины WWW, агенты MSA и MTA могут быть объединены в одну

130

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]