Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
учебник по информатике.doc
Скачиваний:
401
Добавлен:
10.02.2016
Размер:
18.35 Mб
Скачать

7.2. Передача информации в сети интернет

Информация в глобальной сети хранится на ИНТЕРНЕТ – страницах. Они обычно имеют цифровое представление информации. Страница из книги имеет объем информации около 2000 байт, или 2000 * 8 = 16 000 бит. При скорости передачи информации в 16 Кбит/с ее передача займет одну секунду. За минуту можно передать содержание брошюры в 60 страниц, а за час – содержимое 3600 страниц, т.е. уже несколько книг.

Под ИНТЕРНЕТ – страницей подразумевается нечто иное, чем обычная страница книги. ИНТЕРНЕТ – страница – это объединенный под некоторым именем объем информации, находящейся на удаленном компьютере поставщика услуг ИНТЕРНЕТ. Страница может принадлежать фирме, организации или частному лицу. Такая страница, часто именуемая сайтом (site), может иметь множество других страниц. Нет прямой связи между размером ИНТЕРНЕТ – страницы и размером экрана дисплея ПК (или, точнее говоря, объемом информации, которая размещается в пределах одного экрана).

Условно различают несколько видов ИНТЕРНЕТ – страниц, или сайтов:

  • Основная страница – это страница, которая появляется сразу после загрузки программы поиска (браузера).

  • Главная или начальная страница – первая страница многостраничного документа.

  • Домашняя страница – страница отдельного пользователя.

  • «Желтая страница» – страница организации, объединения, общества и др.

В 2005 г. в ИНТЕРНЕТ существует около 7,1 млн. уникальных Web–сайтов. Из них 2,9 млн. находятся в свободном доступе, 1,5 млн. являются частными, 2,7 млн. находятся на стадии создания или обновления.

Все страницы, в принципе, имеют одинаковую структуру. Они написаны на языке разметки гипертекстовых ссылок HTML (Hyper – Text Markup Language – гипертекстовый язык описания документов). Страницы могут отличаться объемом, числом гиперссылок, количеством графических, звуковых и иных вставок и т.д. Одну и ту же страницу можно использовать в качестве основной, главной или домашней страницы. Первыми свои начальные страницы обычно создают провайдеры ИНТЕРНЕТ. Каждый пользователь ИНТЕРНЕТ может создать свою домашнюю страницу. Свои сайты имеют все крупные организации и фирмы, учебные заведения, отдельные крупные политики, писатели и артисты, другие пользователи. В качестве примера приведена главная страница официального сайта Одесской национальной юридической академии (рис. 7.4,www.nla.od.ua).

Кконцу 80 – ых г.г. появилось новое понятие – «мультимедиа» (multimedia означает работу компьютера во многих средах). Помимо числовой и текстовой, компьютерам с появлением мультимедиа стала доступна для обработки самая разнообразная информация: графическая, звуковая, анимационная и т.д.

Для полноценного представления данных передаваемая по сетям информация должна содержать все элементы мультимедиа. Ввиду обилия такой информации возникла проблема эффективной работы с ней. Впервые возможности мультимедиа были поддержаны десятками новых команд микропроцессоров PentiumMMX(MultiMediaextension) иPentiumII. Затем вPentiumIIIбыло множество команд для поддержки ИНТЕРНЕТ, а вPentium4 уже введены команды для работы с потоком видеоинформации.

До появления компьютеров и ИНТЕРНЕТ проблема поиска информации в книгах решалась с помощью оглавления, заставок и перекрестных ссылок. В оглавлении каждой фразе в жесткое соответствие ставился некоторый фрагмент текста. Перекрестные ссылки указывали на необходимость произвольных переходов от одних фрагментов текста к другим.

Таким же образом была решена проблема представления информации в ИНТЕРНЕТ. Информации был придан гипертекстовый характер. Это означает, что в тексте документов, передаваемых по сетям, имеются выделенные (чаще всего подчеркиванием) слова, именуемые гипертекстовыми ссылками.

Гипертекстовые ссылки являются составной частью текста и не требуют отдельного места. Если активизировать любую гипертекстовую ссылку мышью, произойдет переход на соответствующую страницу. Ссылки могут быть и в виде небольших рисунков – гипермедиа – ссылки. С ними могут быть связаны не только фрагменты текста, но и другие рисунки, фрагменты видео –, звукозаписи и иные объекты мультимедиа.

В сети ИНТЕРНЕТ используется множество разнообразного оборудования и ПО, от которого зависят возможности сети: производительность, надежность и т.д. Возникает проблема совместимости различного оборудования, или разных типов ОС.

В сети независимо функционируют аппаратные и программные средства. Для осуществления сетевого взаимодействия устройств необходимо обеспечить единство правил их взаимодействия.

Схемы, определяющие общие концепции или руководящие принципы организации сетей, называются сетевыми моделями. Сетевые модели описывают сервис, необходимый для передачи данных в сети.

Наибольшее распространение получила Эталонная модель взаимодействия открытых систем OSI(Open System Interconnection Reference Model), разработанная международной организацией по стандартизации (ISO). Эталонная модель представляет собой обобщенную стандартную архитектуру, предназначенную для объединения систем.

Модель OSIбыла разработана в начале 80 – ых г.г. на основании опыта, полученного при создании компьютерных сетей, в основном глобальных.

Открытой системойможет быть названа любая система (компьютер, вычислительная сеть, ОС, программный пакет, другие аппаратные и программные продукты), которая построена в соответствии с открытыми спецификациями. Под термином «спецификация» в вычислительной технике понимают описание аппаратных или программных компонентов: способов их функционирования, взаимодействия с другими компонентами, условий эксплуатации, ограничений и др.

Под открытымиспецификациями понимаются опубликованные, общедоступные спецификации, соответствующие стандартам и принятые в результате достижения согласия после всестороннего обсуждения всеми заинтересованными сторонами. Если две сети построены с соблюдением принципов открытости, это дает следующие преимущества:

  • возможность построения сети из аппаратных и программных средств различных производителей, придерживающихся одного стандарта;

  • возможность замены отдельных компонентов сети другими, более совершенными, что позволяет сети развиваться с минимальными затратами;

  • возможность быстрого объединения сетей;

  • простоту освоения и обслуживания сети.

Для реальных систем полная открытость является недостижимым идеалом, «открыты» лишь некоторые части, поддерживающие внешние интерфейсы.

В модели OSI под открытой системой понимается сетевое устройство, готовое взаимодействовать с другими сетевыми устройствами с использованием стандартных правил, определяющих формат, содержание и значение принимаемых и отправляемых сообщений.

Модель OSI определяет различные уровни взаимодействия систем, дает им стандартные имена и указывает, какие функции должен выполнять каждый уровень.

Эталонная модель OSI включает в себя семь уровней (рис. 7.5):

  • 1 – прикладной;

  • 2 – представительный;

  • 3 – сеансовый;

  • 4 – транспортный;

  • 5 – сетевой;

  • 6 – канальный;

  • 7 – физический.

Физический уровень. Физический уровень обеспечивает интерфейс между компьютерами и средой передачи дискретных сигналов. Он управляет потоком данных через этот интерфейс. Физический уровень занимается в буквальном значении этого слова – передачей данных.

На физическом уровне определяются электрические, механические, функциональные и процедурные параметры для физической связи в системах. Физическая связь и неразрывная с ней эксплуатационная готовность являются основной функцией этого уровня.

На этом уровне модели OSI задаются следующие характеристики сетевых компонентов: типы соединений сред передачи данных, физические топологии сети, способы передачи данных (с цифровым или аналоговым кодированием сигналов), виды синхронизации передаваемых данных, разделение каналов связи.

Канальный уровень. Канальный уровень обеспечивает функциональные и процедурные средства для установления, поддержания и расторжения соединений на уровне каналов передачи данных. Канальный уровень формирует из данных, предоставляемых физическим уровнем, «кадры» (пакеты) и передает их сетевому уровню.

Канальный уровень проверяет доступность среды передачи и реализует механизмы обнаружения и коррекции ошибок.

Для работы на канальном уровне биты группируются в наборы. Эти наборы и называются кадрами. Канальный уровень обеспечивает корректность передачи каждого кадра. Для этого канальный уровень используется метод подсчета контрольной суммы.

Информация, которую добавляет в начало пакета данных канальный уровень, может включать адрес источника и адрес назначения (физический или аппаратный), информацию о длине файла и информацию об активных протоколах верхнего уровня.

В целом канальный уровень – мощный и законченный набор функций по пересылке сообщений между узлами сети.

Сетевой уровень.Основная задача сетевого уровня – маршрутизация данных (передача данных между сетями). Каждая из сетей имеет свой уникальный адрес. По этому адресу специальные устройства направляют сообщение в заданную сеть. Для определения абонента внутри сети используется адрес узла. На этом уровне посылка данных рассматривается как пакет, доставляемый адресату. На сетевом уровне единица информации представляется пакетами. Сетевой уровень устанавливает связь в вычислительной сети между двумя абонентами. Соединение происходит благодаря функциям маршрутизации, которые требуют наличия сетевого адреса в пакете. Сетевой уровень обеспечивает образование единой транспортной системы, объединяющей несколько сетей.

Транспортный уровень.На этом уровне определяется взаимодействие рабочих станций – источника и адресата данных, организуется и поддер­живается логический канал (транспортное соединение) между абонента­ми.

На пути от отправителя к получателю пакеты информации, которые сформировал сетевой уровень, могут быть искажены или утеряны. Необходимость обеспечения надежности передачи данных обусловила появление транспортного уровня.

Транспортный уровень обеспечивает эффективную и надежную передачу данных между объектами. На этом уровне посылка данных рассматривается как сегмент.

Транспортный уровень поддерживает непрерывную передачу данных между двумя взаимодействующими друг с другом пользовательскими процессами. Качество транспортировки, безошибочность передачи, независимость вычислительных сетей, сервис транспортировки из конца в конец, минимизация затрат и адресация связи гарантируют непрерывную и безошибочную передачу данных.

Сеансовый уровень. Основным назначе­нием этого уровня является организация сеансов связи между прикладными процесса­ми различных рабочих станций. Сеансовый уровень координирует прием, передачу и выдачу одного сеанса связи.

Для координации необходимы контроль рабочих параметров, управление потоками данных промежуточных накопителей и диалоговый контроль, гарантирующий передачу имеющихся в распоряжении данных. Сеансовый уровень дополнительно выполняет функции проверки пользовательского имени и пароля, подсчета платы за пользование ресурсами сети, синхронизации и отмены связи в сеансе передачи после сбоя в нижерасположенных уровнях.

Представительный уровень. Этот уровень определяет единый для всех систем синтак­сис передаваемой информации. Необходимость данного уровня обуслов­лена различной формой представления информации в сети передачи дан­ных и в компьютерах. Уровень играет важную роль в обеспечении «открытости» систем, позволяя им общаться между собой независимо от их внутреннего языка. Уровень представления отвечает за возможность диалога между приложениями на разных машинах и обеспечивает преобразование данных (кодирование, компрессия и т.д.) прикладного уровня в поток информации для транспортного уровня. Этот уровень осуществляет интерпретацию передаваемых во время диалога данных.

Представительный уровень имеет дело с формой представления передаваемой по сети информации, не меняя при этом ее содержания. За счет уровня информация, передаваемая прикладным уровнем одной системы, всегда понятна прикладному уровню другой системы. С помощью средств данного уровня протоколы прикладных уровней могут преодолеть синтаксические различия в представлении данных или же различия в кодах символов. На этом уровне может выполняться шифрование и дешифрование данных, благодаря которому секретность обмена данными обеспечивается сразу для всех прикладных служб.

Прикладной уровень. Прикладной уровень является основным с точки зрения пользователя. Наряду с прикладными протоколами он определяет протоколы передачи файлов виртуального терминала, электронной почты и др. Прикладной уровень – это в действительности просто набор разнообразных программных средств, с помощью которых пользователи сети получают доступ к разделяемым ресурсам, таким как файлы, принтеры или гипертекстовые Web – страницы, а также организуют свою совместную работу, например, с помощью протокола электронной почты.

Единица данных, которой оперирует прикладной уровень, обычно называется сообщением (message). Существует большое разнообразие служб прикладного уровня. Прикладной уровень отвечает за доступ приложений в сеть. Задачами этого уровня является копирование файлов, обмен почтовыми сообщениями и управление сетью.

Каждый уровень имеет дело с одной определенной стороной взаимодействия сетевых устройств. Модель OSI описывает взаимодействие двух сетевых компьютеров.

Два компьютера устанавливают сетевое взаимодействие тогда, когда их ПО соответствующего уровня модели OSI может взаимодействовать между собой.

Cетевые протоколы – многоуровневые. Протоколы самого нижнего уровня описывают правила обмена минимальными порциями информации между узлами, на следующем уровне описываются правила разбиения информации на минимальные порции и т.д. Это позволяет пользователю не задумываться над тем, как будет передан текст или файл от одного узла к другому.

На нижнем уровне используются два основных протокола: IP – Internet Protocol (протокол ИНТЕРНЕТ) и TCP– Transmission Control Protocol (протокол управления передачей). Протокол TCP отвечает за разбиение информации на порции и последующее восстановление этих порций в единую структуру. Протокол IP контролирует передачу порций информации получателю.

Среди протоколов высокого уровня можно выделить:

  • SMTP – Simple Mail Transport Protocol (простой протокол пересылки почты);

  • POP3 Post Office Protocol (протокол почтового офиса), отвечающий за доставку электронной почты;

  • FTP File Transfer Protocol (протокол передачи файлов), позволяющий получать и передавать файлы;

  • HTTP – Hyper Text Transfer Protocol (протокол передачи гипертекста), предоставляющий возможность обмена документами, имеющими перекрестные ссылки, и др.

Для обеспечения уникальности имени каждого узла в сети ИНТЕРНЕТ применяется специальная система адресов, именуемая IP – адресацией. IP – адрес используется специальными компьютерами, называемыми маршрутизаторами, для передачи пакетов по сети. Каждый информационный пакет содержит IP – адреса компьютера – отправителя и компьютера – получателя. Каждый подключенный к ИНТЕРНЕТ компьютер должен иметь свой собственный адрес.

По стандарту IP, применяемому в настоящее время, адрес каждого компьютера в сети записывается в виде числа, состоящего из четырех трехзначных групп цифр, разделенных тремя точками, например:

195.114.128.50

Каждая группа цифр – это один байт (октет) IP – адреса, поэтому такая группа цифр может принимать значения только от 0до255.

0.0.0.0– это наименьшее возможное значение IP – адреса, а255.255.255.255– его наибольшее возможное значение.

Крайнее слева число обозначает крупную сеть. Числа, стоящие правее, указывают на более мелкие участки внутри этой крупной сети, и так далее до конкретного компьютера. Обычно в числовом адресе отражаются класс сети, номер сети и номер компьютера.

IP – адрес каждому владельцу компьютера выдается в аренду уполномоченной на то региональной организацией (регистрационным центром). Выдача адресов каждому физическому лицу или организации производится из существующего пула(pool) адресов, выделенного InterNIC/RIPE для данного региона.

Например – Одесский ИНТЕРНЕТ – сервис – провайдер (ISP) PACO Links Int. арендует пул IP – адресов от 195.114.128.0 до 195.114.129.255.

Различают фиксированные (постоянные) и временные IP – адреса. Большинство пользователей, подключающихся к сети через обычные модемы для установления временного сеанса связи, не имеют фиксированного IP – адреса. Им присваивается временный IP – адрес. Компьютеры в организациях, локальные сети которых подключены к ИНТЕРНЕТ постоянно, имеют, как правило, фиксированные IP – адреса.

Существует градация и на так называемые «числовые» и «доменные» адреса – DNS(DomianNameSystem). Слово «домен» (domain) можно перевести как «территория, сфера, область». Эти два типа адресов не заменяют, а лишь дополняют друг друга. На сегодняшний день числовой адрес в сети большая редкость. Следует различать адреса и имена.

Адрес(IP – адрес) – принадлежность компьютера. IP – адрес не предназначен для использования человеком – он достаточно абстрактен и плохо запоминается людьми.

Имя– принадлежность определенного ресурса в ИНТЕРНЕТ (сайта, страницы, сервера). Имена легко запоминаются, так как они выбираются создателями ресурсов, исходя из необходимости их запоминания и быстрой узнаваемости.

Например, имя сайта www.bmw.comуказывает на то, что этот сайт содержит информацию о широко известной автомобильной фирме BMW, а имя сайтаwww.whitehouse.gov говорит о том, что это сайт американского Белого дома.

Имена ИНТЕРНЕТА структурированы, как папки в Проводнике – в виде «дерева» (рис. 7.6).

Корнем этого дерева является некая условная точка, символизирующая собой весь ИНТЕРНЕТ в целом. Эта точка подразумевается, но никогда не пишется в именах ИНТЕРНЕТ.

Следующим уровнем будут известные всем доменные именаверхнего уровня (top – level domain). Они всегда начинаются с точки, например:

.edu – учебные заведения;

.gov – правительственные учреждения;

.com – коммерческие организации;

.net – организации сетевых служб ИНТЕРНЕТА;

.org – некоммерческие организации;

.int – международные организации;

[Countres] – двухсимвольный код, обозначающий какую – либо страну. Например:

.su – Советский Союз (используется до сих пор);

.ru – Россия;

.uk – Великобритания;

.ua – Украина;

.ge – Германия;

.fr – Франция;

.no – Норвегия.

Кроме доменов верхнего уровня используются домены второго и третьего уровней.

Пример доменов второго уровня: .od.ua, .com.ua, .ua.net. В этих именах могут использоваться обозначения, совпадающие с именами доменов верхнего уровня. Следует их правильно различать. Доменным именем верхнего уровня будет только та часть, что стоит после последней точки.

Части доменных имен называются «субдоменами» (subdomains). В приведенном примере субдоменами являются .od, .com, .ua, .net, а доменом второго уровня –.od.ua (т.е. сочетание двух субдоменов).

Субдомены второго уровня обычно распределяются владельцами (или арендаторами) доменов первого уровня и, как правило, образуются либо от названия организации (в имени www.bmw.com), либо от географического названия той местности, где находится обладатель доменного имени второго уровня (.odessaв имени.odessa.ua).

Доменные имена третьего уровня обычно выбираются арендаторами доменных имен второго уровня – например: .nla.od.ua, в которых добавляется субдомен третьего уровня (в данном случае –.nla).

Субдомен третьего уровня обычно обозначает организацию либо является именем конкретного компьютера в организации. Например, имя www.nla.od.uaозначает имя компьютера, на котором находится WWW – серверNLA(Одесская национальная юридическая академия), находящийся в г. Одесса, Украина.

Существуют и доменные имена четвертого уровня – в организациях с разветвленной структурой.

Имена компьютеров или ресурсов в сети и IP – адреса обычно строго соответствуют друг другу – каждому имени присваивается IP – адрес. Например, серверу с именем po.paco.netприсвоен адрес195.114.128.20, по которому его и будут искать в сети все другие компьютеры.

Но пользователи компьютеров не могут и не должны запоминать IP– адреса всех тех компьютеров, с которыми им приходится работать. За них эту функцию выполняет специальная программа, называемаяDomain Name System, работающая, как правило, на специально выделенных для этой цели компьютерах, именуемых серверамиDNS.

Такие сервера заняты двумя основными задачами – поиском по известному имени компьютера его IP– адреса, либо наоборот, по известномуIP– адресу находят имя компьютера.

Естественно, имена компьютеров используются людьми, а IP– адреса – компьютерами. СерверDNSкак бы выполняет функции переводчика с языкаIP– адресов, понятного компьютерам, на язык имен, понятный человеку, и наоборот.

Ни один из серверов DNSне может знать всех имен и всех адресов в ИНТЕРНЕТ. Поиск нужного адреса осуществляется путем опроса других серверовDNS, подключенных к ИНТЕРНЕТ. Если искомый адрес существует, через некоторое время он обязательно будет найден, даже если это соответствие имени и адреса отыскалось на сервереDNS, физически находящемся в другом полушарии Земли.

Одна из проблем, возникающих при работе с ИНТЕРНЕТ, заключается в необходимости найти нужную информацию и оценить её. Все существующие типы поисковых систем обрабатывают массивы неоднородной информации, содержащейся в ИНТЕРНЕТ, используют разные средства и способы поиска. Основные способы поиска информации в ИНТЕРНЕТ следующие:

  • Непосредственный поиск с использованием гипертекстовых ссылок. Поскольку все сайты в пространстве WWW фактически оказываются связанными между собой, поиск информации может быть произведен путем последовательного просмотра связанных страниц. Используется на заключительных этапах информационного поиска, когда необходим глубокий анализ полученной информации.

  • Использование поисковых машин. Этот метод – один из основных и фактически является единственным при проведении предварительного поиска. Результатом последнего может быть список ресурсов сети, подлежащих детальному рассмотрению. Как правило, применение поисковых машин основано на использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска.

  • Поиск с применением специальных программных средств. Этот полностью автоматизированный метод может оказаться эффективным для проведения первичного поиска. Результаты автоматического поиска обязательно требуют последующей обработки. Применение данного метода целесообразно, если использование поисковых машин не может дать необходимых результатов.

  • Анализ новых ресурсов. Поиск по новообразованным ресурсам может оказаться необходимым при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа развития объекта исследования в динамике. Обычно используется при проведении поиска в узко специальной области.

Поисковые системы можно разделить на классы:

  • машины Web – поиска (search engines, SE);

  • каталоги (directories, DIR);

  • БД адресов электронной почты (E – mail addresses database, mailDB);

  • поиск в архивах Gopher (Gopher archives, GA);

  • системы поиска ftp – файлов (FTP Search, ftpS);

  • системы поиска в Usenet News (Usenet search или Newsgroups search, NS);

  • интерфейсы к другим поисковым системам (Interfaces) и мультисистемные поисковые интерфейсы (Metasearch Pages, MP).

В результате создания ИНТЕРНЕТ человечество получило доступ к огромным информационным ресурсам. Использование ИНТЕРНЕТ существенно повышает эффективность работы юристов и экономистов. Поиск информации в ИНТЕРНЕТ значительно эффективнее при знании пользователем существующих механизмов поиска информации.