- •Тема 3 поисковые системы
- •3.1. Структура и основные принципы работы сети Интернет
- •3.2. Виды, типы, разновидности сайтов, классификация сайтов
- •Статические сайты – состоящие из отдельных html-страниц.
- •Динамические сайты – построенные на системе управления (cms).
- •Флэш-сайты –только красиво
- •3.3. Интернет-браузеры
- •3.4. Поиск информации в сети Интернет
- •3.5. Обзор основных поисковых систем
Тема 3 поисковые системы
3.1. Структура и основные принципы работы сети Интернет
Сущность Интернет
Под Internet понимают глобальное сообщество мировых сетей, которые используют Интернет для обмена данными. Интернет представляет собой глобальную компьютерную сеть, содержащую гигантский объем информации по любой тематике, доступной на коммерческой основе для всех желающих, и представляющую большой спектр информационных услуг. Интернет состоит из множества компьютеров, соединенных между собой линиями связи, и установленных на этих компьютерах программ. Интернет обеспечивает обмен информацией между всеми компьютерами, которые входят в сети, подключенные к ней. Тип компьютера и используемая ими операционная система значения не имеют.
Интернет появился аналогично большинству современных информационных технологий, как военная программа, направленная на повышение устойчивости системы обороны США.
2 января 1969г. Агентство перспективных исследовательских проектов (ARPA) Министерства обороны США начало работу над проектом связи компьютеров оборонных организаций. В результате была создана сеть ARPANET. ARPANET обеспечивала связь между университетами, военными учреждениями и предприятиями оборонной промышленности. В случае разрушения одной или нескольких линий связи система должна была уметь переключаться на другие линии. Спустя некоторое время в систему были встроены программы перемещения файлов и электронная почта. Принципы ее построения в дальнейшем были использованы при создании Интернет.
Следующим этапом в развитии Интернет было создание в 1983 году сети Национального научного фонда США – NSFNET. Эта сеть объединяла научные центры. Основой сети стали пять суперкомпьютеров, соединенных между собой высокоскоростными линиями связи. Пользователи могли подключаться к сети и использовать возможности этих суперкомпьютеров.
В 1987 г. сеть NSFNET состояла из 13 центров, соединенных высокоскоростными линиями связи. Центры располагались в разных частях США. Сеть NSFNET быстро заняла место ARPANET, которая была ликвидирована в 1990г. Так появилась сеть Интернет.
Одновременно были созданы национальные сети в других странах. Они стали объединяться. В 90-х годах появился Интернет в нынешнем виде. Сейчас internet объединяет тысячи разных сетей, расположенных по всему миру, к ней имеют доступ десятки миллионов пользователей. В России Интернет появился недавно. Бурный рост пользователей в России начался с 1996г.
Интернет скоро станет основным средством связи. Умение работать в Интернет является обязательным условием для достижения успехов практически в любой области деятельности.
Структура Интернет
Отличительной особенностью Интернет является высокая надежность. При выходе из строя части компьютеров и линий связи сеть будет продолжать функционировать. Такая надежность обеспечивается тем, что в сети Интернет нет единого центра управления. Если выходят из строя некоторые линии или компьютеры, то сообщения могут быть переданы по другим линиям связи. (схема 1)
Основными элементами Интернет являются локальные вычислительные сети (ЛВС). Если ЛВС подключена к Интернет, то и каждая рабочая станция этой сети может подключаться к Интернет. Существуют также компьютеры самостоятельно подключенные к Интернет. Это хост - компьютеры (host-хозяин). Центральная жила Интернет – оптоволоконный кабель с очень высокой пропускной способностью. Кроме того, информацию можно передавать с помощью спутниковых систем связи между континентами через космическое пространство.
Интернет представляет собой совокупность физически взаимосвязанных хост - компьютеров. Каждый подключенный к сети компьютер имеет свой уникальный адрес (InternetProtocol - протокол Интернета (IP- адрес)), по которому его может найти абонент из любой точки мира.
Пользователи подключаются к сети интернет через компьютеры специальных организаций, которые называются поставщиками услуг Интернет (провайдерами – provider). Провайдеры имеют множество линий для подключения пользователей и высокоскоростные линии связи для подключения к остальной части Интернет. Мелкие поставщики подключаются к более крупным.
Компьютеры подключенные к Интернет часто называются ее узлами или сайтами (site – место). Узлы установленные у провайдеров, обеспечивают доступ пользователей к Интернет.
Краткая характеристика ресурсов Интернет
Информационные ресурсы Интернет – это вся совокупность информационных технологий и баз данных, которые доступны при помощи этих технологий. ИЗ всех перечисленных рассмотрим наиболее популярные:
1)Всемирная паутина WWW (WorldWideWeb);
2) электронная почта (E-Mail);
3) телеконференции Usenet;
4) система файловых архивов (FTP).
1. Распределенная гипертекстовая информационная система WorldWideWeb (WWW - Всемирная паутина) – это одна из наиболее популярных служб Интернета, управляющая передачей гипертекстовых документов. WorldWideWeb – предоставляет удобный доступ к большинству информационных архивов Интернет. Особенностью системы является механизм гипертекстовых ссылок, благодаря которому пользователь может просматривать материалы в порядке выбора этих ссылок. В системе WWW существует большое количество различных каталогов, которые позволяют ориентироваться в сети.
Отображение Web-документа на компьютере пользователя производится специальной программой - броузером (от английского слова browser) или обозревателем. Наиболее распространёнными браузерами являются InternetExplorer фирмы Microsoft и NetscapeNavigator фирмы NetscapeCommunications.
2. Электронная почта (E-Mail – ElectronicMail) – удобное и надежное средство передачи персональных сообщений с одного компьютера на другой.
Характерной особенностью электронной почты, отличающей ее от других служб Интернета, является то, что ее работа, как правило, основана на двух прикладных протоколах. 1) используется для отправки исходящих сообщений, 2) для получения входящих сообщений. Соответственно, со стороны Интернет работа электронной почты обеспечивается двумя серверами: сервером исходящих сообщений и сервером входящих сообщений.
Служба исходящих сообщений, как правило, основана на протоколе SMTP (SimpleMailTransferProtocol - простейший протокол передачи почты). Наиболее распространенным протоколом службы входящих сообщений является протокол POP (PostOfficeProtocol - протокол почтового отделения).
Для работы с электронной почтой используются специальные программы — почтовые клиенты, которые устанавливаются на ПК пользователей. В настоящее время в мире насчитывается несколько сот почтовых клиентов. Они различаются аппаратно-программной платформой, для которой предназначены, интерфейсом пользователя и составом исполняемых функций. Для платформы Windows наиболее популярными почтовыми клиентами являются:
>MicrosoftOutlook (поставляется в составе пакета MicrosoftOffice 2000);
> Microsoft Outlook Express (поставляетсявсоставеОС Microsoft Windows 98);
Наряду с обычной электронной почтой (E-Mail), основанной на протоколах SMTP и POP, в сети Интернет в последние годы появилась другая система электронной почты, основанная на службе WWW, получившая название Web-Mail.Эта система является бесплатным почтовым сервисом, реализованным средствами службы WWW. Co стороны Интернета этот сервис поддерживается обычными Web-серверами, а на стороне клиента для работы с ним достаточно иметь обычный Web-браузер.
3. Usenet– это система телеконференций Интернет. Система построена по принципу электронных досок объявлений, когда любой пользователь может поместить свою информацию в одну из групп новостей Usenet. Эта информация будет доступна другим пользователям, которые на данную группу новостей подписаны. Usenet- хорошее место для объявления международных конференций и семинаров.
4. Система файловых архивов (FTP) – это огромное распределенное хранилище всевозможной информации, накопленной за последние 10-15 лет в сети. Здесь можно найти информацию по различным отраслям знаний, главным образом по компьютерной проблематике и многое другое. Практически любой архив строится как иерархия каталогов. Многие архивы дублируют информацию из других архивов, так называемых зеркал. Для того чтобы получить нужную информацию существует специальная программа Archive, которая позволяет просканировать FTR - архивы и найти, тот который устраивает пользователя по составу программного обеспечения и коммуникационным условиям.
Способы подключения к Интернет
Существует два способа подключения к Интернет компьютера пользователя.
1способ. Через локальную сеть организации по специальной линии (каналу) связи. В этом случае пользователь получает доступ в Интернет непосредственно через сервер локальной сети.
2способ. В режиме удалённого доступа. Локальный компьютер пользователя подключается к серверу Интернет автономно по телефонным линиям связи посредством модема.
От типа линии связи зависит ее пропускная способность. При подключении к Интернет в режиме удалённого доступа скорость передачи данных в значительной степени зависит от качества телефонной линии связи и, как правило, невысока (33600 бод). Передача информации по выделенной линии более качественная и осуществляется значительно быстрее.
В основе Интернет лежит протокол TCP/IP (TransmissionControlProtocol / InternetProtocol - протокол управления передачей / протокол Интернет). Точнее говоря, это не один протокол, а набор протоколов (так называемый стек протоколов), лежащих на разных уровнях.
В Интернет выделяют 7 уровней взаимодействия (управления обменом данными) между компьютерами: физический, логический (или канальный), сетевой, транспортный, сеансовый, представительный (или уровень представления данных) и прикладной. При этом каждому уровню взаимодействия соответствует определенный набор протоколов.
Протокол TCP в основном соответствует транспортному уровню и отвечает за правильность преобразования сообщений в пакеты данных, из которых на приемной стороне собирается исходное послание. Протокол IP принадлежит сетевому уровню и отвечает за правильность доставки сообщений по указанному адресу (маршрутизацию). Пакеты одного сообщения могут быть доставлены совершенно разными путями.
Для идентификации компьютеров в сетях с протоколом TCP/IP используются IP-адреса. IР- адрес записывается в виде четырехбайтовой комбинации, которую можно представить в двоичной и десятичной системах кодирования. При этом в качестве разделителя между байтами (октетами) используется точка.
Например: 10000000.00101101.00001001.10001000 – в двоичной системе счисления, 128.45.9.136 – в десятичной.
Адресация ресурсов Интернет
Каждый ресурс в сети Интернет имеет свой уникальный адрес. В терминологии Интернета этот адрес называется URL(UniformResourseLocator - унифицированный указатель ресурса). URL записывается следующим образом:
протокол: // доменное_имя_сервера / путь
где:
протокол – наименование протокола, соответствующего той службе, которая осуществляет доступ к данному ресурсу;
доменное_имя_сервера– доменное имя сервера, на котором находится данный ресурс;
путь – обычный путь к файлу, содержащему Web-документ. В качестве разделителя имен каталогов и имени файла используется прямой слэш (/).
Основой системы WorldWideWeb является протокол HTTP (HyperTextTransferProtocol - протокол передачи гипертекста),который предназначен для передачи по Интернету Web-страниц. Поэтому адреса Web-ресурсов Интернета начинаются с имени этого протокола.
Например, запись вида: http://www.msu.ru/russian/recviz.html
Где http - протокол передачи гипертекста, соответствующий службе www; msu.ru - доменное имя Web-сервера; /russian/recviz.html - путь к файлу на сервере).
Доменное имя серверапредставляет его уникальный адрес в сети. Пользователю неудобно работать с числовым представлением IP-адреса. Поэтому предусмотрена другая форма записи этого адреса — доменное имя, которое является, как правило, содержательным и легко запоминается. Преобразование доменных имен в IP-адреса выполняется на специальных серверах DNS (DomainNameService - служба имен доменов).
Доменное имя включает, как минимум, два уровня доменов. Каждый домен отделяется от другого точкой. Иерархия доменных имен читается справа налево. Крайний правый домен является доменом верхнего уровня.
В настоящее время Интернет делится на домены верхнего уровня либо по географическому признаку, либо по роду деятельности тех или иных организационных структур.
Домены верхнего уровня, представленные географическим регионами, состоят из двух букв. Так, домен su указывает на принадлежность сервера к странам бывшего СССР, ru - России, uа - Украине, by - Белоруссии, de - Германии, nl - Нидерландам, uk - Великобритании, са - Канаде, fr - Франции.
Например, http://www.mos.ru
Домены верхнего уровня, представленные типами организационных структур (как правило, на серверах США), состоят из трех букв. Например:
com - коммерческие организации;
org - некоммерческие (общественные) организации;
net - сетевые организации;
mil - военные организации;
edu - образовательные учреждения;
gov - правительственные организации.
Например, http ://www.microsoft.com
Путь в адресе Web-документа может отсутствовать. В этом случае броузер загрузит домашнюю страницу Web-сервера (как правило, это файл index.htrnl корневого каталога).
Передача файлов по сети Интернет осуществляется с помощью специального протокола FTP (FileTransferProtocol - протокол передачи файлов). Файлы, которые пользователи получают и отправляют по этому протоколу, хранятся на FTP-серверах.
Адреса FTP-ресурсов в Интернете начинаются со слова ftp. Например, ftp://ftp.netscape.com (ftp - протокол передачи файлов, netscape.com - доменное имя FTP-сервера).
Браузер (программа обозреватель) InternetExplorer позволяет соединиться с FTP-сервером и работать с его файлами и папками точно также, как Вы работаете с ресурсами локального ПК при помощи Проводника.
Чтобы просмотреть содержимое какой-либо папки на FTP-сервере, нужно просто щелкнуть на ней левой кнопкой мыши. Чтобы узнать размер файла и прикинуть примерное время его загрузки, следует щелкнуть на нем правой кнопкой мыши и выбрать в контекстном меню команду Свойства. Чтобы начать загрузку файла, достаточно щелкнуть на нем левой кнопкой мыши.
