Современные информационные технологии
.pdf91
IP-адреса подразделяются на статические и динамические. Статический IPадрес выдается провайдером, который предоставляет доступ в Интернет, и не изменяется при подключении к Интернету. Динамический IP-адрес может изменяться при подключении к Интернету, например, используя Dial-up (модемное соединение) в IPадресе будет изменяться последняя цифра.
В 6-ой версии IP-адрес (IPv6) имеет 128-битовое представление. Адреса разделяются двоеточиями (напр. fe80:0:0:0:200:f8ff:fe21:67cf). Большое количество нулевых групп может быть пропущено с помощью двойного двоеточия (fe80::200:f8ff:fe21:67cf). Такой пропуск может быть единственным в адресе.
IP-адреса формата IPv4 заканчиваются. Прогноз, сделанный Number Resource Organization (NRO) в 2010 году, говорил о том, что запас IPv4-адресов предположительно иссякнет в 2011 году, однако, судя по актуальным данным об интенсивности роста регистраций новых адресов, всѐ указывает на то, что это, вероятнее всего, произойдѐт в 2012 году.
Проверить свой IP-адрес можно на следующих сайтах:
http://www.2ip.ru, http://www/myip.ru, http://www.proverim.net, http://www.ipping.ru .
Узнать, кому принадлежит IP-адрес можно также на сайтах, перечисленных выше. На сайте http://www.ip-1.ru Вы можете по заданному IP-адресу найти местоположение сетевого узла на карте.
12.3 Что такое домен?
Домен – область (ветвь) иерархического пространства доменных имѐн сети Интернет, которая обозначается уникальным доменным именем.
Доменное имя – символьное имя домена, обязательно уникальное в рамках одного домена. Полное имя домена состоит из имѐн всех доменов, в которые он входит, разделѐнных точками. Доменное имя служит для адресации узлов сети Интернет и расположенных на них сетевых ресурсов (web-сайтов, серверов электронной почты, других служб) в удобной для человека форме. Теоретически каждому IP-адресу сетевого узла можно поставить в соответствие доменное имя. На практике доменные имена имеют те устройства (их называют хостами), которые активно обрабатывают запросы от клиентов пользователей Интернет.
Исходя из технических и административных особенностей, длина доменного имени ограничивается обычно 63 символами. Однако, в некоторых зонах это ограничение равно 127 символам. Как бы то ни было, доменное имя не может быть длиннее 253 знаков.
Доменная зона – совокупность доменных имѐн определѐнного уровня, входящих в конкретный домен. Например, зона ru включает все доменные имена второго уровня в этом домене.
Краткое описание популярных доменных зон:
ru – официальная доменная зона Российской федерации;
com, biz – зоны, предназначенные для доменов коммерческих организаций;
92
net – для ресурсов, посвященных Интернету или деятельность которых связана с ним;
org – для организаций и некоммерческих проектов; info – для информационных ресурсов;
name – именная доменная зона для персональных сайтов;
su – региональный домен для стран бывшего Советского Союза. Ознакомиться с полным списком доменных зон можно на сайте IANA по адресу
http://www.iana.org/domains/root/db/ .
IANA (от англ. Internet Assigned Numbers Authority – «Администрация адресно-
го пространства Интернет»). Находится под управлением ICANN – американской некоммерческой организации, управляющей пространствами IP-адресов, доменов верхнего уровня, а также регистрирующей типы данных MIME и параметры прочих протоколов Интернета.
Корневой домен – домен самого верхнего уровня в любой системе доменных имѐн. В системе DNS (англ. Domain Name System – система доменных имѐн) Интернета корневой домен обозначается пустым (т. е. не содержащим никаких символов) именем. При записи доменного имени, каждый домен отделяется точкой, в конце имени может присутствовать точка, которая отделяет пустое имя, соответствующее корневому домену. Если эта точка есть (например «www.example.com.»), то доменное имя считается полным (абсолютным). Если точки в конце имени нет («www.example» или «www.example.com»), то имя считается относительным.
Корневой домен Интернета (иногда его называют доменом нулевого уровня) обслуживается корневыми серверами системы доменных имен, которые располагаются в различных странах мира. Корневой домен находится под управлением организа-
ции ICANN (Internet Corporation for Assigned Names and Numbers).
Крайнее правое (после точки) сочетание символов определяет домен первого уровня, то есть доменное имя sfu-kras.ru принадлежит домену первого уровня ru.
Слева от домена первого уровня находится домен второго уровня, затем третьего и так далее. Общее количество поддоменов ограничено (не более 127). Разберѐм, например, доменное имя lib.sfu-kras.ru: sfu-kras поддомен домена ru, а lib поддомен sfu-kras.ru. Имя каждого поддомена не может содержать более 63 ASCII символов.
Домен – это, прежде всего, собственность человека или организации, имеющая защиту со стороны закона. Информация о владельце домена находится в открытом виде и доступна при помощи сервиса whois.
Whois – (от англ. "кто такой") представляет собой программный интерфейс, с помощью которого можно получить информацию о владельце сайта, дате регистрации и дате окончания регистрации доменного имени. Домен будет считаться собственностью, пока у него не истечет дата регистрации. Получить информацию о домене можно на сайтах http://www.whois-pro.ru, http://www.whois-service.ru.
12.4Что такое URL-адрес?
Вбиблиотечном деле всякий источник информации принято называть документом. Исторически сложилось так, что в Интернете термину документ соответствует
93
термин ресурс. Для устранения неоднозначности логичнее говорить «электронный ресурс».
Как уже было сказано, основной задачей Интернета является получение информации конечными пользователями. Эта информация как раз и находится в электронном ресурсе, а чтобы еѐ доставить на Ваш компьютер, необходимо знать адрес этого ресурса. Именно адреса электронных ресурсов Вы вводите или выбираете из списка в поле «адрес» браузера Internet Explorer, например, http://yandex.ru/ .
Это и есть URL-адрес. Наличие URL-адреса дает возможность клиенту (пользователю) обратиться к ресурсу с помощью специальной программы (браузера) и в ответ на это, получить содержимое ресурса.
Ресурсы, объединенные общей тематикой, называют сайтом. Каждый такой ресурс формирует страницу сайта. Перемещение по сайту, то есть, с одной страницы на другую, осуществляется при помощи гиперссылок.
URL-адрес – единообразный указатель ресурсов (англ. URL — Uniform Resource Locator). URL – это стандартизированный способ записи адреса ресурса в сети Интернет.
URL был изобретѐн Тимом Бернерсом-Ли в 1990 году в стенах Европейского совета по ядерным исследованиям в Женеве (Швейцария). URL стал фундаментальной инновацией в Интернете. Изначально URL предназначался для обозначения мест расположения ресурсов (чаще всего файлов) во Всемирной паутине (WWW). Сейчас URL применяется для обозначения адресов почти всех ресурсов Интернета.
Традиционная форма записи URL: <протокол>://<логин>:<пароль>@<хост>:<порт>/<путь> В этой записи:
протокол – oдин из используемых сетевых протоколов;
логин – имя пользователя, используемое для доступа к ресурсу; пароль – пароль указанного пользователя;
хост – полностью прописанное доменное имя хоста в системе DNS или IP – адрес хоста в форме четырѐх десятичных чисел, разделѐнных точками; числа – натуральные в интервале от 0 до 255; порт – порт хоста для подключения;
путь – уточняющая информация о месте нахождения ресурса. Примеры URL-адресов:
http://news.sfu-kras.ru/node/6834 ; http://yaca.yandex.ru/yca/geo/Russia/Siberian/Krasnoyarsk_District/Krasnoyarsk ; http://93.158.134.11 ; http://kostya:pulya@www.pochta.com:122/demo/example.cgi?country=us&state=ny#se ctional .
В последнем URL-адресе http – это тип протокола, kostya – логин, pulya – пароль, www.pochta.com – имя хоста, 122 – порт, /demo/example.cgi – путь к конкретному файлу на сервере, country=us&state=ny – некая информация передаваемая серверу, sectional – параграф того документа, который должен вернуть сервер. Прочие символы URL-адреса являются разделителями.
Если адрес ресурса набран правильно, то на экране очень скоро появится страница искомого ресурса. В случае ошибки на экране появляется отказ и, чаще всего,
94
сообщение о его причинах. Наиболее часто возникает «ошибка 404». Она свидетельствует об отсутствии документа по запрошенному адресу. «Ошибка 403» означает, что доступ к ресурсу запрещен. Ошибки 4хх относятся к ошибкам клиента. «Ошибка 500» говорит о том, что в программе, выполняющейся на сервере, произошел сбой. Ошибки 5хх относятся к ошибкам сервера. Ознакомиться с полным списком возни-
кающих ошибок можно по адресу http://ru.wikipedia.org/wiki/200_OK#200 .
Контрольные вопросы
1.Что такое Интернет?
2.Дайте определение IP-адреса.
3.Что такое домен?
4.Приведите примеры доменных зон.
5.Как записывается URL-адрес?
вернуться к оглавлению |
перейти к практическому занятию |
Лекция 13.Основы поиска в Интернет
13.1 Как найти URL-адрес нужного ресурса?
Поиск ресурсов, когда его адрес не известен, – распространенная ситуация при работе в Интернете.
Когда Вы ищете конкретный ресурс, о наличии которого вы точно осведомлены, достаточно предположить, какие ключевые слова могут сопровождать данный ресурс, затем воспользоваться полнотекстовым поиском. Обычно адрес данного ресурса будет находиться в первой десятке найденных URL-адресов.
95
В случае, когда известна тема, содержание материала, его форма и характер или же какие-либо другие признаки, по которым отыскивается информация, то целесообразно воспользоваться поиском в каталогах поисковых серверов. Например, Вам необходимо найти материал для реферата по философии на тему «Русский космизм (Н.Ф. Федоров, К.Э. Циолковский, В.И. Вернадский)». Выбираем один из поисковых серверов, например http://www.yandex.ru , далее идем по ссылке учеба, далее – учебные материалы, далее – в строку поиска вводим «космизм» «Циолковский» и получаем список из 2008 адресов электронных ресурсов. При полнотекстовом поиске Вы бы получили примерно 20000 адресов. И в первом, и во втором случаях Вы воспользовались услугами информационно-поисковой системы (ИПС).
13.2 Что такое поисковая система?
Поисковая система – программно-аппаратный комплекс с web-интерфейсом, предоставляющий возможность поиска информации в Интернете. В просторечии под поисковой системой подразумевают web-сайт, на котором размещѐн интерфейс системы. Программной частью поисковой системы является поисковая машина – комплекс программ, обеспечивающий функциональность поисковой системы и являющийся коммерческой тайной компании – разработчика поисковой системы.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины (WWW), но существуют также системы, способные искать файлы на ftpсерверах, товары в интернет-магазинах, а также информацию в группах новостей
Usenet.
Самые известные поисковые системы обслуживают в сутки миллионы клиентов. В случаях, когда поисковая система имеет в своей основе каталог, она называется каталогом или поисковым каталогом. В ее основе лежит работа модератора. Модератор знакомится с содержанием ресурса и относит его к тем или иным разделам соот-
96
ветствующего каталога. Модерирование – один из способов формирования сведений для поиска URL-адресов с помощью поисковых систем.
В основе систем с полнотекстовым поиском лежит автоматический сбор информации. Он осуществляется специальными программами, которые периодически исследуют содержимое ресурсов Интернета. Такие программы называют роботами. Поскольку чаще всего они исследуют пространство WWW (паутину), такие программы называют спайдер или паук. Универсальные поисковые системы предоставляют все виды поиска – полнотекстовый и в каталогах. Ниже приведен список русскоязычных универсальных поисковых систем:
http://www.aport.ru http://www.google.ru http://www.rambler.ru http://www.yandex.ru http://www.search.mail.ru
13.3 Как работает поисковая система?
Многие пользователи считают, что в ответ на их вопрос поисковая система начинает быстро просматривать весь Интернет, после чего выдает список страниц, где отыскалось что-то похожее на строку поиска, введенную пользователем. Разумеется, в действительности все происходит совершенно не так, потому что, если бы поисковая система при каждом запросе просматривала весь Интернет (или даже его маленькую часть), ответа приходилось бы дожидаться годами.
На самом деле почти каждая поисковая система (скажем так – классическая поисковая система) состоит из трех основных компонентов:
1)программа «робот» (паук);
2)индексатор – формирует собственные индексные БД (базы данных);
3)программа поиска и оценки результатов на основе собственных БД.
Паук – это специальная программа, которая периодически запускается на компьютере, подключенному к Интернет, и ее основная задача – перемещаться по Интернету (точнее, по сайтам) во всех возможных направлениях. Ведь на страницах много гиперссылок, так вот паук переходит по этим гиперссылкам и скачивает полученные таким образом странички для второй компоненты – индексной базы.
Индексатор – это обработчик скачанных пауком страниц. Он извлекает оттуда слова и складывает их в поисковую базу (индексную базу). При этом индексатор запоминает URL-адрес страницы, где именно было найдено то или иное слово, и эта информация потом используется в поиске.
Алгоритм поиска – это главное ноу-хау любой поисковой системы. От алгоритма зависит эффективность полученного результата – то есть насколько быстро и точно пользователь найдет то, что его интересует.
Для хорошей работы поисковой системы важны все три компоненты. Поисковая система должна иметь и шустрого паука, и мощную индексную базу, и эффективный алгоритм поиска – только тогда Вы будете получать действительно полезные ре-
97
зультаты, то есть релевантные. Релевантность – это степень соответствия документа запросу.
Отметим еще, что имеются поисковые системы, которые обследуют БД других поисковых систем. Этим самым они реализуют процесс, который получил название метапоиск, а сама система называется метапоисковая.
13.4 Как составить поисковый запрос?
Вот несколько советов от поисковой системы Яндекс. 1.Пишите грамотно слова поискового запроса.
Масса людей не могут найти сайты по интересующей их тематике просто потому, что слово введено с ошибкой. Запрос «пошив польто», конечно, будет исправлен в Яндексе на «пошив пальто», но имейте ввиду, не все ошибки программа в состоянии отследить.
2.Используйте синонимы.
Если поиск нужных результатов не принес, попробуйте переформулировать запрос, используя синонимы. Например, вместо «софт» напишите «программы для компьютера», «программное обеспечение».
3.Уточняйте запрос.
Чем точнее будет построен поисковый запрос, тем больше шансов, что в первых строках результата поиска будет нужный вам ресурс. Поэтому, если Вы ищете уже известный ресурс, статью, книгу и так далее, просто напишите это в строке поиска. Если результат Вас не удовлетворит, тогда начинайте варьировать строку.
4. Используйте ключевые слова.
Если результат поиска Вас не удовлетворил, включайте в поисковый запрос как можно больше уточняющих слов. Если Вас интересует именно творчество Герберта фон Караяна, то в поисковой строке кроме непосредственно имени великого дирижера, обязательно введите слово «творчество». Если Вы ищете информацию по автомобилю Honda – так и пишете «автомобиль Honda», а не просто «автомобиль».
5.Не пишите запрос в верхнем регистре. Все запросы желательно писать в нижнем регистре, потому что поиск обычно регистрозависимый, и строку «ТВОРЧЕСТВО ГАУДИ» Вам найдут только в том случае, если она где-то на сайте набрана заглавными буквами. Однако если Вы ищете какие-то имена собственные – например, группу «Черный кофе», а не продукт питания черный кофе, – тогда пишите их с заглавных букв (именно с заглавных, а не все заглавными).
6.В сложных случаях используйте язык запросов.
Практически все поисковые системы поддерживают так называемый язык запросов, позволяющий задавать мощнейшие комбинации различных критериев поиска.
13.5 Как правильно использовать язык запросов?
Каждая поисковая система имеет свои правила составления запроса. В практической деятельности следует внимательно изучить необходимый синтаксис, который описывается на странице той или иной поисковой системы.
98
Предположим, Вы хотите задать поисковой системе запрос следующим образом: «Найди мне все страницы, где встречается слово «селедка», при этом в любом случае отсутствует слово «картошка», не более чем через два слова от «селедки» расположено слово «атлантическая», чтобы сайт при этом находился в зоне ru и сам документ при этом ссылался на www.good.ru».
Между тем, можно составить подобный запрос, используя специальные символы в строке поиска, которые и называются языком запросов.
Рассмотрим язык запросов от поисковой системы Яндекс. 1.Исключение/включение определенных слов – знаки «+» и «-».
Предположим, что Вы хотите найти сайты, на которых есть рецепты пиццы, но при этом Вы не любите пиццу с ананасами. Тогда в запросе пишете следующее: «+рецепт +пицца –ананас» – это означает команду искать страницы, на которых в обязательном порядке присутствуют слова «рецепт» и «пицца», однако отсутствует слово «ананас».
2.Перечисление альтернатив – знак «|».
Вертикальная черта позволяет задать альтернативы: система ищет хотя бы одно из перечисленных слов. Например, если Вы хотите найти страницы, где встречается одно из слов «пицца», «пирог», «торт», поисковый запрос будет выглядеть следующим образом: «пицца | пирог | торт».
3.Поиск точного соответствия – знак «!» Обычно поисковики ищут все словоформы введенного слова, даже если оно за-
дано полностью: например, если в строке введено «ананас», то первыми будут выведены страницы, где встречается именно «ананас», но далее в результатах поиска окажутся «ананасы», «ананасами», «ананасов», и так далее. Однако если Вам нужно найти только данную конкретную форму – «ананас», тогда задавайте поисковую строку так: «! ананас».
4.Поиск точной фразы – кавычки.
Если Вам нужна точная фраза «Черная курица, или Подземные жители», а не «черная собака стащила курицу в подземном переходе у жителя города Энска», тогда при поиске заключите фразу в кавычки: «Черная курица, или Подземные жители» и в этом случае поисковик выведет только те страницы, где эти слова располагаются строго рядом.
5.Задание расстояния между слов – «/n»
В случае, когда Вы хотите найти все варианты фразы «история [любое слово] Москвы» – можно отразить это желание в поисковом запросе с помощью знака «/», означающего «не превышало», и числа, показывающего допустимое количество слов, причем 1 означает отсутствие слов. Запрос «история /+2 Москвы» означает команду искать все сочетания, где между «история» и «Москвы» не больше 1 слова. То есть «история Москвы» подойдет, «история города Москвы» тоже подойдет, а вот «история города и окрестностей Москвы» уже нет. Значок «+» означает, что слово (слова) должно (должны) быть справа, а «-» слева.
6.Ограничение по адресам – команда «#url»
Если Вас интересует поиск, например, только на конкретном сервере или по конкретной группе адресов, либо же, наоборот, поиск, который исключает конкретные адреса или группы адресов, можно воспользоваться командой #url=‖адрес или
99
группа‖. Например, если Вы хотите найти все страницы, на которых встречается слово «квадроид», исключив сайт www.kvadroid.ru, дайте следующую команду: «квадро-
ид ~~#url=‖www.kvadroid.ru‖».
7.Поиск ссылок – команда «#link»
Иногда (особенно это бывает актуальным для владельцев собственных страничек) бывает очень интересно узнать, какие сайты ссылаются (ставят гиперссылку) на тот или иной адрес. В этом случае достаточно в строке поиска задать следующие данные: «#link=‖адрес‖». То есть команда «#link=‖www.good.ru‖» покажет все страницы, где стоят ссылки на www.good.ru.
Отметим, что эти параметры, как правило, весьма похожи и в других поисковых системах, хотя в любом случае перед их использованием желательно посмотреть описание на конкретном поисковике.
В Яндексе это описание находится по ссылке Памятка по использованию языка запросов в расширенном поиске.
13.6 Расширенный поиск
Практически каждый поисковик позволяет создавать довольно сложные запросы с помощью специальной формы под названием «расширенный поиск». Все основные условия, которые можно сформировать в запросе при помощи отмеченных выше операторов, в расширенном поиске формулируются словами. Кроме этого, расширенный поиск дает возможность выборки документов по дате обновления, формату файла. Некоторые поисковые системы предлагают сортировку найденных документов по релевантности (соответствие содержания ресурса сделанному запросу), по дате, фильтрацию документов (без ограничений, семейный поиск, и пр.)
Контрольные вопросы
1.Что такое поисковая система?
2.Что означает термин модерирование?
3.Какие типы поисковых систем вы знаете? В чем их принципиальное различие?
4.Как работает поисковая система?
5.Для чего нужен язык запросов?
6.Что такое расширенный поиск?
вернуться к оглавлению |
перейти к практическому занятию |
Лекция 14. Сервисы Интернет
В настоящее время в Интернете существует достаточно большое количество сервисов, обеспечивающих работу со всем спектром ресурсов. Наиболее известными среди них являются:
электронная почта (E-mail), обеспечивающая возможность обмена сообщениями одного человека с одним или несколькими абонентами;
100
телеконференции, или группы новостей (Usenet), обеспечивающие возможность коллективного обмена сообщениями;
сервис FTP – система файловых архивов, обеспечивающая хранение и пересылку файлов различных типов;
сервис Telnet, предназначенный для управления удаленными компьютерами в терминальном режиме;
World Wide Web (WWW, W3) – гипертекстовая (гипермедиа) система (Всемирная паутина), предназначенная для интеграции различных сетевых ресурсов в единое информационное пространство. Услуги WWW: организация хранилищ информации (фотоальбомов, закладок и прочее) на удаленных серверах, web-форумы, блоги, википроекты (в частности, Википедия), интернет-магазины, интернет-аукционы, социальные сети;
сервис DNS, или система доменных имен, обеспечивающий возможность использования для адресации узлов сети мнемонических имен вместо числовых адресов;
сервис IRC, предназначенный для поддержки текстового общения в реальном времени (chat).
Перечисленные выше сервисы относятся к стандартным. Это означает, что принципы построения клиентского и серверного программного обеспечения, а также протоколы взаимодействия сформулированы в виде международных стандартов. Следовательно, разработчики программного обеспечения при практической реализации обязаны выдерживать общие технические требования.
Наряду со стандартными сервисами, существуют и нестандартные, представляющие собой оригинальную разработку той или иной компании. В качестве примера можно привести различные системы типа Instant Messenger (своеобразные Интернетпейджеры – ICQ, AOl, Demos on-line и другие), системы Интернет-телефонии, трансляции радио и видео и т. д. Важной особенностью таких систем является отсутствие международных стандартов, что может привести к возникновению технических конфликтов с другими подобными сервисами.
14.1 Электронная почта
Электронная почта (e-mail) – это служба пересылки сообщений между зарегистрированными адресами, то есть система, позволяющая отправлять сообщения с одного компьютера на другой. Post Office Protocol (POP3) – по такому протоколу работает почтовый сервер, получающий электронные сообщения; по протоколу Simple Mail Transfer Protocol (SMTP), работает почтовый сервер, отправляющий электронные сообщения. Один компьютер может выполнять функции как сервера SMTP так и POP3. Для работы с электронной почтой служит программа MS Office Outlook операционной системы Windows Vista, в других версиях Windows – Outlook Express. Сообщения, посылаемые через Интернет, имеют вид текстовых файлов. Но в сообщения можно вложить другие файлы: графические изображения, звуковые файлы, программы, различные документы. Сообщения электронной почты мы отправляем конкретному лицу, указав его адрес электронной почты.