- •Базовый уровень
- •§ 20. Дискретные модели данных в компьютере. Представление
- •Содержание и структура информатики
- •Глава 1
- •Вопросы и задания
- •Вопросы и задания
- •Глава 2
- •Вопросы и задания
- •Вопросы и задания
- •Задания
- •Вопросы и задания
- •Система основных понятий
- •§ 15. Пример структуры данных — модели предметной области
- •Объект моделирования —
- •Учебный алгоритмический язык Трассировка алгоритма —
- •Глава 4
- •Внешнее запоминающее устройство
- •Устройство вывода Оперативное запоминающее устройство
- •Перецетрыстретщи..
- •Ifd Сообщение (как вложение)..
- •Вопросы и задания
- •Вопросы и задания
- •Вопросы и задания
- •Глава 5
- •Вопросы и задания
- •Вопросы и задания
- •Система основных понятий
- •Система основных понятий
- •Вопросы и задания
- •Структурными составляющими таблицы являются записи и поля.
- •Предметная область —
- •Реляционная
- •Запись —
- •Вопросы и задания
- •§ 34. Запросы как приложения информационной системы
- •Вопросы и задания
- •Система основных понятий
- •Глава 6
- •Вопросы и задания
- •Вопросы и задания
- •Вопросы и задания
- •Глава 7
- •Вопросы и задания
- •§ 42. Правовое регулирование в информационной сфере
- •Вопросы и задания
- •Вопросы и задания
- •125167, Москва, проезд Аэропорта, д. 3
Система основных понятий
Интернет — глобальная информационная система |
|||||
Службы Интернета построены по технологии «клиент-сервер» |
|||||
Коммуникационные службы |
Информационные службы |
||||
Электронная почта — e-mail |
Телеконференции |
Форумы прямого общения — Chat |
Интернет-телефония |
Передача файлов |
WWW-Всемирная паутина |
Протоколы РОРЗ, SMTP Почтовый сервер, почтовый клиент |
Протокол FTP |
Протокол HTTP |
|||
Вопросы и задания *
Объясните различие между коммуникационными и информационными службами Сети.
Объясните различие между понятиями «базовый протокол Интернета» и «прикладные протоколы».
Почему сервер и клиент электронной почты используют разные протоколы?
Чем отличается chat-конференция от телеконференции?
В чем преимущество Интернет-телефонии по сравнению с традиционной телефонной связью?
Для каких целей используется FTP-служба?
Какое значение для развития Интернета имело появление службы WWW?
World Wide Web — Всемирная паутина
Рассмотрим более подробно, что же такое World Wide Web (WWW). Обычно это словосочетание переводят как Всемирная паутина. Каждый может представить себе паутину — сеть, которую плетет паук.
В рассматриваемом контексте исторически термин «сеть» закрепился за понятием «система взаимосвязанных компьютеров» (т. е. техническая система), а термин «паутина» (Web) — за понятием «система взаимосвязанных документов» (т. е. структура данных).
Разумеется, «паутина» документов существует на базе компьютерной сети.
Всемирная паутина (World Wide Web, WWW) — это система (сеть) документов, связанных между собой гиперссылками.
Каждый отдельный документ, имеющий собственный адрес, называется Web-страницей.
Каждая Web-страница может иметь множество связей с другими страницами, которые хранятся как на том же самом компьютере, так и на других компьютерах сети. На рис. 5.11 схематически показано «наложение» паутины документов на компьютерную сеть. Сплошными линиями обозначены Web-серверы и связи между ними, пунктирными — Web-документы и их связи.
Web-сервер — это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся Web-страницы. В доменном имени Web-сервера младший домен обычно обозначается как www.
Например:
www .psu.ru — Web-сервер узла Интернета Пермского государственного университета.
www. 1 September . ru — Web-сервер газеты «Первоесентября».
Web-страница (документ) может содержать самую разную информацию: текст, рисунок, звукозапись. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html.
Гиперссылка — это некоторое ключевое слово или объект в доку- менте, С которым связан указатель Рис. 5.11. Компьютерная Сеть для перехода на другую страницу в и «паутина» документов «паутине». Обычно изображение
гиперссылки каким-то образом выделяется на странице, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указывающим пальцем. Если при этом щелкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом.
Протокол, который используется службой WWW, называется HTTP (HiperText Transfer Protocol — протокол передачи гипертекста). Его основное назначение — обработка гиперссылок, поиск и передача документов клиенту.
Web-сайт — это совокупность взаимосвязанных (обычно тематически) страниц. Сайт принадлежит некоторому лицу или учреждению. Web-сайт организуется на Web-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являющуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные разделы сайта. Пример главной страницы Web-узла ПГУ приведен на рис. 5.12.
URL-адрес. Уже рассказывалось о системе адресации в компьютерном пространстве Сети. Это IP-адреса, доменные адреса. В пространстве информационных ресурсов Интернета используется своя система адресации. Она называется URL (Uniformed Resource Locator) — универсальный указатель ресурсов. Каждая Web-страница или файл имеют свой уникальный URL-адрес, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь) на сервере. Например, URL-адрес главной страницы Web-сайта газеты «Первое сентября» выглядит так:
http://www.1 September.ru/ru/first.htm
Здесь http: / / — протокол доступа;
www. 1 September. ru — имя сервера; /ru/first. htm — полное имя файла.
Следует
заметить, что имя составлено по правилам
операционной системы Unix,
под
управлением которой работают серверы
Интернета. В отличие от Windows,
вместо
символа «\» (обратный слэш) здесь
используется символ «/» (прямой
слэш). Кроме того, строчные и прописные
буквы не являются взаимозаменяемыми.
Web-браузер — клиент-программа WWW. Слово «browser» можно перевести как «обозреватель». Наиболее распространенными программами этого типа являются Netscape Navigator компании Netscape Communications и Internet Explorer компании Microsoft.
Система основных понятий
World Wide Web
Структурные составляющие
Web-страница
Web-сайт (узел )
HTML-файл
URL-адрес
Владелец сайта
Главная страница
Технология «клиент-сервер» реализуется через Web-сервер, Web-клиент, протокол HTTP
Web-браузер — клиент-программа WWW
1
Вопросы и задания *
1. Каково смысловое различие терминов «сеть» и «паутина» в контексте систе- мы компьютерных коммуникаций?
Что является наименьшей адресуемой единицей информации в WWW?
Сопоставьте структуру полного имени файла (адреса файла) на автономном компьютере и URL-адрес в сети. Отметьте сходство и различие.
Представьте себе, что вы проектируете сайт своей школы. Какую информацию вы бы поместили на главной странице?
Средства поиска
данных
в Интернете
Как уже говорилось выше, WWW — это система Web-страниц, связанных между собой гиперссылками. Однако эти связи не имеют регулярности, как, например, в иерархической структуре данных. В этом смысле можно говорить о том, что система Web-страниц не структурирована.
Единственной координатой Web-документа является его URL-адрес. Однако URL-адрес никак не связан с содержанием документа. Но поиск данных производится именно по содержанию. Как же он осуществляется?
В поиске информации в WWW пользователю помогает поисковая служба Интернета. Поисковая служба основана на услугах поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели.
Поисковые каталоги. Если вам приходилось пользоваться услугами больших библиотек, то вы знаете, что такое библиотечный каталог. Существуют алфавитные каталоги и предметные каталоги. В алфавитных каталогах карточки с библиографическими данными книг разложены в алфавитном порядке фамилий авторов. В предметных каталогах карточки систематизированы по содержанию книг.
Систематизация в предметном каталоге производится по иерархическому принципу: на первом уровне иерархии весь книжный фонд делится на крупные разделы: художественная литература, учебная литература, общественно-политическая литература, научно-техническя литература и т. п. Каждый из этих разделов делится на подразделы; например, учебная литература делится на разделы высшего образования, среднего образования, дошкольного образования. Книги для среднего образования могут делиться по предметам, которые, в свою очередь, делятся по классам. Чтобы подобрать литературу по нужной теме, читатель должен понимать принцип организации каталога.
Поисковые каталоги WWW организованы по аналогичному иерархическому принципу. Только в них систематизируется информация не о книгах, а о документах, хранящихся в World Wide Web. -*На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например: финансы и экономика, государство и право, наука и образование, компьютеры, политика и т. д. Каждое имя в этом списке является внутренней гиперссылкой, т. е. ссылкой на внутренний документ сайта, поискового каталога. Щелчок мышью на гиперссылке вызывает на экран список заголовков следующего подраздела и т. д. Очевидно, что такая система подобна дереву файловой системы ОС. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые Web-документы.
Поисковые каталоги заполняются вручную специалистами, поддерживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме. Таким образом, поисковые каталоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов.
Примерами поисковых каталогов являются:
зарубежные: российские:
Yahoo! — www.yahoo.com Атрус — www.atrus.ru
The Virtual Library — www.w3.org Ay! — www.au.ru
Magellan — www.mckinley. com List-Ru — www. list. ru WebCrawler — www.webcrawler.com
Поисковые указатели. Другое название этого вида поисковой службы — поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели (о них было сказано выше). Например, найдите в предметном указателе этого учебника по информатике словосочетание «информационная система». Затем на страницах, номера которых указаны после этого словосочетания, вы можете прочитать все, что написано про информационные системы.
Принцип работы поисковых указателей заключается в создании и использовании индексных списков — аналогов книжных предметных указателей.
Задачи поисковых машин состоят в формировании индексных списков, так чтобы охватить ими как можно большее число документов «паутины» , а также в ответах на запросы клиентов. Ясно, что таким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически.
Основной составляющей поисковых машин являются программы просмотра Web-документов, которые называют по-разному: роботами, червяками, пауками и пр. Наверное, наиболее подходящим является название «пауки», если уж сеть WWW называть «паутиной»! Непрерывно, днем и ночью, они сканируют все информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержание паутины все время меняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина все время должна поддерживать информацию в актуальном состоянии.
Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы являются интеллектуальной собственностью их авторов и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попадает «мусора» — случайных документов, не имеющих отношения к теме поиска.
В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенных по убыванию рейтинга. Рейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные документы попадают в начало списка.
Число поисковых указателей превышает число поисковых каталогов. Популярными указателями являются:
зарубежные^ российские:
AltaVista — www. altavista. com Апорт 2000 — www.aport. ru
Inktomi — www.inktomi.com Рамблер— www.rambler.ru
Hot Bot — www. hotbot. com flndex — www. yandex. ru
Lycos — www. lycos . com
Fast Search — www.alltheweb.com
Northern Light — www.northernlight. com
