
- •Тема2 (Лекции)
- •9Глобальная сеть инернет
- •9.1Интернет - глобальное международное сетевое объединение
- •9.2Провайдер сети Internet
- •9.3Интернет – средство доставки данных
- •9.4Транспортные протоколы (контроль и управление передачей)
- •9.5Краткая история создания Интернет
- •10Основные принципы адресации в сети Интернет
- •10.1Доменная система именования компьютеров
- •10.2Система адресации ресурсов в сети - url
- •10.3Обзор сервисов Интернета
- •10.4Всемирная паутина (www):
- •10.5Гипертекст и Web-страницы
- •10.6Браузеры
- •10.7Язык гипертекстовой разметки (html)
- •10.8Механизм работы Web-сервера
- •10.9Кэширование Web-страниц
- •10.10Электронная почта
- •10.11Адрес электронной почты
- •10.12Почтовые клиенты
- •10.13Как работает почта
- •10.14Популярные почтовые клиенты
- •10.15Электронная почта с Web-интерфейсом
- •10.17Списки рассылки
- •10.18Сетевые новости
- •10.19Удаленный доступ (Telnet)
- •10.20Протокол пересылки файлов ftp
- •10.21Передача голоса по каналам Интернет
- •10.22Интерактивное телевидение
- •10.23Видеоконференции по каналам Интернет и isdn
- •10.24Whois – служба поиска пользователей в сети
- •10.25Вспомогательные программы для работы в Web
- •10.26Средства автономного просмотра Web-страниц
- •10.27Интернет-переводчики
- •10.28Собственная страничка в Интернете
- •11Поиск информации в Web
- •11.1Индексированные каталоги
- •11.2Тематические коллекции ссылок
- •11.3Подбор доменного имени
- •11.4Поисковые машины
- •11.4.1Как работает поисковая машина
- •11.4.2Построение индекса
- •11.4.3Поиск по индексу
- •11.5Как выбрать поисковую машину
- •11.5.1 Охват и глубина
- •11.5.2 Скорость обхода и актуальность ссылок
- •11.5.3Качество поиска
- •11.5.4Скорость поиска
- •11.5.5Поисковые возможности
- •11.5.6Дополнительные удобства
- •11.6Метапоисковые системы
- •11.7Онлайновые энциклопедии и справочники
- •11.8Степень достоверности содержания Web-документов
- •11.9Практические рекомендации по поиску
- •11.10Поисковая машина Yandex
- •11.11Яndex.Site - подробный список возможностей
- •11.12Простейшие запросы
- •11.12.1Естественно-языковый поиск
- •11.12.2Логические операторы
- •11.12.3Скобки
- •11.12.4Поиск по адресам (по url)
- •11.12.5Ранжирование результата поиска
- •11.12.6Поиск с расстоянием
- •11.13Синтаксис языка запросов (строгий поиск)
- •11.13.1Результаты поиска
- •11.13.2Каталог Яндекса
- •11.13.3Поиск в каталоге
- •11.14Задание Yandex
- •11.15Поисковая машина Rambler
- •11.16Язык поисковых запросов
- •11.16.1Регистр
- •11.16.2Операторы
- •11.16.3Кавычки
- •11.16.4Скобки
- •11.16.5Метасимволы
- •11.16.6Применение языка запросов
- •11.16.7Морфология
- •11.16.8Стоп-слова
- •11.16.9Ограничение расстояния
- •11.16.10Ненайденные слова
- •11.17Расширенный поиск
- •Тема2 (практика)
- •12Работа с браузером Internet Explorer
- •12.1Запуск Internet Explorer.
- •12.2Просмотр www-страниц.
- •12.3 Возврат к ранее просмотренным страницам.
- •12.4Сохранение www-страницы на жестком диске.
- •12.5Сохранение рисунков входящих в состав www страницы.
- •12.6Печать www – страниц.
11Поиск информации в Web
В Интернете размещены миллионы сайтов, причем с актуальной информацией соседствует много устаревших ресурсов, мусора и недобросовестной рекламы.
Интернет - это наиболее демократичный источник информации. Каждый может разместить в Сети собственный ресурс и высказать свое мнение. В этом одновременно сила и слабость Всемирной сети. Плюсы наличия столь демократической площадки очевидны.
Однако отсутствие единоначалия и единых требований по оформлению информации приводит к тому, что в Сети мало кто озабочен тем, чтобы избежать дублирования информации или следовать стандартам, принятым на сайте соседа. И здесь наблюдается резкий контраст с корпоративным документооборотом, описанным ранее.
Находить информацию в Интернете, вероятно, было бы очень трудно, если бы не были созданы мощные поисковые инструменты: поисковые машины (поисковики), каталоги (рубрикаторы), рейтинги, метапоисковые системы и тематические списки ссылок, онлайновые энциклопедии и справочники.
Как показывает практика, для поиска разного рода информации наиболее эффективными оказываются различные инструменты (рис. 27). Рассмотрим каждую категорию по отдельности.
Рис. 27 Для каждого типа информации следует выбирать свой инструмент поиска
11.1Индексированные каталоги
Каталог представляет собой данные, структурированные по темам в виде иерархических структур. Тематические разделы первого уровня определяют наиболее популярные, максимально широкие темы, такие как "спорт", "отдых", "наука", "магазины" и т.д. В каждом таком разделе есть подразделы. Таким образом, пользователь может уточнять интересующую его область, путешествуя по дереву каталога и постепенно сужая область поиска. Например, при поиске информации о ноутбуках цепочка поиска может выглядеть следующим образом:
Информационные технологии -> Компьютеры -> Ноутбуки.
Дойдя до нужного подкаталога, пользователь находит в нем набор ссылок.
Обычно в каталоге все ссылки являются профильными, поскольку составлением каталогов занимаются не программы, а люди. Очевидно, что если ведется поиск общей информации по некоторой широкой теме, то целесообразно обратиться к каталогу. Если же необходимо найти конкретный документ, то каталог окажется малоэффективным поисковым средством.
Существует огромное количество каталогов. Один из наиболее популярных каталогов в России находится по адресу http://list.mail.ru/.
Помимо каталогов общего профиля, в Сети достаточно много специализированных каталогов. Например, по адресу www.kinder.ru можно найти прекрасный каталог, посвященный детским ресурсам. В случае если внутри отдельной темы каталога находится огромное количество ресурсов, возникает проблема выбора. В некоторых каталогах имеется сортировка по популярности, например, в каталоге Яндекса сортировка идет по индексу цитирования - числу ссылок на сайт с других сайтов.
Помимо каталогов в Сети существуют рейтинги. Одним из наиболее популярных рейтингов является Rambler's Top 100. (http://top100.rambler.ru/top100/). На рис. 24 показан рейтинг ресурсов из раздела "авто и мото". Популярность ресурса оценивается по ряду параметров, в том числе так называемым хостам (количество уникальных посетителей в единицу времени) и хитам (количество заходов на сайт за в единицу времени).
Рис. 28Пример ранжирования ссылок в рейтинге Rambler Top 100
Каталоги составляются людьми - редакторами, просматривающими каждый новый сайт до его включения в индекс, или самими составителями описаний.
Каталоги обычно организованы в соответствии с предметной классификацией и содержат сведения о web-страницах (так называемый "видимый" Интернет). Отдельной разновидностью каталога являются рейтинги - счетчики посещений.
Таблица 3.
|
List.Ru |
Апорт |
Яндекс |
Rambler |
Yahoo! |
Общая характеристика |
19 разделов верхнего уровня, каталог ресрусов по реионам (подраздел рубрики Госудаство Российское) |
14 разделов верхнего уровня, каталог ресурсов по регионам (подраздел рубрики Страны и регионы) |
10 основных разделов, 7 комбинированных, дополнительная классификация по региону, источнику информации, целевой аудитории и сектору экономики. |
56 разделов (Рейтинг - одноуровневый каталог) |
14 основных разделов |
Сортировка ресурсов внутри раздела |
Алфавит, оценка гидов, популярность (посещаемость), дата |
Алфавит, хиты (посещаемость), лига (оценка гидов), индекс цитируемости (оценка числа ссылок на данный ресурс), оценка (мнение пользователей) |
Алфавит, дата добавления, индекс цитируемости (кол-во ссылок на данный ресурс с других ресурсов) |
по посещаемости |
по алфавиту |
Булевские операторы |
Используется язык поисковой машины Яndex |
Используется язык поисковой машины Апорт |
Используется язык поисковой машины Яndex |
Используется язык поисковой машины Rambler |
Нет |
Поиск по фразе |
" " |
||||
Префиксы |
+, - |
||||
Итеративный поиск (в результатах) |
Есть поиск внутри категории |
||||
замена части слова |
* |
||||
|
|
|
|
|
|