Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
С чего начать поиск.doc
Скачиваний:
10
Добавлен:
13.08.2013
Размер:
149.5 Кб
Скачать

B.3.1.1. Специализированные каталоги ресурсов.

Как правило, человек, занимающийся датамайнингом длительное время, начинает поиск ссылок не с поисковых систем, а со специализированных каталогов ресурсов. Найти их в Интернете не так уж и сложно. Наиболее знаковые из этих ресурсов можно найти на сайтах, указанных на этой странице.издесь. Автор приводит лишь следующие примеры:

  • Онлайновая библиотека Wikipedia. Содержит множество статей, которые пишут и редактируют сами посетители этой библиотеки. Присутствуют статьи практически на всех языках, в т.ч. и русском (сайт http://www.wikipedia.org/).

  • Справочник "Желтые страницы Интернет" (на русском языке). Содержит в себе проверяемый авторами и все время пополняющийся новыми ссылками каталог ресурсов русского Интернета (Рунета). (Сайт http://yp.piter.com/).

  • Проект Россия-Он-Лайн: Реферат.Ру. Здесь собрана большая, все время пополняющаяся коллекция рефератов, шпаргалок и курсовых работ по разным тематикам на русском языке. (Сайт http://www.referat.ru/).

Большой каталог тематических ресурсов в Интернет печатается в журнале "ПК-Просто", "PC Magazine/RE" и других.

B.3.1.2. Поисковые системы.

Следующее место, куда следует обратиться в процессе поиска информации – это поисковые системы. В настоящее время поисковые системы – это порталы, где, помимо поиска, располагаются каталоги ресурсов, платежные системы, услуги предоставления бесплатного почтового ящика, бесплатного хостинга или размещения блогов (сетевых журналов). Наиболее популярные поисковые системы приведены на интеллект-карте "Search Systems" ("Поисковые системы"), а предоставляемые ими услуги – на интеллект-карте "Порталы Рунета".

Каталоги поисковых систем могут быть использованы для поиска ссылок специализированных сайтов, когда предметная область поиска "локализована".

Рис. B.04.Интеллект-карта "Поисковые системы"

Рис. B.05.Интеллект-карта "Порталы Рунета".

Ознакомиться с этими порталами и узнать их Интернет-адреса можно в приложении № IV здесь.

Следует отметить, что во многом поиску в Интернет помогают метапоисковые системы, такие, как Web Ferret и другие. Принцип их действия показан на интеллект-карте "Meta search system" (смотри рисунок B.06.). Метапоисковая система – это клиентская программа, которые ищет ссылки на специализированные сайты, но не из своей базы или индекса. Она использует индексные базы данных и каталоги других поисковых систем, то есть как бы "паразитирует" на них. Однако, вследствие того, что поиск ведется сразу по нескольким поисковым системам, отдача (количество найденных ссылок) у метапоисковых систем будет больше, чем у обычных поисковых машин.

Рис. B.06.Принцип работы метапоисковых систем.

B.3.1.3. Почтовые рассылки.

Как уже отмечалось в п. B.3.1, подзаголовок«Поиск ресурсов», необходимым средством для датамайнинга являются почтовые рассылки. Подписаться на почтовые рассылки можно, например, насайте "Subscribe.Ru" (адрес сайта http://www.subscribe.ru/). На этом сайте находится множество разделов, в которых можно выбрать рассылку на любой вкус. При регистрации на этом сайте Вы сразу же становитесь подписчиком рассылки: "Новости Subscribe.Ru", в которой дается анонс новых рассылок, дискуссионных листов и новостей сайта.

Свои подписки имеют многие известные порталы. Например, обзоры книг, информацию о компьютерных курсах, новых поступлениях в онлайновую библиотеку можно узнать из подписки на сайте Цит Форум (адрес сайта "http://www.citforum.ru/"). Во многом подписка на этих сайтах заменяет в использовании новых программ: RSS-агрегаторов.