- •B.3.1. С чего начать поиск?
- •B.3.1.1. Специализированные каталоги ресурсов.
- •B.3.1.2. Поисковые системы.
- •B.3.1.3. Почтовые рассылки.
- •B.3.1.4. Rss-агрегаторы.
- •B.3.1.5. Специализированные сайты.
- •B.3.2. Сохранение найденных материалов.
- •B.3.2.1. Построение дерева каталогов для Вашей темы.
- •B.3.2.2. Использование древовидных баз данных.
- •B.3.2.3. Использование локальных поисковых систем.
B.3.1. С чего начать поиск?
B.3.1.1. Специализированные каталоги ресурсов.
B.3.1.2. Поисковые системы.
B.3.1.3. Почтовые рассылки.
B.3.1.4. RSS-агрегаторы.
B.3.1.5. Специализированные сайты.
B.3.2. Сохранение найденных материалов.
B.3.2.1. Построение дерева каталогов по Вашей теме.
B.3.2.2. Использование древовидных баз данных.
B.3.2.3. Использование локальных поисковых систем.
B.3.1. С чего начать поиск?
Итак, Вы сели за компьютер и решили начать поиск в Интернете. Сразу возникает искушение набрать в любимом браузере адрес одной из поисковых систем и... Подождите! Именно так делать не надо. Вначале необходимо:
Определиться с целями датамайнинга (смотри п. B.2.).
С помощью интеллект-карт (смотри раздел, посвященный креативному датамайнингу) уточнить область поиска и определиться с источниками информации.
Собрав эти сведения, приступить к собственно поиску.
Следует отметить, что датамайнинг в Интернете не заменяет, а дополняет оффлайновый датамайнинг. При наличии Интернета еще никто не отменял поиск литературы в журналах, энциклопедиях, в монографиях. Просто сместились акценты этого поиска.
Итак, поиск информации в Интернете можно разделить на:
Поиск ссылок на статьи и Веб-страницы.
Поиск ресурсов по данной теме.
(см. интеллект-карту N 1) на рисунке B.02.
При этом не нужно сразу начинать с поиска ссылок (см. Интеллект-карту "Угрозы поиску" на рисунке B.03.). Лучше вначале определиться с доступными для поиска ресурсами.
Рис. B.02.Интеллект-карта № 1. Поиск информации в Интернете.
Рис. B.03.Интеллект-карта № 2. Угрозы поиску.
Поиск ресурсов.
При поиске материала по теме начинать надо с оффлайновых энциклопедий и специализированной литературы (специализированных журналов, газет, рекламно-информационных изданий и т.п.) Если Вы совсем не разбираетесь в теме, по которой Вы собираете материал, то это – лучшее начало для поиска.
Далее советую углубить поиск, уже с использованием Интернет. Во-первых, Вы можете обратиться в онлайновые энциклопедии и библиотеки (список прилагается). Во-вторых, Вы можете читать онлайновые версии обычных журналов (периодики). В-третьих, Вы можете подписаться на почтовые рассылки по Вашей теме. Во всех этих онлайновых ресурсах Вы преследуете две цели:
Получить полезную информацию (основная цель);
Найти полезные для Вас ссылки на специализированные сайты (второстепенная цель).
При поиске ресурсов в Интернете необходимо использовать следующие программы:
Программы-браузеры Интернет.
Программы для захвата и каталогизации содержимого страниц.
Программы для захвата и каталогизации ссылок на ресурсы в сети.
Программы обеспечения безопасности при работе в сети (смотри ссылку на приложение № II здесь).
При поиске ресурсов Вы должны интенсивно работать с программами-каталогизаторами ссылок.
Не пренебрегайте при поиске ресурсов использовать почтовые рассылки, для чтения которых Вам, возможно, потребуется почтовый клиент.
Конечно же, информационная составляющая почтовых рассылок не велика. Но почтовые рассылки позволяют:
Получить необходимые ссылки не ресурсы, проверенные автором рассылки;
Получить представление о теме, по которой Вы осуществляете поиск;
Познакомиться (хотя бы заочно) с автором рассылки и получить обратную связь.
Вы можете получить рецензию на Ваши материалы у автора рассылки.
Уже одно это позволяет автору рекомендовать почтовые рассылки для использования в датамайнинге. Подписаться на почтовые рассылки можно, например, на сайте Subscribe.Ru.
Важно! При использовании почтовых рассылок Вам может поступать также несанкционированная рассылка ("спам"). Не стоит обижаться на это на автора рассылки – Ваш адрес, может быть, был украден хакерами. Для ликвидации вреда от спама используйте следующие советы:
Используйте в качестве "публичного" e-mail адреса адрес одного из бесплатных почтовых ящиков.
Никогда не открывайте подозрительные письма (письма с вложениями от незнакомых адресантов, с пропущенной или подозрительной темой).
Поставьте на свой компьютер антивирусный пакет и программу защиты от спама.