Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sokr_Tema7.doc
Скачиваний:
24
Добавлен:
15.04.2019
Размер:
418.3 Кб
Скачать

Поиск информации в Интернет Поисковые инструменты

В Интернете рассредоточены огромные объемы информации, причем наряду с актуальной информацией соседствует много устаревших ресурсов, «мусора» и недобросовестной рекламы.

Находить информацию в Интернете, вероятно, было бы очень трудно, если бы не были созданы мощные поисковые инструменты: поисковые машины (поисковики), каталоги (рубрикаторы), метапоисковые системы и тематические списки ссылок, онлайновые энциклопедии и справочники.

Как показывает практика, для поиска разного рода информации наиболее эффективными оказываются различные инструменты (рис. 165).

Работа каждой системы поиска складывается из следующих основных функций: формирование информационной базы, получение запроса пользователя, обработка запроса пользователя, выдача результата пользователю.

Рассмотрим существующие виды поисковых систем, ключевых способов их организации и реализации в них механизма информационного поиска.

Индексирование и тематические каталоги

Онлайновые энциклопедические справочники

Поиск по теме с

анализом ее структуры

Неизвестно значение термина

Поиск в Сети

Поиск компании или проекта с простым именем

Поиск конкретного документа

Поисковые машины

Подбор доменного имени

Рис. 165. Для каждого типа информации следует выбирать свой инструмент поиска.

Глобальные информационно-поисковые системы

Информационно-поисковые системы (ИПС) появились на свет достаточно давно. Теории и практике построения таких систем посвящено множество статей, основная масса которых приходится на конец 70-х - начало 80-х годов прошлого столетия. Среди отечественных источников следует выделить научно-технический сборник "Научно-техническая информация. Серия 2", который выходит до сих пор. На русском языке издана так же и "библия" по разработке ИПС - "Динамические библиотечно-информационные системы" Ж. Солтона, в которой рассмотрены основные принципы построения информационно-поисковых систем и моделирования процессов их функционирования. Таким образом, нельзя сказать, что с появлением Internet и бурным вхождением его в практику информационного обеспечения появилось нечто принципиально новое, чего не было раньше. ИПС в Internet - это признание того, что ни иерархическая модель Gopher, ни гипертекстовая модель World Wide Web еще не решают проблему поиска информации в больших объемах разнородных документов. И на сегодняшний день нет другого способа быстрого поиска данных, кроме поиска по ключевым словам.

В ответ на запрос пользователь обычно получает длинный список документов, многие из которых не имеют никакого отношения к тому, о чем он спрашивал. Такие документы называются нерелевантными (от англ. relevant - подходящий, относящийся к делу). Таким образом, релевантный документ - это документ, содержащий искомую информацию. Очевидно, что от умения грамотно формировать запрос зависит процент получаемых релевантных документов. Доля релевантных документов в списке всех найденных поисковой машиной документов называется точностью поиска. Нерелевантные документы называют шумовыми. Если все найденные документы релевантные (шумовых нет), то точность поиска составляет 100%. Если найдены все релевантные документы, то полнота поиска - 100%. Таким образом, качество поиска определяется двумя взаимозависимыми параметрами: точностью и полнотой поиска. Увеличение полноты поиска снижает точность, и наоборот.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]