Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
вопросы, Хорольская.doc
Скачиваний:
36
Добавлен:
24.11.2019
Размер:
568.32 Кб
Скачать
  1. Информационный поиск (тематический)

Данный вид поиска целесообразно проводить перед началом разработки какого-либо решения для того, чтобы заранее избежать копирования уже известных решений, учесть все их достоинства и недостатки.

Предметом тематического поиска является интересующая Вас техническая проблема или тема, например, Вашей научно-исследовательской работы. В этом случае поиск представляет собой подбор документов, относящихся к сформулированной в запросе или заказе технической проблеме или теме.

Область тематического поиска представляет собой все релевантные предмету поиска области науки и техники (т.е. имеющие наиболее близкое к нему отношение).

Объем тематического поиска входят опубликованные патентные документы ведущих стран мира (Великобритания, Германия, Россия, СССР, США, Франция, Швейцария, Южная Корея, Япония), международных организаций (ВОИС, ЕПО, ЕАПО) и общедоступные непатентные источники (печатные издания, материалы диссертаций, сведения о выставках и т.п.).

  1. Информационный поиск и его виды

Поиск информации представляет собой процесс выявления в некотором множестве документов (текстов) всех тех, которые посвящены указанной теме (предмету), удовлетворяют заранее определенному условию поиска (запросу) или содержат необходимые (соответствующие информационной потребности) факты, сведения, данные.

Процесс поиска включает последовательность операций, направленных на сбор, обработку и предоставление информации.

В общем случае поиск информации состоит из четырех этапов:

  • определение (уточнение) информационной потребности и формулировка информационного запроса;

  • определение совокупности возможных держателей информационных массивов (источников);

  • извлечение информации из выявленных информационных массивов;

  • ознакомление с полученной информацией и оценка результатов поиска.

Виды поиска

Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.

Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).

Поиск изображений — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы: Polar Rose, Picollator и др.

  1. Информационный поиск: опыт определения понятия, цели и границы. Логическое, эмпирическое и эвристическое в поиске. Критерии оценки поиска

Центральная задача ИП — помочь пользователю удовлетворить его информационную потребность. Так как описать информационные потребности пользователя технически непросто, они формулируются как некоторый запрос, представляющий из себя набор ключевых слов, характеризующий то, что ищет пользователь.

Классическая задача ИП, с которой началось развитие этой области, — это поиск документов, удовлетворяющих запросу, в рамках некоторой статической коллекции документов. Но список задач ИП постоянно расширяется и теперь включает:

  • Вопросы моделирования;

  • Классификация документов;

  • Фильтрация документов;

  • Кластеризация документов;

  • Проектирование архитектур поисковых систем и пользовательских интерфейсов

  • Извлечение информации, в частности аннотирования и реферирования документов;

  • Языки запросов и др.

Релева́нтность (англ. relevant) — применительно к результатам работы поисковой системы и экспертной системы — степень соответствия запроса и найденного, то есть уместность результата. В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи.

Пертине́нтность (англ. pertinent) — cоотношение объёма полезной информации к общему объёму полученной информации. Коротко — это пользосоответствие может быть выражено в виде процента наподобие КПД (коэффициент полезного действия).

Пертине́нтность (англ. pertinent) — соответствие найденных информационно-поисковой системой документов информационным потребностям пользователя

Прежде чем начинается процедура поиска информации, возникает информационная потребность, которая представляет собой разновидность нематериальной потребности, потребность в информации, необходимой для решения конкретной задачи или   достижения некоей цели

Основная задача информационного поиска – помочь пользователю найти ту информацию, в которой он заинтересован. Из имеющегося множества информации требуется отобрать подмножество, соответствующее информационной потребности пользователя, обычно выражаемой неким набором ключевых слов.