Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛекцииОСНИ.docx
Скачиваний:
20
Добавлен:
01.03.2025
Размер:
1.55 Mб
Скачать

5.6.3. Понятия эффективного поиска информации. Способы повышения эффективности поиска.

Для повышения эффективности информационного поиска задают его логику. С этой целью термины запроса связывают логическими операторами (связками) И, ИЛИ, НЕ (кроме). Различают следующие логические критерии соответствия:

  • критерий «логическая сумма», предполагающий выдачу тех документов, поисковый образ документа (ПОД) которых входит поисковый признак А, либо В, либо С и т.д. Запись поискового предписания имеет вид , где - знак логического сложения (оператор ИЛИ, оператор дизъюнкции);логическое сложение поисковых признаков реализуется критерием на полное совпадение;

  • критерий «логическое умножение», предполагающий выдачу тех элементов, в поисковые образы которых входят одновременно признаки А, В, С и т.д. Запись поискового предписания имеет вид , где  – знак логического умножения ( оператор И, оператор конъюнкции). Логическое умножение реализуется критериями «на включение» и «на пересечение»;

  • критерий «логическая разность», предполагающий выдачу тех документов, в поисковые образы которых входят признаки А, В. но не С. Символическое поисковое предписание записывается в виде , где  знак вычитания.

Возможен сложный критерий, объединяющий критерии «логическое сложение» и «логическое умножение», символическая запись которого имеет вид (А1А2n)(В1В2Вm)(12Вk), а также поиск с учетом заданных интервалов, предполагающий выдачу документов, в которых количественный признак А находится в определенных пределах. Поисковое предписание в этом случае записывается в виде – границы интервала. Последний критерий особенно важен при фактографическом поиске.

Р ис. 5.4. Типовая схема ИПС

Во всех названных случаях логические критерии определяют вид записи поискового предписания и задают формальную логику поиска сообщений в информационном массиве.

С позиции общения потребителя с ИПС поиск может осуществляться тремя способами: по одному запросу в соответствии с индивидуальным поисковым предписанием; параллельно по нескольким, предварительно накопленным запросам; с групповой обработкой нескольких предварительно накопленных и сгруппированных по критерию близости запросов. Схема поиска зависит от способа реализации ИПС и организации информационных массивов.

Эффективность информационного поискаопределяется показателями, характеризующими процесс нахождения релевантных документов, то есть семантическим показателями полноты и точности выдачи информации.

Под релевантностьюпонимают степень (меру) соответствия, найденного в процессе поиска документа сделанному запросу.

Полнота выдачи информации - это количественная характеристика информационного поиска, определяемая отношением между числом выданных на данный запрос релевантных документов (а) и общим количеством релевантных документов в информационном массиве

Точность выдачи - количественная характеристика информационного поиска, определяемая отношением между числом релевантных документов (а) и общим количеством всех документов, выдаваемых в ответ на запрос

Полнота и точность выдачи информации зависят от ряда факторов к ним относятся: тип поискового языка, методы индексирования документов и запросов, стратегия поиска, средства его реализации и режима, квалификация персонала и др.

Кроме семантических критериев эффективности поиска, используются такие показатели как оперативность, стоимость и трудоемкость поиска. Оперативность поиска - это среднее время ответа на запрос. Стоимость поиска - совокупность денежных и материальных затрат на информационный поиск одного документа. Трудоемкость поиска - затраты труда на поисковые операции при поиске одного документа. Эти критерии называют технико-экономическими.

Все рассмотренные критерии эффективности определяются разработчиками поисковой системы