Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Интеллект.систем / Лекция 7_2011_М.ppt
Скачиваний:
62
Добавлен:
12.03.2015
Размер:
150.02 Кб
Скачать

Министерство образования Российской Федерации Казанский государственный технический университет им. А.Н.Туполева

Кафедра АСОИУ

Интеллектуальные информационные системы

Лекция 7

Системы обработки естественного языка. Информационно-поисковые системы

2011

ОЦЕНКА ПРОЦЕДУР ИНФОРМАЦИОННОГО ПОИСКА

{di} множество документов информационного хранилища D

r(di, dj) - оценка смысловой близости двух документов di и dj d0 - некоторый воображаемый (виртуальный) документ

определенного содержания.

Задача информационного поиска:

В информационном хранилище требуется отыскать:

некоторый документ di

такой, что

 

 

 

r(di, d0)=0

 

или множество

документов D0 = {di},

что

 

 

r(di, d0)

 

min

для всех di из

множества D0 .

Оценка результатов информационного поиска

Информационная полнота - все ли нужные документы найдены. Информационный шум - отобраны и ненужные с точки зрения

информационного запроса документы.

Dp - множество документов, полученных в

результате выполнения поисковых процедур. kп - коэффициент полноты

kш, - коэффициент шума

Возможные варианты результатов поиска:

1. Dр = D0, т.е. найдены все адекватные смыслу запроса

 

 

документы.

 

 

 

 

kп = 1,

kш = 0.

2. Dр D0

Информационный поиск является неполным:

 

 

 

0 <= kп<1,

kш = 0.

3.

D0 Dр,

В результате поиска отобраны лишние

 

 

документы (информационный шум):

 

 

 

kп = 1,

0<= kш <1.

4.

Пересечение Dp

и D0 не пустое, при Dp != 0 и D0 != 0,

 

 

 

0 <= kп <1,

0<= kш <1.

5.

Пересечение Dp

и D0 пустое, при Dp != 0 и D0 != 0,

 

 

 

kп = 0,

kш = 1.

Оценка эффективности информационного поиска

Вычисление kп и kш

Оценка эффективности информационного поиска

Вычисление kп и kш

Интегральная оценка эффективности поиска

Оценка эффективности информационного поиска

Вычисление kп и kш

Интегральная оценка эффективности поиска

• Коэффициент точности K = 1 - kш

Факторы, влияющие на процессы обработки информации

Огромный объем доступной информации

Взаимосвязи

Высокий процент временной информации

Неконтролируемое качество информации

Разнотипность информации

Избыточность

Разнородность пользователей

Фактографические ИПС (ФИПС)

Характерные отличия::

- высокая однородность сообщений, - фиксированный порядок следования признаков объектов

Способы поиска:

- поиск по совпадению значений для одного или нескольких признаков;

-поиск по интервалу:

-поиск, по выражению, когда используется некий

логический критерий

kп max = 1 при kш = 0

Документальные (библиографические) ИПС

Характерные отличия:

- хранение и поиск текстовых документов.

Методы поиска:

Поиск по метаданным.

Поиск на основе морфологического разбора.

Поиск на основе оценок релевантности документа запросу.

Поиск с использованием языков запросов.

Поиск на основе семантического анализа.

kп max= 0.5 при kш max = 1

Соседние файлы в папке Интеллект.систем