Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Отчёт по первой лабе Максимова_20130114.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
440.32 Кб
Скачать

2.5. Частотные характеристики запроса по убыванию значения структурно-частотного показателя

Таблица 2.5.1

Термин

ω

f кл.сл

di

Анализ данных

2

1

2,1818

Кластеризация

1

1

1,8808

Автоматическая классификация

2

2

1,8808

Прогнозирование

1

4

1,2788

Наукометрический анализ

2

9

1,2276

Классификация

1

6

1,1027

Кластерный анализ

2

57

0,4260

Таблица 2.5.2

Термины

a

b

c

d

p

r

σ

ν

η

Анализ данных, Кластеризация, Автоматическая классификация, Прогнозирование, Наукометрический анализ, Классификация, Кластерный анализ

60

1098

16

72519

0,0518

0,7895

0,9851

0,0157

0,7746

Анализ данных, Кластеризация, Автоматическая классификация, Прогнозирование, Наукометрический анализ, Классификация

33

988

43

72629

0,0323

0,4342

0,9866

0,0139

0,4208

Анализ данных, Кластеризация, Автоматическая классификация, Прогнозирование, Наукометрический анализ

13

783

63

72834

0,0163

0,1711

0,9894

0,0108

0,1604

Анализ данных, Кластеризация, Автоматическая классификация, Прогнозирование

4

271

72

73346

0,0145

0,0526

0,9963

0,0037

0,0490

Анализ данных, Кластеризация, Автоматическая классификация

2

69

74

73548

0,0282

0,0263

0,9991

0,0010

0,0254

Анализ данных, Кластеризация

1

33

75

73584

0,0294

0,0132

0,9996

0,0005

0,0127

Анализ данных

1

21

75

73596

0,0455

0,0132

0,9997

0,0003

0,0129

Рис. 2.9

Рис. 2.10

Заключение

В работе проводилось изучение эффективности информационно-поискового аппарата АИПС путем построения экспериментальных рабочих характеристик как для случая использования нормализованной лексики (ключевых слов), так и свободной (текстов рефератов) на примере БД "Информатика" в среде АИПС ИРБИС.

Выбранная рубрика: «Кластерный анализ», ВИНИТИ: 201.01.07.06.07

Термины упорядочивались по смысловой значимости для полей «ключевые слова» и «реферат», а также по значениям относительной частоты встречаемости термина в рубрике, различительной силы термина и структурно-частотного показателя для поля «ключевые слова».

По полученным значениям были построены графики зависимости точности от полноты <p,r> и специфичности от полноты <σ,r> для каждого случая упорядочивания.

Построенные графики показывают траекторию изменения показателей эффективности при построении серии запросов по каждому из критериев отбора слов. Из этих графиков видно, что эффективным является поиск по запросу, составленному по признаку значения относительной частоты встречаемости терминов в рубрике, так как в этих случаях значение полезной работы ближе к единице (рис. 2.6).