
- •1. Выбор наиболее значимых терминов для построения запроса
- •2.1. Частотные характеристики запроса (по полю “Ключевые слова”)
- •2.2. Частотные характеристики запроса (по полю “Реферат”)
- •2.3. Частотные характеристики запроса по убыванию значения относительной частоты встречаемости термина в рубрике
- •2.4. Частотные характеристики запроса по убыванию значения различительной силы термина
- •2.5. Частотные характеристики запроса по убыванию значения структурно-частотного показателя
2.5. Частотные характеристики запроса по убыванию значения структурно-частотного показателя
Таблица 2.5.1
Термин |
ω |
f кл.сл |
di |
Анализ данных |
2 |
1 |
2,1818 |
Кластеризация |
1 |
1 |
1,8808 |
Автоматическая классификация |
2 |
2 |
1,8808 |
Прогнозирование |
1 |
4 |
1,2788 |
Наукометрический анализ |
2 |
9 |
1,2276 |
Классификация |
1 |
6 |
1,1027 |
Кластерный анализ |
2 |
57 |
0,4260 |
Таблица 2.5.2
Термины |
a |
b |
c |
d |
p |
r |
σ |
ν |
η |
Анализ данных, Кластеризация, Автоматическая классификация, Прогнозирование, Наукометрический анализ, Классификация, Кластерный анализ |
60 |
1098 |
16 |
72519 |
0,0518 |
0,7895 |
0,9851 |
0,0157 |
0,7746 |
Анализ данных, Кластеризация, Автоматическая классификация, Прогнозирование, Наукометрический анализ, Классификация |
33 |
988 |
43 |
72629 |
0,0323 |
0,4342 |
0,9866 |
0,0139 |
0,4208 |
Анализ данных, Кластеризация, Автоматическая классификация, Прогнозирование, Наукометрический анализ |
13 |
783 |
63 |
72834 |
0,0163 |
0,1711 |
0,9894 |
0,0108 |
0,1604 |
Анализ данных, Кластеризация, Автоматическая классификация, Прогнозирование |
4 |
271 |
72 |
73346 |
0,0145 |
0,0526 |
0,9963 |
0,0037 |
0,0490 |
Анализ данных, Кластеризация, Автоматическая классификация |
2 |
69 |
74 |
73548 |
0,0282 |
0,0263 |
0,9991 |
0,0010 |
0,0254 |
Анализ данных, Кластеризация |
1 |
33 |
75 |
73584 |
0,0294 |
0,0132 |
0,9996 |
0,0005 |
0,0127 |
Анализ данных |
1 |
21 |
75 |
73596 |
0,0455 |
0,0132 |
0,9997 |
0,0003 |
0,0129 |
Рис. 2.9
Рис. 2.10
Заключение
В работе проводилось изучение эффективности информационно-поискового аппарата АИПС путем построения экспериментальных рабочих характеристик как для случая использования нормализованной лексики (ключевых слов), так и свободной (текстов рефератов) на примере БД "Информатика" в среде АИПС ИРБИС.
Выбранная рубрика: «Кластерный анализ», ВИНИТИ: 201.01.07.06.07
Термины упорядочивались по смысловой значимости для полей «ключевые слова» и «реферат», а также по значениям относительной частоты встречаемости термина в рубрике, различительной силы термина и структурно-частотного показателя для поля «ключевые слова».
По полученным значениям были построены графики зависимости точности от полноты <p,r> и специфичности от полноты <σ,r> для каждого случая упорядочивания.
Построенные графики показывают траекторию изменения показателей эффективности при построении серии запросов по каждому из критериев отбора слов. Из этих графиков видно, что эффективным является поиск по запросу, составленному по признаку значения относительной частоты встречаемости терминов в рубрике, так как в этих случаях значение полезной работы ближе к единице (рис. 2.6).