
- •1. Выбор наиболее значимых терминов для построения запроса
- •2.1. Частотные характеристики запроса (по полю “Ключевые слова”)
- •2.2. Частотные характеристики запроса (по полю “Реферат”)
- •2.3. Частотные характеристики запроса по убыванию значения относительной частоты встречаемости термина в рубрике
- •2.4. Частотные характеристики запроса по убыванию значения различительной силы термина
- •2.5. Частотные характеристики запроса по убыванию значения структурно-частотного показателя
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЯДЕРНЫЙ УНИВЕРСИТЕТ «МИФИ»
_____________________________________________________________
Факультет кибернетики и информационной безопасности
Кафедра информационных технологий в социальных системах
Отчёт по лабораторной работе
«ПОСТРОЕНИЕ РАБОЧИХ ХАРАКТЕРИСТИК АИПС
НА ПРИМЕРЕ БД «ИНФОРМАТИКА»
по курсу “Автоматизированные информационные системы”
Работу выполнил
студент группы К7-681
Сыроежкин Герман
Проверил
Максимов Н.В.
Москва, 2012
Цель работы: Изучение эффективности информационно-поискового аппарата АИПС путем построения экспериментальных рабочих характеристик как для случая использования нормализованной лексики (ключевых слов) так и свободной (текстов рефератов) на примере БД "Информатика" в среде WinIRBIS.
Расчетные формулы:
Значение структурно-частотного показателя определяется по следующей формуле:
; где
N – общее число документов в массиве,
wi – число слов в дескрипторе,
fi – частота дескриптора.
Полнота:
;
Точность:
Специфичность:
Относительный
объем выдачи:
Полезная работа:
1. Выбор наиболее значимых терминов для построения запроса
Рубрика: Кластерный анализ, ВИНИТИ: 201.01.07.06.07
Множество релевантных документов Lи=76
Таблица 1
Термин |
частота термина |
|
по полю ключевых слов |
по полю реферат |
|
Кластерный анализ |
57 |
3 |
Наукометрический анализ |
9 |
2 |
Классификация |
6 |
14 |
Автоматическая классификация |
2 |
1 |
Прогнозирование |
4 |
7 |
Анализ данных |
1 |
2 |
Кластеризация |
1 |
22 |
2.1. Частотные характеристики запроса (по полю “Ключевые слова”)
Таблица 2.1
Термины |
a |
b |
c |
d |
p |
r |
σ |
ν |
η |
Кластерный анализ, наукометрический анализ, классификация, прогнозирование, автоматическая классификация, кластеризация, анализ данных |
61 |
1098 |
15 |
72519 |
0,0526 |
0,8026 |
0,9851 |
0,0157 |
0,7877 |
Кластерный анализ, наукометрический анализ, классификация, прогнозирование, автоматическая классификация, кластеризация |
61 |
1077 |
15 |
72540 |
0,0536 |
0,8026 |
0,9854 |
0,0154 |
0,7880 |
Кластерный анализ, наукометрический анализ, классификация, прогнозирование, автоматическая классификация |
60 |
1066 |
16 |
72551 |
0,0533 |
0,7895 |
0,9855 |
0,0153 |
0,7750 |
Кластерный анализ, наукометрический анализ, классификация, прогнозирование |
60 |
1029 |
16 |
72588 |
0,0551 |
0,7895 |
0,9860 |
0,0148 |
0,7755 |
Кластерный анализ, наукометрический анализ, классификация |
59 |
838 |
17 |
72779 |
0,0658 |
0,7763 |
0,9886 |
0,0122 |
0,7649 |
Кластерный анализ, наукометрический анализ |
57 |
580 |
19 |
73037 |
0,0895 |
0,7500 |
0,9921 |
0,0086 |
0,7421 |
Кластерный анализ |
57 |
70 |
19 |
73547 |
0,4488 |
0,7500 |
0,9990 |
0,0017 |
0,7490 |
Рис. 2.1
Рис. 2.2
2.2. Частотные характеристики запроса (по полю “Реферат”)
Таблица 2.2
Термины |
a |
b |
c |
d |
p |
r |
σ |
ν |
η |
Кластерный анализ, наукометрический анализ, классификация, прогнозирование, автоматическая классификация, кластеризация, анализ данных |
11 |
2476 |
65 |
71141 |
0,0044 |
0,1447 |
0,9664 |
0,0337 |
0,1111 |
Кластерный анализ, наукометрический анализ, классификация, прогнозирование, автоматическая классификация, кластеризация |
21 |
2398 |
55 |
71219 |
0,0087 |
0,2763 |
0,9674 |
0,0328 |
0,2437 |
Кластерный анализ, наукометрический анализ, классификация, прогнозирование, автоматическая классификация |
18 |
2374 |
58 |
71243 |
0,0075 |
0,2368 |
0,9678 |
0,0325 |
0,2046 |
Кластерный анализ, наукометрический анализ, классификация, прогнозирование |
18 |
2373 |
58 |
71244 |
0,0075 |
0,2368 |
0,9678 |
0,0324 |
0,2046 |
Кластерный анализ, наукометрический анализ, классификация |
17 |
2243 |
59 |
71374 |
0,0075 |
0,2237 |
0,9695 |
0,0307 |
0,1932 |
Кластерный анализ, наукометрический анализ |
5 |
59 |
71 |
73558 |
0,0781 |
0,0658 |
0,9992 |
0,0009 |
0,0650 |
Кластерный анализ |
3 |
21 |
73 |
73596 |
0,1250 |
0,0395 |
0,9997 |
0,0003 |
0,0392 |
Рис. 2.3
Рис. 2.4