- •Теория информационных процессов и систем
- •Санкт-Петербург
- •СПбГиэу, 2008 Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Список литературы
- •Приложение 1 Содержание дисциплины
- •Приложение 2 Пример оформления титульного листа лабораторной работы
Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
Задание:
Кинопленка n видов была представлена k экспертам для определения лучшей из них. Каждому эксперту предложили упорядочить пленки по степени предпочтения. Баллы (ранги), поставленные экспертами, приведены в таблице (задать самостоятельно). Наибольший балл соответствует пленке самого лучшего качества.
Эксперты |
Вид пленки |
|||
1 |
2 |
… |
|
|
1 |
|
|
|
|
2 |
|
|
|
|
… |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Например:
Эксперты |
Вид пленки |
|||
1 |
2 |
3 |
4 |
|
1 |
2 |
1 |
3 |
4 |
2 |
2 |
1 |
4 |
3 |
3 |
2 |
1 |
4 |
3 |
|
6 |
3 |
11 |
10 |
Требуется определить, различаются ли виды пленок и согласованы ли оценки экспертов (вычислить статистику Фридмана F и коэффициент конкордации W по данным задачи).
Выполнение работы:
Для выполнения лабораторной работы подготовьте исходные данные для проведения интеллектуального анализа в системе STATISTICA (рис. 4.51).
Рис. 4.51. Исходная выборка данных
В стартовой панели модуля Nonparametric Statistics (Непараметрические статистики) (рис. 4.52) выбираем Friedman ANOVA and Kendall’s concordance (Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла) и нажимаем OK.
Рис. 4.52. Стартовая панель модуля Nonparametric Statistics (Непараметрические статистики)
В появившемся окне (рис. 4.53) нажимаем Variables и задаем переменные (рис. 4.54). Нажимаем OK (рис. 4.55).
Рис. 4.53. Окно Friedman ANOVA by Ranks
(Двухфакторный анализ Фридмана)
В появившемся окне Friedman ANOVA by Ranks (Двухфакторный анализ Фридмана) нажимаем OK и получаем следующую таблицу результатов (рис. 4.56).
Рис. 4.54. Окно выбора переменных
Рис. 4.55. Окно Friedman ANOVA by Ranks
(Двухфакторный анализ Фридмана)
Рис. 4.56. Таблица результатов анализа
Гипотеза H0: между столбцами нет различия – проверяется с помощью статистики Фридмана F. Гипотеза H0 отклоняется на уровне значимости , если .
Значение выборочной статистики в данном случае: Fв = 8.41, а при = 0.05 . Следовательно, гипотеза H0 отклоняется: следует считать, что виды пленок, по мнению экспертов, различны.
Мерой согласия различных ранжировок n объектов является коэффициент конкордации (согласия) Кендалла W.
В данном случае W = 0.91. Большое значение W свидетельствует о согласованности оценок экспертов.
Задача 9. Q-критерий Кокрена.
Задание:
Во время презентации k видов мороженого n покупателям было предложено попробовать все сорта мороженого и высказать свое отношение к каждому сорту в следующем виде: 0 – нравится, 1 – не нравится. Ответы покупателей приведены в таблице (задать самостоятельно).
Покупатели |
Вид мороженого |
|
|||
1 |
2 |
… |
|
||
1 |
|
|
|
|
|
2 |
|
|
|
|
|
… |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Проверить гипотезу H0: все сорта мороженого нравятся покупателям в равной степени. Альтернативная гипотеза H1: сорта мороженого нравятся покупателям в разной степени. Использовать Q-критерий Кокрена.