- •Теория информационных процессов и систем
- •Санкт-Петербург
- •СПбГиэу, 2008 Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Список литературы
- •Приложение 1 Содержание дисциплины
- •Приложение 2 Пример оформления титульного листа лабораторной работы
Результаты регрессионного анализа:
В появившейся панели Model Definition (Задание модели) выполняем следующие установки (рис. 3.28) и нажимаем ОК.
В появившемся окне Multiple Regression Results (Результаты множественной регрессии) (рис. 3.29) нажимаем Regression summary и получаем результат регрессии на нулевом шаге (рис. 3.30).
Уравнение множественной регрессии имеет вид:
.
Из таблицы видно, что переменная X1 исключается из дальнейшего анализа, так как коэффициент регрессии 1 незначим (t(24) = 0.322 и p-level = 0.75).
В появившейся панели Model Definition (Задание модели) выполняем следующие установки (рис. 3.31) и нажимаем ОК.
В появившемся окне Multiple Regression Results (Результаты множественной регрессии) (рис. 3.32) нажимаем Regression summary и получаем результат регрессии на первом шаге (рис. 3.33).
Рис. 3.28. Установки регрессионной модели
Рис. 3.29. Окно результатов регрессионного анализа
Рис. 3.30. Результаты регрессионного анализа на нулевом шаге
Рис. 3.31. Установки регрессионной модели
Уравнение множественной регрессии имеет вид:
.
Далее из рассмотрения исключается переменная X5 (t(25) = 0.656 и p-level = 0.518).
В появившейся панели Model Definition (Задание модели) выполняем следующие установки (рис. 3.34) и нажимаем ОК.
Рис. 3.32. Окно результатов регрессионного анализа
Рис. 3.33. Результаты регрессионного анализа на первом шаге
В появившемся окне Multiple Regression Results (Результаты множественной регрессии) (рис. 3.34) нажимаем Regression summary и получаем результат регрессии на первом шаге (рис. 3.35).
Рис. 3.34. Установки регрессионной модели
Рис. 3.35. Окно результатов регрессионного анализа
Рис. 3.36. Результаты регрессионного анализа на втором шаге
Следовательно, уравнение множественной регрессии имеет вид:
Дисперсионный анализ:
Для проведения дисперсионного анализа в окне Multiple Regression Results (Результаты множественной регрессии) (рис. 3.37) нажимаем Analysis of variance (Дисперсионный анализ) и получаем результаты в соответствующей таблице (рис. 3.38), где Regress – сумма квадратов, обусловленная регрессией ; Residual – остаточная сумма квадратов ; Total – сумма квадратов отклонений зависимой переменной Y от среднего .
Рис. 3.37. Окно результатов регрессионного анализа
Рис. 3.38. Результаты дисперсионного анализа
Вывод: из таблицы видно что, F = 1.44, что подтверждает значимость модели.
Для подтверждения предположения регрессионного анализа и адекватности модели, произведем анализ остатков. Для этого в окне Multiple Regression Results (Результаты множественной регрессии) (рис. 3.39) нажимаем Residual analysis (Анализ остатков). В появившемся окне выбираем критерий Дарбина-Уотсона (рис. 3.40) и получаем результаты в соответствующей таблице (рис. 3.41).
В данном случае статистика Дарбина-Уотсона d = 2.23, что больше табличного значения d = 1.49, следовательно, гипотеза: все сериальные корреляции равны нулю, принимается.
Рис. 3.40. Окно результатов регрессионного анализа
Рис. 3.40. Окно Residual analysis (Анализ остатков)
Рис. 3.41. Результаты анализа остатков
Чтобы посмотреть остатки и их графики произведем следующие действия. В окне Residual analysis (Анализ остатков) выбираем Plots of residuals (рис. 3.42) и получаем график остатков и их значения в соответствующей таблице (рис. 3.43).
Все остатки укладываются в симметричную относительно нулевой линии полосу шириной 2S, следовательно, дисперсии ошибок наблюдений постоянны.
Рис. 3.42. Окно Residual analysis (Анализ остатков)
Рис. 3.43. Остатки и их значения
Проверим гипотезу о нормальности распределения остатков. Для этого в окне Residual analysis (Анализ остатков) выбираем Normal plot of resids (рис. 3.44) и получаем график распределения остатков относительно графика регрессионной модели (рис. 3.45).
Рис. 3.44. Окно Residual analysis (Анализ остатков)
Рис. 3.45. Остатки и график регрессионной модели
Вывод: из графика видно, что точки расположены близко к прямой, следовательно, остатки распределены по нормальному закону. Таким образом, предположения регрессионного анализа выполняются. Регрессионная модель адекватна результатам наблюдений и может использоваться для прогнозирования.