
- •Теория информационных процессов и систем
- •Санкт-Петербург
- •Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Содержание отчета
- •Список литературы
- •Приложение 1 Пример оформления титульного листа лабораторной работы
Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
Основные понятия:
Вычисление ошибок прогноза. Прогнозирование методом экспоненциального сглаживания.
Задание:
Используя выборку данных из задачи 1 (24 точки), выполнить следующие задания:
-
По выбранной модели найти значения прогноза для следующих 4-х точек (точки 25, 26, 27, 28). Для прогноза использовать оценки сезонных индексов, полученных в задаче 1. Для оценки тренда можно, в зависимости от данных, вычислить оценки параметров линейной
или квадратичной
функции тренда по данным скользящих средних по 4-м точкам.
-
Вычислить среднеквадратическую (MSE) и среднюю абсолютную относительную (MAPE) ошибки прогноза.
Выполнение работы
В диалоговом окне Time series analysis задайте переменную для анализа и нажмите кнопку OK (transformations, autocorrelations, …).
Слева от имени анализируемой переменной стоит значок L в графе Lock, означающий, что переменная закрыта на ключ и не может быть удалена без прерывания анализа.
Для прогнозирования временного ряда методом экспоненциального сглаживания выбираем Exponential smoothing & forecasting (рис. 2.22).
Рис. 2.22. Прогнозирование временного ряда методом экспоненциального сглаживания
Сначала определим значения прогноза для аддитивной модели. Используем выборку данных из задачи 2.1. В появившемся окне (рис. 2.23) задаем значения прогноза для аддитивной модели и нажимаем OK. Получаем таблицу результатов (рис. 2.24) экспоненциального сглаживания (аддитивная модель) и их графическое представление (рис. 2.25), а также таблицу значений ошибок (рис. 2.26) экспоненциального сглаживания (аддитивная модель).
Рис. 2.23. Значения прогноза для аддитивной модели
Рис. 2.24. Экспоненциальное сглаживание (аддитивная модель)
Рис. 2.25. Графическое представление результатов экспоненциального сглаживания (аддитивная модель)
Рис. 2.26. Таблица значений ошибок экспоненциального сглаживания (аддитивная модель)
Теперь определим значения прогноза для мультипликативной модели. Используем выборку данных из задачи 2.1. В окне Seasonal and Non-Seasonal Exponential Smoothing (рис. 2.27) задаем значения прогноза для мультипликативной модели и нажимаем OK. Получаем таблицу результатов (рис. 2.28) экспоненциального сглаживания (мультипликативная модель) и их графическое представление (рис. 2.29), а также таблицу значений ошибок (рис. 2.30) экспоненциального сглаживания (мультипликативная модель).
В таблице значений ошибок экспоненциального сглаживания приведены данные по следующим видам ошибок (в том же порядке, как они идут на экране):
-
средняя ошибка;
-
средняя абсолютная ошибка;
-
сумма квадратов ошибок;
-
средняя квадратическая ошибка;
-
средняя относительная ошибка;
-
средняя абсолютная относительная ошибка.
Рис. 2.27. Значения прогноза для мультипликативной модели
Рис. 2.28. Экспоненциальное сглаживание
(мультипликативная модель)
Рис. 2.29. Графическое представление результатов экспоненциального сглаживания (мультипликативная модель)
Рис. 2.30. Таблица значений ошибок экспоненциального сглаживания (мультипликативная модель)
Вывод: на данном этапе был проведен анализ мультипликативной и аддитивной модели на основе экспоненциального сглаживания. Простая процедура прогноза строится при помощи усреднения всех прошлых значений временного ряда, которые используются с весами, убывающими по геометрическому или экспоненциальному закону.
Из последней таблицы значения ошибок следует:
Недостатком средней ошибки является то, что положительные и отрицательные ошибки компенсируют друг друга, поэтому она не является хорошим показателем качества прогноза. Средняя абсолютная ошибка по сравнению со средней квадратической ошибкой более устойчива по отношению к выбросам. Относительные ошибки позволяют учесть тот факт, что при прогнозе они могут достаточно сильно изменяться от месяца к месяцу. При расчете средней относительной ошибки отрицательные и положительные ошибки будут компенсировать друг друга. Поэтому для оценки качества прогноза лучше использовать среднюю абсолютную относительную ошибку.