- •Теория информационных процессов и систем
- •Санкт-Петербург
- •СПбГиэу, 2008 Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Список литературы
- •Приложение 1 Содержание дисциплины
- •Приложение 2 Пример оформления титульного листа лабораторной работы
Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
Основные понятия:
Автокорреляционная функция. Сериальные корреляции. Аддитивная и мультипликативная модели временного ряда. Метод скользящих средних. Сезонные индексы. Случайная составляющая временного ряда.
Задание:
Используя выборку данных (24 значения, задаете самостоятельно), выполнить следующие задания:
Построить график ряда.
Вычислить сглаженные ряды, используя простые скользящие средние:
по трем точкам;
четырем точкам (после сглаживания провести центрирование);
пяти точкам.
Сглаженные ряды нанести на три отдельных графика вместе с исходными данными.
Рассчитать 4 сезонных индекса для исходного ряда по аддитивной модели ряда. Построить на одном графике:
исходные данные ;
центрированные скользящие средние (оценка тренда) ;
сезонные индексы ;
данные без сезонной составляющей ;
остатки .
Повторить расчеты из пункта 3 для мультипликативной модели ряда и построить соответствующие графики.
Сравнить результаты пунктов 3 и 4.
Найти дисперсии остатков для обеих моделей ряда. Сравнить результаты и выбрать подходящую модель (выбор – обосновать).
Выполнение работы
Для выполнения лабораторной работы подготовьте исходные данные для проведения интеллектуального анализа в системе STATISTICA (рис. 2.1).
Рис. 2.1. Исходная выборка данных
Для того чтобы войти в модуль Анализ временных рядов и прогнозирование необходимо в переключателе модулей STATISTICA Module Switcher (рис. 2.2) выбрать модуль Time series/Forecasting или выбрав пункт меню Statistics/Advanced linear/nonlinear models/Time series/ Forecasting.
Рис. 2.2. Переключатель модулей Module Switcher
В появившемся окне (рис. 2.3) выбираем модуль Time series/Forecasting (Анализ временных рядов и прогнозирование), нажав кнопку Switch to (Переключиться в) или просто дважды щелкнув мышью по названию модуля Time series/Forecasting.
Рис. 2.3. Окно Переключателя модулей Module Switcher
Для начала анализа необходимо вызвать стартовую панель модуля, для этого в меню Analysis выбираем команду Startup Panel (рис. 2.4).
В диалоговом окне Time series analysis (рис. 2.5) задайте переменную для анализа и нажмите кнопку OK (transformations, autocorrelations, …).
Слева от имени анализируемой переменной стоит значок L в графе Lock, означающий, что переменная закрыта на ключ и не может быть удалена без прерывания анализа.
Рис. 2.4. Вызов стартовой панели модуля
Рис. 2.5. Диалоговое окно Time series analysis
Далее в диалоговом окне Transformations of variables (рис. 2.6) выберите вкладку Smoothing, задайте параметр скользящего среднего N-pts mov. averg. (рис. 2.7) и подтвердите преобразование ряда OK (Transform selected series). В результате будет построен линейный график преобразованного временного ряда. Значения преобразованного временного ряда можно посмотреть, выбрав кнопку Save variables.
Рис. 2.6. Диалоговое окно Transformations of variables
Рис. 2.7. Задание параметров скользящего среднего
После выполнения вышестоящих процедур получаем следующие результаты (рис. 2.8-2.15).
Рис. 2.9. График исходных данных
Рис. 2.10. Сглаженный временной ряд на основе простого скользящего среднего по трем точкам
Рис. 2.11. Таблица результатов сглаживания по трем точкам
Рис. 2.12. Сглаженный временной ряд при помощи центрированного скользящего среднего по четырем точкам:
Рис. 2.13. Таблица результатов сглаживания по четырем точкам
Рис. 2.14. Сглаженный временной ряд на основе простого скользящего среднего по пяти точкам
Рис. 2.15. Таблица результатов сглаживания по пяти точкам
Вывод: При увеличении количества точек, линия тренда становится более плавной, т. е. стремится к прямой линии.