- •Теория информационных процессов и систем
- •Санкт-Петербург
- •СПбГиэу, 2008 Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Список литературы
- •Приложение 1 Содержание дисциплины
- •Приложение 2 Пример оформления титульного листа лабораторной работы
Задача 2
Задание:
В n магазинах, продающих товары одного вида, данные товарооборота за 8 месяцев (в тыс. руб.) составили следующую сводку (задать самостоятельно):
Магазин |
Месяц |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
|
|
|
|
|
|
|
|
… |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Требуется проверить гипотезу H0 о равенстве среднего товарооборота в магазинах. Если гипотеза принимается, то найти несмещенные оценки среднего и дисперсии. Предполагается, что выборки получены из независимых нормально распределенных совокупностей с одной и той же дисперсией. Проверьте, выполняются ли эти предположения.
Принять .
Выполнение работы:
Для выполнения лабораторной работы подготовьте исходные данные для проведения интеллектуального анализа в системе STATISTICA (рис. 5.15).
Рис. 5.15. Исходная выборка данных
В стартовой панели модуля Basic Statistics and Tables (Базовые статистики) (рис. 5.16) выбираем Breakdown and one-way ANOVA (Однофакторный дисперсионный анализ).
В появившемся окне (рис. 5.17) выполняем соответствующие установки, нажимаем Variables и задаем переменные (рис. 5.18). Нажимаем OK (рис. 5.19).
Рис. 5.16. Стартовая панель модуля Basic Statistics and Tables (Базовые статистики)
Рис. 5.17. Окно Descriptive Statistics and Correlations by Groups (Описательные статистики и групповые корреляции)
Рис. 5.18. Окно выбора переменных
Рис. 5.19. Окно Descriptive Statistics and Correlations by Groups (Описательные статистики и групповые корреляции)
Рис. 5.20. Окно результатов
Рис. 5.21. Таблица результатов анализа
Снова нажимаем OK и в появившемся окне результатов (рис. 5.20) выполняем соответствующие установки и нажимаем Analysis of Variance (Дисперсионный анализ). Получаем таблицу результатов дисперсионного анализа (рис. 5.21).
Вывод: вычисленный уровень значимости (0.000923) меньше заданного уровня значимости 0.10, следовательно, гипотеза о равенстве средних отклоняется.
Проверим гипотезу о том, что выборки получены из независимых нормально распределенных совокупностей с одной и той же дисперсией. Для этих целей используются критерий Левена и критерий Брауна-Форсайта.
Критерий Левена
В окне результатов дисперсионного анализа (рис. 5.22) выполняем соответствующие установки и нажимаем Levene (Критерий Левена). Получаем таблицу результатов теста Левена на однородность дисперсий (рис. 5.23).
Рис. 5.22. Окно результатов
Рис. 5.23. Таблица результатов анализа
Критерий Брауна-Форсайта
В окне результатов дисперсионного анализа (рис. 5.24) выполняем соответствующие установки и нажимаем Brown-Forsythe (HOV) (Критерий Брауна-Форсайта). Получаем таблицу результатов теста Брауна-Форсайта на однородность дисперсий (рис. 5.25).
Рис. 5.24. Окно результатов
Рис. 5.25. Таблица результатов анализа
Вывод: по результатам двух тестов гипотеза о том, что выборки получены из независимых нормально распределенных совокупностей с одной и той же дисперсией, принимается, т.к. и в том и в другом тестах уровни значимости (0.45, 0.53) больше заданного уровня значимости.