- •Теория информационных процессов и систем
- •Санкт-Петербург
- •Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Содержание отчета
- •Список литературы
- •Приложение 1 Пример оформления титульного листа лабораторной работы
Задача 1
Задание:
Проверьте гипотезу о равенстве средних по данным о товарообороте n магазинов (задать самостоятельно) в течение 6 месяцев (в млн. руб.):
Месяц |
Магазин |
||
1 |
… |
||
1 |
|||
2 |
|||
3 |
|||
4 |
|||
5 |
|||
6 |
если гипотеза принимается, то найти несмещенные оценки средних в группах и дисперсии ошибок наблюдений;
если гипотеза отклоняется, провести попарно сравнение средних, используя метод линейных контрастов.
Принять .
Выполнение работы:
Для выполнения лабораторной работы подготовьте исходные данные для проведения интеллектуального анализа в системе STATISTICA (рис. 5.1).
Рис. 5.1. Исходная выборка данных
Для проведения однофакторного дисперсионного анализа на панели инструментов нажимаем на кнопку переключателя модулей STATISTICA Module Switcher (рис. 5.2).
Рис. 5.2. Переключатель модулей Module Switcher
В появившемся окне (рис. 5.3) выбираем модуль Basic Statistics (Базовые статистики), нажав кнопку Switch to (Переключиться в) или просто дважды щелкнув мышью по названию модуля Basic Statistics.
На экране появится стартовая панель модуля (рис. 5.4) Basic Statistics and Tables (Базовые статистики), где выбираем Breakdown and one-way ANOVA (Однофакторный дисперсионный анализ).
В появившемся окне (рис. 5.5) выполняем соответствующие установки, нажимаем Variables и задаем переменные (рис. 5.6). Нажимаем OK (рис. 5.7).
Снова нажимаем OK и в появившемся окне результатов (рис. 5.8) выполняем соответствующие установки и нажимаем Analysis of Variance (Дисперсионный анализ). Получаем таблицу результатов дисперсионного анализа (рис. 5.9).
Рис. 5.3. Окно Переключателя модулей Module Switcher
Рис. 5.4. Стартовая панель модуля Basic Statistics and Tables (Базовые статистики)
Рис. 5.5. Окно Descriptive Statistics and Correlations by Groups (Описательные статистики и групповые корреляции)
Рис. 5.6. Окно выбора переменных
Рис. 5.7. Окно Descriptive Statistics and Correlations by Groups (Описательные статистики и групповые корреляции)
Рис. 5.8. Окно результатов
Рис. 5.9. Таблица результатов анализа
Вывод: вычисленный уровень значимости больше 0.05, следовательно, гипотеза о равенстве средних принимается.
Проведем попарно сравнение средних по методу Шеффе: данный анализ проводится, если гипотеза отклоняется.
В окне Descriptive Statistics and Correlations by Groups (Описательные статистики и групповые корреляции) (рис. 5.10) выполняем соответствующие установки и нажимаем Post-hoc comparisons of means (Сравнение средних). В появившемся окне (рис. 5.11) нажимаем Scheffy test (Тест Шеффе) и получаем следующую таблицу результатов попарного сравнения средних, в которой указаны уровни значимости для проверки гипотез о равенстве средних для всех пар (рис. 5.12).
Рис. 5.10. Окно результатов
Рис. 5.11. Окно Post-hoc comparisons of means
(Сравнение средних)
Рис. 5.12. Таблица результатов анализа
Вывод: гипотеза о том, что математическое ожидание второй группы равно математическому ожиданию третьей группы принимается, так же и для остальных.
Найдем несмещенные оценки средних в группах и дисперсии ошибок наблюдения. Данный анализ проводится, если гипотеза принимается.
Рис. 5.13. Окно результатов
В окне Descriptive Statistics and Correlations by Groups (Описательные статистики и групповые корреляции) (рис. 5.13) выполняем соответствующие установки и нажимаем Summary table of means (Общая таблица средних). Нажимаем OK и получаем общую таблицу средних (рис. 5.14).
Рис. 5.14. Таблица результатов анализа
Вывод: из таблицы видно, что средние товарооборота для трех магазинов примерно равны, что говорит о том, что мы правильно приняли решение о том, что гипотеза принимается.