
- •Теория информационных процессов и систем
- •Санкт-Петербург
- •Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Содержание отчета
- •Список литературы
- •Приложение 1 Пример оформления титульного листа лабораторной работы
Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
Задание:
Решите следующие задачи. Определите
меры связи
и
,
прокомментируйте результаты:
-
Исследуются два производственных процесса. Используя критерий
, проверьте гипотезу о равенстве процента брака в обоих процессах по следующим данным (задаете самостоятельно) при
:
Процесс |
||
1 |
2 |
|
Годные изделия |
||
Бракованные изделия |
-
N (задаете самостоятельно) человек классифицировали по признаку дальтонизма. По приведенным ниже данным (задаете самостоятельно) проверьте, есть ли зависимость между наличием дальтонизма и полом человека при
:
Мужчины |
Женщины |
|
Дальтоник |
||
Не дальтоники |
-
Во время эпидемии гриппа изучалась эффективность прививок против этого заболевания. Получены следующие результаты (задаете самостоятельно):
После прививки |
Без прививки |
||
заболели |
не заболели |
заболели |
не заболели |
Проверьте, указывают ли эти результаты
на эффективность прививок. Принять
.
Выполнение работы
Для того чтобы войти в модуль Непараметрические методы на панели инструментов нажимаем на кнопку переключателя модулей STATISTICA Module Switcher (рис. 4.1).
Рис. 4.1. Переключатель модулей Module Switcher
В появившемся окне (рис. 4.2) выбираем модуль Nonparametrics/Distrib., нажав кнопку Switch to (Переключиться в) или просто дважды щелкнув мышью по названию модуля Nonparametrics/Distrib..
Рис. 4.2. Окно Переключателя модулей Module Switcher
На экране появится стартовая панель модуля (рис. 4.3) Nonparametric Statistics (Непараметрические статистики), в которой выбираем нужный метод.
Рис. 4.3. Стартовая панель модуля Nonparametric Statistics (Непараметрические статистики)
Для выполнения лабораторной работы подготовьте исходные данные для проведения интеллектуального анализа в системе STATISTICA (рис. 4.4).
Рис. 4.4. Исходная выборка данных
В стартовой панели модуля (рис. 4.5) Nonparametric Statistics (Непараметрические статистики) выбираем 22 Tables XI/VI/Phil, MacNemar, Fisher exact (Таблицы сопряженности 22, статистики 2, , критерий Макнимара, точный критерий Фишера); вводим исходные данные в таблицу сопряженности 22 (рис. 4.6) и нажимаем OK.
Рис. 4.5. Стартовая панель модуля Nonparametric Statistics (Непараметрические статистики)
Рис. 4.6. Таблица сопряженности 22
Получаем следующую таблицу результатов (рис. 4.7).
Вывод: выборочное значение 2 = 1.25.
Гипотеза H0 на
уровне значимости
принимается, если
,
где
– квантиль распределения хи-квадрат с
одной степенью свободы порядка 1 – .
Из таблицы определяем:
.
Следовательно, можно сделать вывод о том, что на уровне значимости = 0.01 гипотеза H0 принимается (число бракованных и годных изделий не зависит от вида процесса).
Рис. 4.7. Таблица результатов анализа
Мера связи между переменными ИЗДЕЛИЕ и ПРОЦЕСС (средний коэффициент сопряженности):
,
следовательно, между переменными ИЗДЕЛИЕ
и ПРОЦЕСС нет зависимости.