- •Теория информационных процессов и систем
- •Санкт-Петербург
- •Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Содержание отчета
- •Список литературы
- •Приложение 1 Пример оформления титульного листа лабораторной работы
Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
Задание:
Решите задачу, используя критерий знаков и критерий Вилкоксона. Сравните и прокомментируйте результаты.
-
Для N человек была предложена специальная диета. После двухнедельного питания по этой диете масса их теле изменилась следующим образом (задать самостоятельно):
1 |
2 |
3 |
4 |
5 |
… |
||
Масса до диеты (кг) |
|||||||
Масса после диеты (кг) |
-
можно ли рекомендовать эту диету для людей, желающих похудеть?
-
оказывает ли эта диета вообще какое-либо существенное влияние на массу тела?
Принять .
Выполнение работы:
Гипотеза H0: критерий Вилкоксона, так же как и критерий знаков, используется для проверки гипотезы об однородности двух генеральных совокупностей по попарно связанным выборкам.
Для выполнения лабораторной работы подготовьте исходные данные для проведения интеллектуального анализа в системе STATISTICA (рис. 4.42).
Рис. 4.42. Исходная выборка данных
Решение с помощью критерия знаков:
В стартовой панели модуля Nonparametric Statistics (Непараметрические статистики) (рис. 4.43) выбираем Sign test (Критерий знаков) и нажимаем OK.
Рис. 4.43. Стартовая панель модуля Nonparametric Statistics (Непараметрические статистики)
В появившемся окне (рис. 4.44) нажимаем Variables и задаем переменные (рис. 4.45). Нажимаем OK (рис. 4.46).
Рис. 4.44. Окно Sign test (Критерий знаков)
Рис. 4.45. Окно выбора переменных
Рис. 4.46. Окно Sign test (Критерий знаков)
В появившемся окне Sign test (Критерий знаков) нажимаем OK и получаем следующую таблицу результатов (рис. 4.47).
Рис. 4.47. Таблица результатов анализа
Вывод: вычисленный уровень значимости p = 0.0044 меньше заданного уровня значимости = 0.01, следовательно, гипотеза отклоняется – диету можно считать эффективной.
Решение с помощью критерия Вилкоксона:
В стартовой панели модуля Nonparametric Statistics (Непараметрические статистики) (рис. 4.48) выбираем Wilcoxon matched pairs test (Критерий Вилкоксона для связанных пар наблюдений) и нажимаем OK.
Рис. 4.48. Стартовая панель модуля Nonparametric Statistics (Непараметрические статистики)
В появившемся окне (рис. 4.49) нажимаем Variables и задаем переменные (рис. 4.45). Нажимаем OK.
В появившемся окне Wilcoxon matched pairs test (Критерий Вилкоксона для связанных пар наблюдений) нажимаем OK и получаем следующую таблицу результатов (рис. 4.50).
Рис. 4.49. Окно Wilcoxon matched pairs test
(Критерий Вилкоксона для связанных пар наблюдений)
Рис. 4.50. Таблица результатов анализа
Вывод: статистикой критерия T является число, равное наименьшему значению суммы рангов для отрицательных разностей Rn и положительных разностей Rp. В данном случае T = 0. По таблице находим критическое значение Ткр (для данного случая оно равно 5) и сравниваем его с получившимся значением T-статистики. Так как T < 5, то гипотеза H0 не принимается, т.е. диету можно считать эффективной.