- •Теория информационных процессов и систем
- •Санкт-Петербург
- •Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Содержание отчета
- •Список литературы
- •Приложение 1 Пример оформления титульного листа лабораторной работы
Задача 5. Критерий Манна-Уитни.
Задание:
Решите следующие задачи, используя критерий серий Вальда-Вольфовица и Манна-Уитни. Сравните и прокомментируйте результаты.
-
По выборкам из 2-х партий микросхем после операции легирования поликремния измерялось удельное сопротивление. Результаты замеров следующие (задаете самостоятельно):
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
… |
n |
|
1-я партия |
||||||||||||
2-я партия |
Например:
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
1-я партия |
52.2 |
33 |
32.5 |
49.5 |
32.5 |
191.5 |
112.5 |
69.1 |
48.5 |
16.5 |
2-я партия |
119 |
17.5 |
43.5 |
90.5 |
40 |
50 |
108 |
96 |
– |
– |
Можно ли утверждать, что обе партии получены из одной генеральной совокупности? Принять .
Выполнение работы:
Для выполнения лабораторной работы подготовьте исходные данные для проведения интеллектуального анализа в системе STATISTICA (рис. 4.27).
Гипотеза H0: выборки получены из одной генеральной совокупности.
Рис. 4.27. Исходная выборка данных
Решение задачи с использованием критерия серий Вальда-Вольфовица:
По аналогии с предыдущей задачей производим все необходимые действия и получаем следующую таблицу результатов (рис. 4.28):
Рис. 4.28. Таблица результатов анализа
Вывод: выборочное значение Z: ze 0.46.
Так как это значение меньше квантили распределения N(0, 1) u0.99 = 2.326, то гипотеза H0 не отклоняется, т. е. обе выборки получены из одной генеральной совокупности.
Решение задачи с использованием критерия Манна-Уитни:
В стартовой панели модуля Nonparametric Statistics (Непараметрические статистики) (рис. 4.29) выбираем Mann-Whitney U test (Критерий Манна-Уитни) и нажимаем OK.
Рис. 4.29. Стартовая панель модуля Nonparametric Statistics (Непараметрические статистики)
В появившемся окне (рис. 4.30) нажимаем Variables и задаем переменные (рис. 4.31). Нажимаем OK (рис. 4.32).
Рис. 4.30. Окно Mann-Whitney U Test (Критерий Манна-Уитни)
Рис. 4.31. Окно выбора переменных
В появившемся окне Mann-Whitney U Test (Критерий Манна-Уитни) выполняем соответствующие установки (рис. 4.32), нажимаем OK и получаем следующую таблицу результатов (рис. 4.33).
Вывод: для проверки гипотезы H0 используется статистика Z. Выборочное значение этой статистики . Это значение сравнивается с квантилью стандартного нормального распределения . Так как , то гипотеза H0 не отклоняется, т. е. обе партии получены из одной генеральной совокупности.
Рис. 4.32. Окно Mann-Whitney U Test (Критерий Манна-Уитни)
Рис. 4.33. Таблица результатов анализа
-
Профессор решил определить, быстрее или медленнее его наиболее способные студенты сдают письменные тесты: быстрее потому, что они быстрее вспоминают усвоенные навыки или медленнее потому, что на запись всего, что они знают, уходит больше времени. При решении задач по физике он записал полученные студентами оценки в порядке сдачи их работ (количество студентов и результаты работ задать самостоятельно):
Например:
Порядок сдачи работ |
Оценки |
|||||||||
1-10 |
94 |
70 |
85 |
89 |
92 |
98 |
63 |
88 |
74 |
85 |
11-20 |
69 |
90 |
57 |
86 |
79 |
72 |
80 |
93 |
66 |
74 |
21-30 |
50 |
55 |
47 |
59 |
68 |
63 |
89 |
51 |
90 |
88 |
Студентов, набравших 90 и более баллов, профессор считает наиболее способными студентами. Может ли он при уровне значимости 5% считать, что сдача работ студентами носила случайный характер?
Можно ли считать, что студенты, набравшие 60 или более баллов, которые считаются прошедшими тест, сдали свои работы в случайной последовательности в отличие от тех, кто не прошел тест? Уровень значимости 5%.
-
Для контроля настройки 2-х станков-автоматов, производящих детали по одному чертежу, определили отклонения от номинальных размеров у некоторых деталей, изготовленных на обоих станках. В результате получили следующие данные (в мкм.) (задать самостоятельно):
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
… |
||
Станок A |
||||||||||||
Станок B |
Например:
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
|
Станок A |
44 |
-14 |
32 |
8 |
-50 |
20 |
-35 |
15 |
10 |
-8 |
-20 |
5 |
Станок B |
52 |
-49 |
61 |
-35 |
-48 |
18 |
-45 |
35 |
23 |
21 |
-59 |
-19 |
Проверить гипотезу H0 о том, что отклонения от номинальных размеров на обоих станках в среднем не отклоняется на уровне значимости .