- •Теория информационных процессов и систем
- •Санкт-Петербург
- •СПбГиэу, 2008 Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Список литературы
- •Приложение 1 Содержание дисциплины
- •Приложение 2 Пример оформления титульного листа лабораторной работы
Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
Задание:
Числа выпадений герба при N (задаете самостоятельно) подбрасываниях двух монет распределились следующим образом (задаете самостоятельно):
Количество гербов |
0 |
1 |
2 |
Число подбрасываний |
|
|
|
Согласуются ли эти результаты с предположениями о симметричности монет и независимости результатов подбрасываний при ?
В цехе с n (задаете самостоятельно) станками ежедневно регистрировалось число вышедших из строя станков. Всего было проведено N (задаете самостоятельно) наблюдений, результаты которых приведены ниже:
Число выбывших станков |
0 |
1 |
… |
|
Число зарегистрированных случаев |
|
|
|
|
Проверьте гипотезу о том, что число выбывших из строя станков имеет распределение Пуассона. Принять .
Величина контрольного размера N (задаете самостоятельно) деталей, изготовленных на одном станке (мм.):
Границы интервала |
3-3.9 |
4-4.9 |
5-5.9 |
6-6.9 |
7-7.9 |
Частота |
|
|
|
|
|
Проверьте гипотезу H0 о том, что выборка получена из нормально распределенной генеральной совокупности. Принять .
Выполнение работы
Для выполнения лабораторной работы подготовьте исходные данные для проведения интеллектуального анализа в системе STATISTICA (рис. 4.8).
Рис. 4.8. Исходная выборка данных
В стартовой панели модуля (рис. 4.9) Nonparametric Statistics (Непараметрические статистики) выбираем Observed versus expected XI (Статистика ) и нажимаем OK.
Рис. 4.9. Стартовая панель модуля Nonparametric Statistics (Непараметрические статистики)
В появившемся окне (рис. 4.10) нажимаем Variables, далее задаем переменные, нажимаем OK и получаем следующую таблицу результатов (рис. 4.12).
Рис. 4.10. Окно Observed and expected frequency
(Наблюдаемая и ожидаемая частота)
Рис. 4.11. Окно выбора переменных
Рис. 4.12. Таблица результатов анализа
Вывод: выборочное значение 2 = 1.9.
Гипотеза о согласии наблюдаемых и ожидаемых частот принимается, если:
, где – квантиль распределения.
Из таблицы определяем .
Следовательно, можно сделать вывод о том, что гипотеза о согласии наблюдаемых и ожидаемых частот принимается, таким образом, монеты симметричны.
Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
Задание:
Вычислить коэффициенты ранговой корреляции Спирмена и Кендалла. Проверить значимость полученных результатов, сравнить коэффициенты ранговой корреляции и прокомментировать их:
Спортсмены, ранги которых при построении по росту были , заняли на состязаниях следующие места (задать самостоятельно). Как велика ранговая корреляция между ростом и быстротой бега?
Для контрольной партии интегральных схем по нескольким параметрам определено значение критерия годности K. Найти коэффициенты ранговой корреляции между значениями K и удельного сопротивления p-кармана , между и напряжением отсечки по следующим данным (задать самостоятельно):
K |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, В |
|
|
|
|
|
|
|
|
|
|
Например:
K |
0.226 |
0.187 |
0.678 |
0.141 |
0.197 |
0.339 |
0.421 |
0.141 |
0.127 |
0.819 |
|
905 |
1004 |
1119 |
1200 |
1340 |
1261 |
1140 |
1190 |
1060 |
1130 |
, В |
1.2 |
1.9 |
1.7 |
1.5 |
4.5 |
2.2 |
2.3 |
2.4 |
1.8 |
1.4 |
Проверьте значимость полученных результатов при .
Измерения длины головы (x) и длины грудного плавника (y) у N (задайте самостоятельно) рыб дали следующие результаты (мм.):
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
… |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Например:
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
66 |
61 |
67 |
73 |
51 |
59 |
48 |
47 |
58 |
44 |
|
38 |
31 |
36 |
43 |
29 |
33 |
28 |
25 |
36 |
26 |
Найдите коэффициенты ранговой корреляции. Проверьте значимость полученных результатов при .
Найдите коэффициент корреляции Пирсона и проверьте его значение при в предположении, что выборка наблюдений получена из нормально распределенной двумерной совокупности.