- •Теория информационных процессов и систем
- •Санкт-Петербург
- •Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Содержание отчета
- •Список литературы
- •Приложение 1 Пример оформления титульного листа лабораторной работы
Вычисление предсказанных значений доверительных интервалов:
Вычисления проводятся при нажатии кнопки Predict dependent var (Прогнозирование значения зависимой переменной) в окне Multiple Regression Results (Результаты множественной регрессии) (рис. 3.45), предварительно задав уровень значимости и вид вычисляемого доверительного интервала (для среднего предсказанного значения). Результаты вычисления предсказанных значений доверительных интервалов приведены в соответствующей таблице (рис. 3.46).
Рис. 3.45. Окно результатов регрессионного анализа
Рис. 3.46. Результаты вычисления предсказанных значений доверительных интервалов
Задача 2. Корреляционный анализ.
Основные понятия:
Парный коэффициент корреляции. Частные коэффициенты корреляции. Частный коэффициент детерминации. Корреляционная матрица. Диаграммы рассеяния.
Задание:
Используя выборку данных из задачи 1, выполнить следующие задания:
-
Проведите корреляционный анализ данных.
-
Объясните полученные результаты.
Выполнение работы
Для проведения корреляционного анализа в окне Multiple Regression (Множественная регрессия) нужно установить все необходимые ограничения (рис. 3.47) и нажать OK.
В появившемся окне (рис. 3.48) нажимаем последовательно Correlations (Корреляция) и Graph (График) и получаем корреляционную матрицу (рис. 3.49) и гистограммы и диаграммы рассеяния для исходных данных (рис. 3.50).
Вывод: коэффициенты корреляции и диаграммы рассеяния свидетельствуют о наличии зависимости между всеми переменными.
Рис. 3.47. Окно модуля Multiple Regression
Рис. 3.48. Окно описательных статистик
Рис. 3.49. Корреляционная матрица
Рис. 3.50. Гистограммы и диаграммы рассеяния для исходных данных
Для определения оценок частных корреляций в окне Multiple Regression Results (Результаты множественной регрессии) (рис. 3.51) нажимаем Partial correlations (Частные корреляции) и получаем результаты вычисления в соответствующей таблице.
Рис. 3.51. Окно Multiple Regression Results
Задача 3. Нелинейная регрессия.
-
Найдите оценки параметров a и b в функции Кобба-Дугласа:
,
где Q – объем производства; L – трудовые ресурсы; K – капитал; Q0 = 51, L0 = 19, K0 = 16 – фиксированные значения этих переменных.
Значения Q при определенных трудовых ресурсах L и стоимости капитала K заданы в таблице (задать самостоятельно):
Например:
K |
|||||
L |
6 |
11 |
16 |
21 |
26 |
9 |
6 |
12 |
19 |
27 |
36 |
14 |
11 |
12 |
35 |
50 |
66 |
19 |
17 |
32 |
51 |
72 |
96 |
24 |
22 |
42 |
67 |
95 |
126 |
29 |
27 |
52 |
83 |
118 |
156 |
-
Прибыль P, получаемая фирмой, определяется формулой , где x – объем производства (т); k – цена одной тонны продукции (руб./т); c – издержки производства (руб.).
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
|
Параметры k и c задайте самостоятельно.
Найдите оценки параметров модели :
.
Используя полученную модель, найдите объем производства, обеспечивающий максимальную прибыль, и точку самоокупаемости, т.е. такое значение x, при котором прибыль равна нулю.