
- •Теория информационных процессов и систем
- •Санкт-Петербург
- •Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Содержание отчета
- •Список литературы
- •Приложение 1 Пример оформления титульного листа лабораторной работы
Выполнение работы:
Для выполнения лабораторной работы подготовьте исходную выборку данных для проведения интеллектуального анализа в системе STATISTICA (рис. 3.52).
Для работы с нелинейной регрессией на панели инструментов нажимаем на кнопку переключателя модулей STATISTICA Module Switcher (рис. 3.53).
В появившемся окне (рис. 3.54) выбираем модуль Nonlinear Estimation (Нелинейное оценивание), нажав кнопку Switch to (Переключиться в) или просто дважды щелкнув мышью по названию модуля Nonlinear Estimation.
На экране появится стартовая панель модуля Nonlinear Estimation (Нелинейное оценивание) (рис. 3.55). Выбираем User-specified regression (Регрессия, определяемая пользователем), в появившемся окне (рис. 3.56) нажимаем Function to be estimated and loss function (Оцениваемая функция и функция потерь) и вводим заданную функцию (рис. 3.57). Нажимаем ОК и возвращаемся в окно User-specified regression function (Регрессионная функция, определяемая пользователем) (рис. 3.58). Снова нажимаем ОК.
Рис. 3.52. Исходная выборка данных
Рис. 3.53. Переключатель модулей Module Switcher
Рис. 3.54. Окно Переключателя модулей Module Switcher
Рис. 3.55. Окно модуля Nonlinear Estimation
Рис. 3.56. Окно User-specified regression Function
Функция потерь по умолчанию определена как сумма квадратов разностей наблюдаемых и предсказанных значений, следовательно, оценки параметров вычисляются методом наименьших квадратов.
Рис. 3.57. Окно задания оцениваемой функции и функции потерь
Рис. 3.58. Окно User-specified regression Function
В окне Model Estimation (Оценка модели) нажимаем OK и получаем таблицу параметров оценивания (рис. 3.60). Снова нажимаем OK и получаем результаты процедуры оценивания (рис. 3.61): окончательное значение функции потерь (5376.1) и коэффициент детерминации (0.847).
Чтобы увидеть результаты оценивания параметров, нажимаем Parameter estimates (Оценки параметров) и получаем следующие значения (рис. 3.62).
Рис. 3.59. Окно Model Estimation
Рис. 3.60. Таблица параметров оценивания
Рис. 3.61. Результаты процедуры оценивания
Рис. 3.62. Результаты оценки параметров модели
Для выполнения следующего задания подготовьте исходную выборку данных для проведения интеллектуального анализа в системе STATISTICA.
Прибыль P, получаемая фирмой, определяется формулой P = kx – c, где x – объем производства (т), k – цена одной тонны продукции (руб./т), с – издержки производства (руб.)
Пусть k = 100 руб./т, а переменные x и c определены следующим образом (рис. 3.63):
Рис. 3.63. Таблица исходных данных
Необходимо определить оценки параметров модели P(x):
Для этого проводим следующие действия. В стартовой панели модуля Nonlinear Estimation (Нелинейное оценивание) (рис. 3.64) выбираем User-specified regression (Регрессия, определяемая пользователем), в появившемся окне (рис. 3.65) нажимаем Function to be estimated and loss function (Оцениваемая функция и функция потерь) и вводим заданную функцию (рис. 3.66). Нажимаем ОК и возвращаемся в окно User-specified regression function (Регрессионная функция, определяемая пользователем) (рис. 3.67). Снова нажимаем ОК.
Рис. 3.64. Окно модуля Nonlinear Estimation
Рис. 3.65. Окно User-specified regression Function
Рис. 3.66. Окно задания оцениваемой функции и функции потерь
Рис. 3.67. Окно User-specified regression Function
Чтобы увидеть значения параметров и
стандартные ошибки, В окне Model
Estimation (Оценка
модели) нажимаем Parameters
and standard
errors (Значения
параметров и стандартные ошибки)
(рис. 3.68) и получаем результаты
оценивания параметров модели (рис. 3.69):
.
Рис. 3.68. Окно результатов
Рис. 3.69. Результаты оценки параметров модели
Вывод: из полученной модели видно, что максимальная прибыль достигается при x = 10, и она равна 780.
Точка самоокупаемости (такое значение x, при котором прибыль равна нулю):
P(x) = 80x – 20 = 0
x = 20/80=0.25