Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КР_Быкович_вар.70.docx
Скачиваний:
2
Добавлен:
19.01.2020
Размер:
1.79 Mб
Скачать
  1. Обработка экономических данных с использованием интегрированной системы statistica: множественная линейная регрессия.

Многомерные статистические методы среди множества возможных вероятностно-статистических моделей позволяют обоснованно выбрать ту, которая наилучшим образом соответствует исходным статистическим данным, характеризующим реальное поведение исследуемой совокупности объектов, оценить надежность и точность выводов, сделанных на основании ограниченного статистического материала.

Методы регрессионного анализа позволяют моделировать статистические зависимости между двумя или несколькими переменными и используются при прогнозных исследованиях. Сам термин «множественная регрессия» означает, что модель может содержать несколько независимых переменных, позволяющих предсказывать зависимую переменную.

Множественная линейная регрессия - выраженная в виде прямой зависимость среднего значения величины Y от двух или более других величин X1, X2, ..., Xm. Величину Y принято называть зависимой или результирующей переменной, а величины X1, X2, ..., Xm - независимыми или объясняющими переменными.

В случае множественной линейной регрессии зависимость результирующей переменной одновременно от нескольких объясняющих переменных описывает уравнение или модель

,

где  - коэффициенты функции линейной регрессии генеральной совокупности,

 - случайная ошибка.

Коэффициенты модели множественной линейной регресии, так же, как и для парной линейной регрессии, находят при помощи метода наименьших квадратов.

Метод наименьших квадратов позволяет найти такие значения коэффициентов, что сумма квадратов отклонений будет минимальной. Для нахождения коэффициентов решается система нормальных уравнений

Решение системы можно получить, например, методом Крамера:

.

Определитель системы записывается так:

Данные наблюдений и коэффициенты уравнения множественной регрессии можно представить в виде следующих матриц:

Формула коэффициентов множественной линейной регрессии в матричном виде следующая:

,

где  - матрица, транспонированная к матрице X,

 - матрица, обратная к матрице .

Решая это уравнение, мы получим матрицу-столбец b, элементы которой и есть коэффициенты уравнения множественной линейной регрессии, для нахождения которых и был изобретён метод наименьших квадратов.

В системе STATISTICA регрессионный анализ реализован в модуле Multiple Regression (Множественная регрессия). В этом модуле используются такие методы регрессионного анализа, как множественная линейная регрессия, пошаговая и гребневая регрессии. В данном модуле можно вычислить все необходимые статистики и оцепить адекватность построенных моделей. Анализировать остатки и выбросы можно при помощи широкого набора графиков. Система прогноза позволяет аналитику выполнять анализ «что-если».

Для проведения регрессионного анализа в системе STATISTICA пользователю предлагается два модуля — Множественная регрессия и Нелинейное оценивание.

Модуль Множественной регрессии включает в себя построение линейной модели и фиксированной нелинейной — полиномиалъной, экспоненциалъной, логарифмической и др., — используя как иерархические, так и пошаговые методы включения и исключения. Кроме того, модуль содержит возможность оценивания гребневой регрессии.

Модуль Нелинейное оценивание содержит процедуры оценивания любых нелинейных зависимостей между переменными, ряд из которых предлагается на стартовой панели — логистическая регрессия, регрессия экспоненциального роста и кусочно-линейная регрессия, а также определенная пользователем регрессия, задаваемая произвольной алгебраической функцией.

В ходе работы программа вычисляет все необходимые параметры и характеристики модели, оценивает ее адекватность, аиализирует остатки как с помощью описательных характеристик, так и на основе графического метода. Оба модуля имеют возможности по построению дальнейших прогнозов на основе полученного регрессионного уравнения и графического изображения зависимости предсказанных значений от объясняющих переменных.

Соседние файлы в предмете Прикладные системы обработки данных