
- •Введение
- •Лабораторная работа 7. Множественная регрессия
- •7.1. Теоретические сведения. Базовые понятия
- •7.2. Множественная корреляция
- •7.2. Оценка надежности уравнения множественной регрессии
- •7.4. Скорректированный индекс множественной детерминации
- •7.5. Частная корреляция
- •7.6. Геометрическая интерпретация
- •7.7. Матричная форма записи
- •7.8. Мультиколлинеарность факторов
- •7.9. Свойства регрессионных остатков
- •7.10. Отбор факторов при построении уравнения множественной регрессии
- •Задание
- •Лабораторная работа 8. Фиктивные переменные в множественной регрессии
- •Теоретические сведения
- •Задание.
- •Список литературы
Санкт-Петербургский государственный горный институт им Г.В. Плеханова
(технический университет)
Кафедра информатики и компьютерных технологий
Эконометрика
МНОЖЕСТВЕННАЯ РЕГРЕССИЯ
Методические указания к лабораторным работам
для студентов специальности 080109
САНКТ-ПЕТЕРБУРГ
2009
Федеральное агентство по образованию
Санкт-Петербургский государственный горный институт им Г.В. Плеханова
(технический университет)
Кафедра информатики и компьютерных технологий
Эконометрика
МНОЖЕСТВЕННАЯ РЕГРЕССИЯ
Методические указания к лабораторным работам
для студентов специальности 080109
САНКТ-ПЕТЕРБУРГ
2009
УДК 519.86:622.3.012 (075.83)
ЭКОНОМЕТРИКА. Множественная регрессия. Методические указания к лабораторным работам / Санкт-Петербургский государственный горный институт (технический университет). Сост.: В.В. Беляев , Г.Н.Журов, Т.А. Виноградова , Т.Р. Косовцева. СПб, 2009., 61 с.
Методические указания содержат сведения, необходимые для лабораторных работ по эконометрике. Приведены необходимые теоретические сведения и примеры выполнения заданий по исследованию корреляционных и регрессионных связей между характеристиками экономического процесса, которые являются теоретической основой применения эконометрических методов. Все решения выполнены с использованием электронных таблиц MS Excel, в том числе с применением надстройки «Пакет анализа».
Методические указания предназначены для студентов специальности 080109 «Бухгалтерский учет, анализ и аудит» дневной формы обучения.
Табл.3. Рис.23. Библиогр.: 7 назв.
Научный редактор ст. преп. Е.В.Быкова
© Санкт-Петербургский горный институт им. Г.В.Плеханова, 2009 г.
Введение
Как правило, реальные экономические явления достаточно сложны и выявление характера связи между различными свойствами(параметрами) таких явлений является сложной задачей. Парная регрессия, рассмотренная в предыдущих лабораторных работах, описывает исследуемую характеристику экономического явления (отклик) в зависимости от одной объясняющей характеристики (фактора) в предположении, что влиянием других факторов можно пренебречь. Адекватное уравнение в этом случае удается построить далеко не всегда, поскольку причиной изменения отклика является одновременное воздействие множества факторов. Для того, чтобы учесть это воздействие необходимо использовать модель множественной регрессии.
Построение модели множественной регрессии включает несколько этапов:
- выбор формы связи (уравнения регрессии);
- отбор факторных признаков.
Выбор формы связи затрудняется тем, что, теоретическая зависимость между признаками может быть выражена большим числом различных функций. Поскольку уравнение регрессии строится главным образом для объяснения и количественного отображения взаимосвязей, оно должно хорошо отражать сложившиеся между откликом и исследуемыми факторами фактические связи.
В данной работе описан математический аппарат для построения линейного уравнения множественной регрессии.
Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков. Проблема отбора факторных признаков для построения моделей может быть решена на основе эвристических или многомерных статистических методов анализа. В данной работе показан метод включения, в определенной степени решающий проблему отбора факторов
Лабораторная работа 7. Множественная регрессия
Цель: освоить на практике нахождение с помощью табличного процессора MS Excel числовых характеристик множественной регрессии, а также изучить основные свойства теории корреляции.
7.1. Теоретические сведения. Базовые понятия
Будем
предполагать, что несколько переменных
(объясняющих переменных, предикторов,
факторных признаков, регрессоров)
оказывают воздействие на значения
зависимой переменной Y
(отклик, результативный признак),
т.е. имеет место зависимость.
В этом случае целесообразно строить уравнение множественной регрессии.
Множественная
регрессия – уравнение связи зависимой
переменной
с
независимыми переменными
:
Линейное уравнение множественной регрессии имеет вид
(7.1)
где
-
параметры уравнения.
Пусть имеется п-наблюдений, тогда исходные данные представимы в виде матрицы размерности п на р и вектора размерности п :
(7.2)
Все
элементы i-ой строки
и i-ого элемента вектора Yi
- результаты i-ого наблюдения. Будем
предполагать, что все наблюдения
независимы и получены примерно в
одинаковых условиях. В этом случае набор
данных, определяемый соотношениями
(7.2) называют пространственной выборкой
или пространственными данными (cross
section data).На
практике эти значения часто получаются
как результаты некоторого эксперимента,
поэтому их часто называют наблюдаемыми
или экспериментальными или эмпирическими
значениями.
Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Идея этого метода была подробно рассмотрена в лабораторной работе №5 «Линейная парная регрессия» (ЛР №5) [1]. Все соображения и выводы применимы и в случае множественной линейной регрессии с поправкой на количество факторов.
При использовании линейного уравнения множественной регрессии справедливо соотношение
,
где i, - случайные компоненты, которые также называют случайными членами или возмущениями или регрессионными остатками.
Присутствие в этом соотношении случайной компоненты i, обусловлено следующими причинами:
ошибками спецификации, то есть отбора факторов, и выбора связи между явлениями;
ошибками измерения.
Будем полагать, что относительно выполняется ряд утверждений, известных как условия Гаусса-Маркова:
Равенство нулю математического ожидания регрессионных остатков:
;
Постоянство дисперсии регрессионных остатков (гомоскедастичность остатков):
;
Отсутствие систематической связи (корреляции) между значениями регрессионных остатков в любых двух наблюдениях:
;
- неслучайные величины.
Для
определения параметров
уравнения
множественной линейной регрессии по
МНК составляется сумма
.
Она
равна сумме квадратов отклонений
(остатков) наблюдаемых
(эмпирических) значений отклика
от теоретических значений
в точке
,
при этом
- теоретические значения отклика в i-ом
наблюдении.. Величина суммы
зависит от коэффициентов
.
Цель метода наименьших квадратов
(МНК) заключается в выборе таких оценок
,
для которых сумма квадратов отклонений
(остатков) будет минимальной.
Для того чтобы найти набор коэффициентов
,
которые доставляют минимум функции
,
используем необходимое условие экстремума
функции нескольких переменных - равенство
нулю частных производных
В результате преобразований получаем следующую систему нормальных уравнений:
(7.3)
Для ее решения может быть применен любой известный метод решения системы линейных уравнений.
Коэффициенты
в уравнении (7.3) называются коэффициентами
множественной регрессии. Величина
коэффициента
показывает
среднее изменение отклика Y
при изменении фактора Xj
на единицу.
Другой вид уравнения множественной регрессии - уравнение регрессии в стандартизованном масштабе:
(7.4)
где:
-
стандартизованные переменные;
,
-
число неизвестных;
,
-
средние значения;
- средние квадратические отклонения;
-стандартизованные коэффициенты
регрессии.
В силу того, что стандартизованные
переменные заданы как центрированные
(средние значения
)
и нормированные (средние квадратические
отклонения
),
стандартизованные коэффициенты
регрессии сравнимы между собой, и с их
помощью можно ранжировать факторы по
силе их воздействия на результат.
Для определения коэффициентов уравнения
множественной регрессии в стандартизованном
масштабе так же применим МНК. Коэффициенты
можно
получить, решая систему, аналогичную
системе (7.3). Эту систему можно преобразовать,
и тогда, стандартизованные коэффициенты
регрессии определяются из следующей
системы уравнений:
, (7.5)
где
- коэффициент парной корреляции между факторами Xi и Xj,
- коэффициент парной корреляции между откликом Y и фактором Xj .
Отметим,
что связь коэффициентов множественной
регрессии
со стандартизованными коэффициентами
описывается соотношением
. (7.6)
Стандартизованный коэффициент регрессии
показывает, на сколько величин
в
среднем изменится отклик при увеличении
j-го фактора на одну величину
.
Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле :
(7.7).
Средний
коэффициент эластичности
показывает
на сколько процентов в среднем изменится
отклик при изменении его среднего
значения фактора Xj
на один процент, при неизменном значении
остальных факторов.