- •Министерство сельского хозяйства рф
- •И экономического анализа
- •Пермь – 2006
- •Тема 1 Парная регрессия и корреляция в эконометрических исследованиях
- •Методика выполнения:
- •Тема 2. Множественная регрессия и корреляция
- •Тема 3. Система эконометрических уравнений
- •Тема 4. Временные ряды в эконометрических исследованиях
- •IV Система эконометрических уравнений.
- •V Временные ряды в эконометрических исследованиях.
- •Приложение 3
- •0,10, 0,05, 0,01 (Двухсторонний)
Тема 2. Множественная регрессия и корреляция
Задание 2. Построение эконометрической модели, оценка ее качества.
По приведенным в приложениях 4 – 9 данным следует:
- оценить однородность совокупности признаков;
выбрать факторы для построения модели;
определить параметры уравнения регрессии;
произвести сравнительную оценку факторов;
- проверить значимость параметров уравнения;
- оценить тесноту связи и качество модели для целей прогнозирования.
В качестве результативного признака берется «у» - урожайность зерновых и зернобобовых культур на 1 га посева зерновых (ц) по районам области;
факторные:
х1 – внесение минеральных удобрений на 1 га посевов (кг);
х2 – внесение органических удобрений на 1 га посевов (т);
х3 – площадь посевов зерновых на 1 зерноуборочный комбайн (га);
х4 – количество тракторов, приходящихся на 1000 га посевов (шт.)
Вычислительные работы могут производиться с помощью ППП Excel или на калькуляторе.
Методика выполнения:
Для построения уравнения множественной регрессии чаще всего используются функции:
- линейная у = а +b1х1 + b2х2 + b3х3 + … + bnхn ;
- степенная у = а · х1b1 · х2b2 · х3b3· … · хnbn ;
- экспонента у = е а +b1х1 + b2х2 + b3х3 + … + bnхn ;
- гипербола у =
.
При решении поставленной задачи можно использовать линейную функцию регрессии.
2. Для выбора и включения в модель наиболее существенных факторов, которые в большей степени коррелируют с результативным признаком, предварительно производится оценка однородности совокупности признаков с расчетом показателей вариации. При определении коллинеарности факторов производится анализ матрицы межфакторной корреляции, рассчитанных по программе Excel или на калькуляторе по формуле:
rxyi
=
, где
;
;
%.
Для определения парных коэффициентов корреляции можно использовать макет таблицы приложения 3.
При оценке мультиколлинеарности факторов следует учитывать, что чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.
Для формирования модели следует оставить лишь два факторных признака, отобранных на основе анализа с учетом следующих условий:
- связь между результативным признаком и факторным должна быть выше межфакторной связи;
- связь между факторами должна быть не более 0,7;
- при высокой межфакторной связи признаков отбираются факторы с меньшим коэффициентом корреляции между ними.
Таблица 4 – Матрица парных коэффициентов корреляции
|
у |
х1 |
х2 |
х3 |
х4 |
у |
1 |
|
|
|
|
х1 |
|
1 |
|
|
|
х2 |
|
|
1 |
|
|
х3 |
|
|
|
1 |
|
х4 |
|
|
|
|
1 |
Более объективную
характеристику тесноты связи дают
частные коэффициенты корреляции,
измеряющие влияние на результат фактора
«хi»
при неизменном уровне других факторов.
Линейные коэффициенты частной корреляции
можно определить по формулам:
;
;
;
3. Для оценки параметров уравнения множественной регрессии применяют МНК. Для линейных уравнений и нелинейных, приводимых к линейным, строится система нормальных уравнений, решение которых позволяет получить оценки параметров регрессии:
;
;
.
Для ее решения может быть применен метод определителей:
а =
, b1
=
, b2
=
,
n
∑x1
∑x2
где ∆ = ∑x1 ∑x12 ∑x1х2 – определитель системы
∑x2 ∑x1х2 ∑x22
∆ а , ∆ b1 , ∆ b2 – частные определители, которые получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы.
Другим видом уравнения множественной регрессии может быть уравнение регрессии в стандартизованном масштабе: ty = β1· t x1 + β2· t2 ,
где
ty
=
, txi
=
– стандартизованные переменные,
βi – стандартные коэффициенты регрессии.
К уравнению множественной регрессии в стандартизованном масштабе применим МНК. Стандартизованные коэффициенты регрессии (β – коэффициенты) определяются из следующей системы уравнений:
ryx1
= β1
+ β2
rx2x1
,
ryx2 = β1 rx2x1 + β2
Связь
коэффициентов множественной регрессии
bi
со стандартизованными коэффициентами
βi
описывается соотношением: bi
= βi
; βi
= bi
;
β1
=
; β2 =
.
Параметр
«α» определяется как α =
.
Решение системы уравнений по программе Excel дает значения коэффициентов чистой регрессии, которые позволяют произвести запись уравнения регрессии и раскрыть экономическое содержание каждого коэффициента регрессии.
4. Теснота связи
результативного признака с факторными
определяется величиной коэффициента
линейной множественной корреляции и
детерминации, которые могут быть
исчислены на основе матрицы парных
коэффициентов корреляции:
, а квадрат индекса множественной
корреляции дает коэффициент множественной
детерминации:
.
Более объективную оценку качества построенной модели дает скорректированный индекс множественной детерминации, учитывающий поправку на
число
степеней свободы:
,
где n – число
наблюдений, m
– число факторов.
5. Сравнительная оценка влияния анализируемых факторов на результативный признак производится :
средним коэффициентом эластичности «э», показывающий, на сколько процентов в среднем по совокупности изменится результат «у» от своей средней величины при изменении фактора «хi» на 1 % от своего среднего значения
;β – коэффициенты, показывающие, что, если величина фактора изменится на одно среднеквадратическое отклонение (σхi), то значение результативного признака изменится в среднем на β своего среднеквадратического отклонения:
;долю каждого фактора в общей вариации результативного признака определяют коэффициенты раздельной детерминации (отдельного определения):
при этом должно выполняться равенство:
Результаты сравнительного анализа факторов оформляются в таблице 5.
Таблица 5 – Влияние факторов на производительность труда
-
Факторы
Значения коэффициентов
эi
βi
di 2
х1
х2
6. Проверка гипотезы Но о статистической значимости уравнения регрессии и показателя тесноты связи (R2 = 0) производится по критерию F – Фишера сравнением Fфакт с Fтабл.
Fфакт
=
,
где m
– число степеней свободы множественной
дисперсии, (n
– m
– 1) – дисперсии остаточной.
Для определения
Fтабл
берется уровень значимости α = 0,05.
Из сравнения Fфакт и Fтабл можно сделать вывод о статистической значимости уравнения.
Частные критерии Fх1 и Fх2 оценивают статистическую значимость включения факторов х1 и х2 в уравнение множественной регрессии и целесообразность включения в уравнение одного фактора после другого, т.е. Fх1 оценивает целесообразность включения в уравнение фактора х1 после включения в него фактора х2. Соответственно Fх2 указывает на целесообразность включения в модель фактора х2 после фактора х1:
;
.
Фактические значения критериев сравниваются с табличными при уровне значимости α = 0,05 и формулируется вывод о целесообразности последовательного включения факторов в модель.
7. Оценка значимости коэффициентов регрессии b1 и b2 производится с помощью t – критерия Стьюдента и связана с сопоставлением их значений с величиной случайных ошибок mb1 и mb2. Расчет значений случайных ошибок достаточно сложен и трудоемок. Более простым способом расчета фактических значений t b1 и t b2 является их определение через критерий F:
;
Табличные (критические) значения t – критерия Стьюдента зависят от принятого уровня значимости α и от числа степеней свободы (n – m – 1). И если t b1 (t b2) > t табл , то делается вывод о статистической значимости каждого коэффициента регрессии.
8. На основании вычисленных параметров регрессии дается заключение о возможности прогнозирования урожайности зерновых при заданных значениях факторных признаков.
Задание 3. Проверка наличия предпосылок МНК.
По данным задания 1 произвести проверку наличия предпосылок МНК. Исследование остатков εі предполагает проверку наличия пяти предпосылок МНК. Наиболее простой способ анализа предпосылок – графический. МНК является основным методом оценки параметров уравнения регрессии. Он основан на минимизации суммы квадратов остатков. После построения уравнения регрессии проводится проверка наличия у случайных остатков (εі) ряда свойств необходимых для оценки параметров регрессии, которые представляют предпосылки МНК и желательны для практического использования результатов регрессии.
Методика выполнения:
Первая предпосылка МНК – случайный характер остатков εі . Для проверки этого свойства в табл.1,2,3 определяются значение εі и строится график зависимости εі от теоретических значений результативного признака (рис.1).
εі
0
ух
Рисунок 1. Зависимость случайных остатков εі от теоретических значений ух
Если на графике получена горизонтальная полоса остатков εі , то они представляют собой случайные величины и МНК оправдан, теоретические значения ух независимы с εі .
При этом возможны следующие случаи, если εі зависит от ух :
- остатки εі не случайны;
- остатки εі не имеют постоянной дисперсии;
- остатки εі носят систематический характер.
2. Вторая предпосылка МНК – нулевая средняя величина остатков, не зависящая от xi . Для проверки этой предпосылки строится график зависимости случайных остатков εі от факторов, включенных в регрессию xi .
εі
0 xi
Рисунок 2. Зависимость случайных остатков от величины фактора
Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений xi . Если же график показывает наличие зависимости εі от xi , то это свидетельствует о наличии систематической погрешности модели, причины которой могут быть разные. Возможно, нарушена третья предпосылка МНК и дисперсия остатков не постоянна для каждого значения фактора xi . Может быть, неправильно подобрана модель и в нее необходимо ввести дополнительные факторы или необходимо преобразовать значения «у».
Корреляция случайных остатков с факторными признаками позволяет проводить корректировку модели, например, использовать кусочно – линейные модели.
3. В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора xi остатки εі имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть на поле корреляции (рис.3).
у
х
Рисунок 3. Зависимость результативного признака от факторного
Характер расположения точек на корреляционном поле показывает наличие или отсутствие гетероскедастичности. О наличии гетероскедастичности можно судить также по данным рис.1.
4. При построении регрессионных моделей важно соблюдение четвертой предпосылки МНК – отсутствие автокорреляции остатков, т.е. значения остатков εі распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Коэффициент автокорреляции определяется по формуле линейного коэффициента корреляции:
Вспомогательные расчеты для определения коэффициента автокорреляции остатков можно производить в табл.6.
Таблица 6 – Расчет коэффициента автокорреляции остатков
№п/п |
уi |
ух |
εі= уi - ух |
ε і-1 |
εі · ε і-1 |
εі2 |
ε2 і-1 |
(εі - ε і-1)4 |
1. 2. … 20 |
|
|
|
- |
- |
- |
- |
|
Итого |
х |
х |
|
|
|
|
|
|
Среднее |
х |
|
|
|
|
|
|
х |
σ |
х |
х |
|
|
х |
х |
х |
х |
;
;
Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. Особенно важно соблюдение этой предпосылки МНК при построении регрессионных моделей по рядам динамики, где ввиду наличия тенденции последующие уровни ряда, как правило, зависят от своих предыдущих уровней.
5. Пятая предпосылка МНК о нормальном распределении остатков может быть визуально проверена путем графического изображения ряда распределения остаточных величин и сравнения с кривой нормального распределения. О соответствии эмпирического распределения теоретическому можно судить по величине эксцесса (Е ≈ 0).
, где М4
– центральный момент четвертого порядка,
который определяется по формуле:
.
6. На основании результатов проверки предпосылок МНК делается вывод о возможности использования анализируемой модели или необходимости корректировки ее :
изменение спецификации;
добавление (исключение) некоторых факторов;
преобразование исходных данных
для получения коэффициентов регрессии, которые обладают свойством несмещенности, имеют меньшее значение дисперсии остатков и обеспечивают более эффективную статистическую проверку значимости параметров регрессии.
