Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция Эконометрик.doc
Скачиваний:
10
Добавлен:
21.11.2019
Размер:
736.77 Кб
Скачать

Максимальный парный индекс корреляции

При неверном включении факторов в регрессионный анализ индекс множественной корреляции существенно отличается от индекса корреляции парной зависимости. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции.

Так, если y рассматривается как функция x и z и получен индекс множесвенной корреляции Ryzx=0,85, а индекс парной корреляции при этом более Ryx=0,82 и Ryz=0,75, то уравнение парной регрессии y=f(x) охватывало 67,2% колеблемости результативного признака под влиянием фактора x, а дополнительное включение в анализ фактора z увеличило долю объясненной вариации до 72,3%, т.е. уменьшилась доля остаточной вариации на 5,1 процентного пункта (с 32,8 до 27,7).

Расчет индекса множественной корреляции предполагает определение уравнения множественной регрессии и на его основе остаточной дисперсии:

Индекс множественной корреляции:

При линейной зависимости признаков он называется линейным коэффициентом множественной регрессии или совокупным коэффициентом корреляции:

где - стандартизованные коэффициенты регрессии;

- парные коэффициенты корреляции результата с каждым фактором.

При линейной зависимости возможно выражение через матрицу парных коэффициентов корреляции:

где - определитель матрицы парных коэффициентов корреляции;

- определитель матрицы межфакторной корреляции.

Для уравнения определитель матрицы коэффициентов парной корреляции имеет вид:

1

Δr =

1 …

1 …

… ……………………………

1

П ри вычеркивании первой строки и первого столбца получаем минор, который соответствует матрице коэффициентов парной корреляции между факторами:

1

Δr11 =

1 …

… ……… … … … … …

1

При трех переменных для двухфакторного уравнения регрессии данная формула совокупного коэффициента корреляции приводится к виду:

Индекс множественной корреляции равен совокупному коэффициенту корреляции не только при линейной зависимости рассматриваемых признаков. Тождественность этих показателей, как и в парной регрессии, имеет место и для криволинейной зависимости, нелинейной по переменным.

Так, если для фирмы модель прибыли y имеет вид

где x1 – удельные расходы на рекламу;

x2 – капитал фирмы;

x3 – доля продукции фирмы в общем объеме продаж данной группы товаров по региону;

x4 – процент увеличения объема продаж фирмы по сравнению с предыдущим годом.

Тогда независимо от того, что фактор x1 задан линейно, а факторы x2, x3, x4 – в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции. Так, если рассматриваемая модель в стандартизованном виде оказалась следующей:

а парные коэффициенты корреляции прибыли с каждым из её факторов составили

,

то коэффициент множественной детерминации окажется равным:

Тот же результат даст и индекс множественной детерминации, определенный через отношение остаточной и общей дисперсии результативного признака.

Иначе обстоит дело с криволинейной регрессией, нелинейной по оцениваемым параметрам. Рассмотрим производственную функцию Кобба-Дугласа:

где P – объем продукции;

L – затраты труда;

K – величина капитала;

b1+b2=1.

Логарифмируя её, получим линейное в логарифмах уравнение:

Оценив параметры этого уравнения по МНК, найдем теоретические значения объема продукции и остаточную сумму квадратов затем индекс детерминации (корреляции):

Важно, что МНК применяется не к исходным данным продукции, а к их логарифмам.

Индекс детерминации для нелинейных по оцениваемым параметрам функций в некоторых работах по эконометрике называют "квази – R2". Для его определения по функциям, использующим логарифмические преобразования (степенная, экспонента), сначала находят теоретические значения (в примере ), затем трансформируют их через антилогарифмы: антилогарифм т.е. находят теоретические значения результативного признака и далее определяют индекс детерминации как "квази – R2" по формуле

"квази – R2"=

Остаточная дисперсия имеет систематическую ошибку в сторону преуменьшения тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений n. Если число параметров при xj равно m и приближается к объему наблюдений, то и коэффициент (индекс) корреляции 1 даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной регрессии, который содержит поправку на число степеней свободы:

где - остаточная ∑ КО;

- общая ∑ КО;

n-m-1 df остаточной вариации;

n-1 df в целом по совокупности;

m – число параметров при переменных x;

n – число наблюдений.

Другая форма

Чем больше m, тем сильнее различия и При заданном объеме наблюдений при прочих равных условиях с увеличением числа параметров скорректированный коэффициент множественной детерминации убывает.

при слабых связях результата с факторами, в этом случае он должен считаться равным нулю. При небольшом n имеет тенденцию переоценивать долю вариации y, связанную с влиянием факторов.

Пример. Пусть при n=30 для линейного уравнения регрессии с четырьмя факторами а с учетом корректировки на число df

Чем больше n, тем меньше различаются и .

Так, при n=50 при том же и m величина