
- •Конспект лекций
- •Направление подготовки: 080100 «Экономика»
- •1. Предмет и задачи курса. 5
- •2. Спецификация переменных в уравнениях регрессии. 13
- •3. Парная и множественная регрессия. 19
- •Глава 4. Предпосылки метода наименьших квадратов 82
- •Глава 5. Нелинейные модели регрессии. 102
- •1. Предмет и задачи курса.
- •1.1 Определение эконометрики. Взаимосвязь с другими науками. Эконометрика и экономическая теория. Эконометрика и статистика. Эконометрика и экономико-математические методы.
- •1.2 Области применения эконометрических моделей. Методологические вопросы построения эконометрических моделей: обзор используемых методов.
- •2. Спецификация переменных в уравнениях регрессии.
- •2.1. Эконометрические модели: общая характеристика, различия статистического и эконометрического подхода к моделированию.
- •2. Регрессионные модели с одним уравнением.
- •3. Системы одновременных уравнений.
- •2.2.Спецификация переменных в уравнение регрессии. Ошибки спецификации.
- •3. Парная и множественная регрессия.
- •3.1.Понятие о функциональной, статистической и корреляционных связях. Основные задачи корреляционно-регрессионного анализа.
- •3.2. Уравнение регрессии, его смысл и назначение. Выбор типа математической функции при построении уравнения регрессии.
- •3.3 Линейная модель парной регрессии. Метод наименьших квадратов (мнк). Свойство оценок мнк.
- •Статистические свойства оценок метода наименьших квадратов.
- •3.4.Ковариация. Коэффициент ковариации. Показатели качества регрессии: линейный коэффициент регрессии, коэффициент детерминации.
- •3.5.Стандартная ошибка уравнения регрессии. Оценка статистической значимости показателей корреляции, параметров уравнения регрессии. Дисперсионный анализ. Критерии Фишера и Стьюдента.
- •3.6. Понятие о множественной регрессии. Классическая линейная модель множественной регрессии (клммр). Определение параметров уравнения множественной регрессии методом наименьших квадратов.
- •3.8. Оценка качества модели множественной регрессии: f-критерий Фишера, t-критерий Стьюдента. Мультиколлинеарность. Методы устранения мультиколлинеарности.
- •Глава 4. Предпосылки метода наименьших квадратов
- •4.1. Исследование остатков величин регрессии.
- •4.2. Проблема гетероскедастичности. Её экономические причины и методы выявления.
- •4.3. Обобщенный метод наименьших квадратов. (омнк).
- •Глава 5. Нелинейные модели регрессии.
- •5.1. Нелинейные модели регрессии и их линеаризация.
- •5.2. Оценка степени тесноты связи между количественными переменными.
- •5.3. Индекс корреляции, теоретическое корреляционное отношение. Коэффициент детерминации для нелинейных моделей.
- •5.4. Применение мнк для нелинейных моделей.
3.6. Понятие о множественной регрессии. Классическая линейная модель множественной регрессии (клммр). Определение параметров уравнения множественной регрессии методом наименьших квадратов.
Парная регрессия используется при моделировании, если влиянием других факторов, воздействующих на объект исследования можно пренебречь.
Например, при построении модели потребления того или иного товара от дохода, исследователь предполагает, что в каждой группе дохода одинаково влияние на потребление таких факторов, как цена товара, размер семьи, ее состав. Однако, уверенности в справедливости данного утверждения нет.
Прямой путь решения такой задачи состоит в отборе единиц совокупности с одинаковыми значениями всех других факторов, кроме дохода. Он приводит к планированию эксперимента – метод, который используется в естественнонаучных исследованиях. Экономист лишен возможности регулировать другие факторы. Поведение отдельных экономических переменных контролировать нельзя, т.е. не удается обеспечить равенство прочих условий для оценки влияния одного исследуемого фактора.
Как поступить в этом случае? Надо выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии.
Такого рода уравнения используется при изучении потребления.
Коэффициенты bj – частные производные у по факторами хi
при условии, что все остальные хi
= const
Рассмотрим современную потребительскую функцию (впервые 30е годы предложил Кейнс Дж.М.) как модель вида С = f(y,P,M,Z)
c- потребление. у – доход
P – цена, индекс стоимости.
M – наличные деньги
Z – ликвидные активы
При этом
Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функций издержек производства, в макроэкономических вопросах и других вопросах эконометрики.
В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике.
Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого их них в отдельности, а также совокупное воздействие на моделируемый показатель.
Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Она включает в себя два круга вопросов:
Отбор факторов;
Выбор уравнения регрессии.
Включение в уравнение множественной регрессии того или иного набора факторов связано с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Требования к факторам, включаемым во множественную регрессию:
они должны быть количественно измеримы, если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов; в модели стоимости объектов недвижимости: районы должны быть проранжированы).
факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.
Включение в модель факторов с высокой
интеркорреляцией, когда Rуx1<Rx1x2
для зависимости
может привести к нежелательным
последствиям – система нормальных
уравнений может оказаться плохо
обусловленной и повлечь за собой
неустойчивость и ненадежность оценок
коэффициентов регрессии.
Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются интерпретируемыми.
В уравнение предполагается, что факторы х1 и х2 независимы друг от друга, rх1х2 = 0, тогда параметр b1 измеряет силу влияния фактора х1 на результат у при неизменном значении фактора х2. Если rх1х2 =1, то с изменением фактора х1 фактор х2 не может оставаться неизменным. Отсюда b1 и b2 нельзя интерпретировать как показатели раздельного влияния х1 и х2 и на у.
Пример, рассмотрим регрессию себестоимости единицы продукции у (руб.) от заработной платы работника х (руб.) и производительности труда z (ед. в час).
у = 22600 - 5x - 10z +
коэффициент b2 = -10, показывает, что с ростом производительности труда на 1 ед. себестоимость единицы продукции снижается на 10 руб. при постоянном уровне оплаты.
Вместе с тем параметр при х нельзя интерпретировать как снижение себестоимости единицы продукции за счет роста заработной платы. Отрицательное значение коэффициента регрессии при переменной х обусловлено высокой корреляцией между х и z (rхz = 0,95). Поэтому роста заработной платы при неизменности производительности труда (не учитывая инфляции) быть не может.
Включенные во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строиться модель с набором р факторов, то для нее рассчитывается показатель детерминации R2, которая фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р факторов. Влияние других неучтенных в модели факторов оценивается как 1-R2 c соответствующей остаточной дисперсией S2.
При дополнительном включении в регрессию р+1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшается.
R2p+1≥ R2p и S2p+1 ≤ S2p.
Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включенный в анализ фактор xр+1 не улучшает модель и практически является лишним фактором.
Если для регрессии, включающей 5 факторов R2 = 0,857, и включенный 6 дало R2 = 0,858, то нецелесообразно включать в модель этот фактор.
Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической не значимости параметров регрессии по критерию t-Стьюдента.
Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости.
Отбор факторов производиться на основе теоретико-экономического анализа. Однако, он часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов осуществляется в две стадии:
на первой – подбирают факторы, исходя из сущности проблемы.
на второй – на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии.
Коэффициенты интеркоррелиции (т.е. корреляция между объясняющими переменными) позволяют исключить из моделей дублирующие факторы. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если rxixj ≥0,7.
Поскольку одним из условий построения уравнения множественной регрессии является независимость действия факторов, т.е. rхixj = 0, коллинеарность факторов нарушает это условие. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.
Рассмотрим матрицу парных коэффициентов корреляции при изучении зависимости у = f(x, z, v)
|
y |
x |
z |
V |
Y |
1 |
|
|
|
X |
0,8 |
1 |
|
|
Z |
0,7 |
0,8 |
1 |
|
V |
0,6 |
0,5 |
0,2 |
1 |
Очевидно, факторы x и z дублируют друг друга. В анализ целесообразно включит фактор z, а не х, так как корреляция z с у слабее чем корреляция фактора х с у (rуz < rух), но зато слабее межфакторная корреляция ( rzv< rхv)
Поэтому в данном случае в уравнение множественной регрессии включает факторы z и v . По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Но наиболее трудности возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью, т.е. имеет место совокупное воздействие факторов друг на друга. Наличие мультиколлинеарности факторов может означать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой, и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарности факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью МНК.
Если рассмотренная регрессия у = a + bx + cx + dv + , то для расчета параметров, применяется МНК
Sy
= Sфакт +S
или
=
+
общая сумма = факторная + остаточная
квадратов отклонений
В свою очередь, при независимости факторов друг от друга, выполнимо равенство:
S
= Sx
+Sz +
Sv
Суммы квадратов отклонения, обусловленных влиянием соответствующих факторов.
Если же факторы интеркоррелированы, то данное равенство нарушается.
Включение в модель мультиколлинеарных факторов нежелательно в силу следующего:
затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл;
оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.
Для оценки мультиколлинеарных факторов будем использовать определитель матрицы парных коэффициентов корреляции между факторами. Если бы факторы не коррелировали между собой, то матрица парных коэффициентов была бы единичной.
y = a + b1x1 + b2x2 + b3x3 +
Если же между факторами существует
полная линейная зависимость, то:
Чем ближе к 0 определитель, тем сильнее межколлинеарность факторов и ненадежны результаты множественной регрессии. Чем ближе к 1, тем меньше мультиколлинеарность факторов.
Оценка значимости мультиколлинеарности
факторов может быть проведена методами
испытания гипотезы 0 независимости
переменных H0:
Доказано, что величина
имеет приближенное распределение
с
степенями свободы. Если фактически
значение
превосходит табличное (критическое)
то гипотеза H0
отклоняется. Это означает, что
,
недиагональные коэффициенты указывают
на коллинеарность факторов.
Мультиколлинеарность считается
доказанной.
Через коэффициенты множественной
детерминации можно найти переменные,
ответственные за мультиколлинеарность
факторов. Для этого в качестве зависимой
переменной рассматривается каждый из
факторов. Чем ближе значение R2
к 1, тем сильнее проявляется
мультиколлинеарность. Сравнивая между
собой коэффициенты множественной
детерминации
и т.п.
Можно выделить переменные, ответственные за мультиколлинеарность, следовательно, решить проблему отбора факторов, оставляя в уравнения факторы с минимальной величиной коэффициента множественной детерминации.
Существует ряд походов преодоления сильной межфакторной корреляции. Самый простой путь устранения МК состоит в исключении из модели одного или несколько факторов.
Другой подход связан с преобразованием факторов, при котором уменьшается корреляция между ними.
Если y = f(x1, x2, x3), то возможно построение следующего совмещенного уравнения:
у = a + b1x1 + b2x2 + b3x3 + b12x1x2 + b13x1x3 + b23x2x3 + .
Это уравнение включает взаимодействие первого порядка (взаимодействие двух факторов).
Возможно включение в уравнение взаимодействий и более высокого порядка, если будет доказано их статистически значимость по F-критерию
b123x1x2х3 – взаимодействие второго порядка.
Если анализ совмещенного уравнения показал значимость только взаимодействия факторов х1 и х3, то уравнение будет имеет вид:
у = a + b1x1 + b2x2 + b3x3 + b13x1x3 + .
Взаимодействие факторов х1 и х3 означает, что на разных уровнях фактора х3 влияние фактора х1 на у будет неодинаково, т.е. оно зависит от значения фактора х3. На рис. 3.1 взаимодействие факторов представляет непараллельными линями связи с результатом у. И наоборот, параллельные линии влияние фактора х1 на у при разных уровнях фактора х3 означают отсутствие взаимодействия факторов х1 и х3.
Рис 3.1. Графическая иллюстрация взаимодействия факторов.
а - х1 влияет на у, причем это влияние одинаково при х3=В1, так и при х3=В2 (одинаковый наклон линий регрессии), что означает отсутствие взаимодействия факторов х1 и х3;
б – с ростом х1 результативный признак у возрастает при х3=В1, с ростом х1 результативный признак у снижается при х3=В2. Между х1 и х3 существует взаимодействие.
Совмещенные уравнения регрессии строятся, например, при исследовании эффекта влияния на урожайность разных видов удобрений (комбинации азота и фосфора).
Решению проблемы устранения мультиколлинеарности факторов может помочь и переход к устранениям приведенной формы. С этой целью в уравнение регрессии производится подстановка рассматриваемого фактора через выражение его из другого уравнения.
Пусть, например, рассматривается
двухфакторная регрессия вида
a + b1x1
+ b2x2,
для которой x1 и x2
обнаруживают высокую корреляцию. Если
исключить один из факторов, то мы придем
к уравнению парной регрессии. Вместе с
тем можно оставить факторы в модели, но
исследовать данное двухфакторное
уравнение регрессии совместно с другим
уравнением, в котором фактор (например
х2) рассматривается как зависимая
переменная. Предположим, известно, что
.
Постановляя это уравнение в искомое
вместо х2, получим:
Или
Если
,
то разделив обе части равенства на
,
получаем уравнение вида:
,
которое представляет собой приведенную форму уравнения для определения результативного признака у. Это уравнение может быть представлено в виде:
.
К нему для оценки параметров может быть применен МНК.
Отбор факторов, включаемых в регрессию, является одним из важнейших этапов практического использования методов регрессии. Походы к отбору факторов на основе показателей корреляции могут быть разные. Они приводят построение уравнения множественной регрессии соответственно разным методикам. В зависимости от того, какая методика построение уравнения регрессии принята, меняется алгоритм ее решения на ЭВМ.
Наиболее широкое применение получили следующие методы построение уравнения множественной регрессии:
метод исключения;
метод включения;
шаговый регрессионный анализ.
Каждый из этих методов по-своему решает проблему отбора факторов, давая в целом близкие результаты – отсев факторов из полного его отбора (метод исключение), дополнительное введение фактора (метод включения), исключение ранее введенного фактора (шаговый регрессионный анализ).
На первый взгляд может показаться, что матрица парных коэффициентов корреляции играет главную роль в отборе факторов. Вместе с тем вследствие взаимодействия факторов парные коэффициенты корреляции не могут в полной мере решать вопрос о целесообразности включения в модель того или иного фактора. Эту роль выполняют показатели частной корреляции, оценивающие в чистом виде тесноту связи фактора с результатом. Матрица частных коэффициентов корреляции наиболее широко используется в процедура отсева фактора. При отборе факторов рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6-7 раз меньше объема совокупности, по которой строит регрессии. Если это отношение нарушено, то число степеней свободны остаточной вариаций очень мало. Это приводит к тому, что параметры уравнения регресс оказываются статистически незначимыми, а F-критерий меньше табличного значения.
Классическая линейная модель множественной регрессии.
y – регрессанд
xi – регрессоры
u – случайная составляющая.
Модель множественной регрессии является обобщением модели парной регрессии на многомерный случай.
Независимые переменные (х) предполагаются не случайными (детерминированными) величинами.
Переменная х1 = xi1 = 1 называется вспомогательной переменной для свободного члена и еще в уравнениях она называется параметром сдвиги.
«y» и «u» в (2) являются реализациями случайной величины.
- называется также параметром сдвига.
Для статистической оценки параметров регрессионной модели необходим набор (множество) данных наблюдений независимых и зависимых переменных. Данные могут быть представлены в виде пространственных данных или временных рядов наблюдений. Для каждого из таких наблюдений согласно линейной модели можно записать:
Векторно-матричная запись системы (3).
Введем следующие обозначения:
вектор-столбец независимой переменной (регрессанда)
размерность
матрицы (n·1)
Матрица наблюдений независимых переменных (регрессоров):
размер (n×k)
Вектор-столбец параметров:
- матричная запись системы уравнений
(3). Она проще и компактнее.
Предпосылки классической многомерной линейной регрессионной модели.
Сформируем предпосылки, которые необходимы при выводе уравнении для оценок параметров модели, изучения их свойств и тестирования качества модели. Эти предпосылки обобщают и дополняют предпосылки классической модели парной линейной регрессии (условия Гаусса – Маркова).
Предпосылка 1. независимые переменные не случайны и измеряются без ошибок. Это означает, что матрица наблюдений Х – детерминированная.
Предпосылка 2. (первое условие Гаусса – Маркова): Математическое ожидание случайной составляющей в каждом наблюдении равно нулю.
Предпосылка 3. (второе условие Гаусса – Маркова): теоретическая дисперсия случайной составляющей одинакова для всех наблюдений.
(Это гомоскедастичность)
Предпосылка 4. (третье условие Гаусса
– Маркова): случайные составляющие
модели не коррелированны для различных
наблюдений. Это означает, что теоретическая
ковариация
Предпосылки (3) и (4) удобно записать, используя векторные обозначения:
матрица
- симметричная матрица.
- единичная матрица размерности n, верхний
индекс Т – транспонирование.
Матрица
называется теоретической матрицей
ковариаций (или
ковариационной матрицей).
Предпосылка 5. (четвертое условие Гаусса – Маркова): случайная составляющая и объясняющие переменные не коррелированны (для модели нормальной регрессии это условие означает и независимость). В предположении, что объясняющие переменные не случайные, эта предпосылка в классической регрессионной модели всегда выполняется.
Предпосылка 6. коэффициенты регрессии – постоянные величины.
Предпосылка 7. уравнение регрессии идентифицируемо. Это означает, что параметры уравнения в принципе оцениваемы, или решение задачи оценивания параметров существует и единственно.
Предпосылка 8. регрессоры не коллинеарны. В таком случае матрица наблюдений регрессоров должна быть полного ранга. (ее столбцы должны быть линейно независимы). Данная предпосылка тесно связана с предыдущей, так как при применении для оценивания коэффициентов МНК ее выполнение гарантирует идентифицируемость модели (если количество наблюдений больше количества оцениваемых параметров).
Предпосылка 9. Количество наблюдений больше количества оцениваемых параметров, т.е. n>k.
Все эти 1-9 предпосылки одинаково важны, и только при их выполнении можно применять классическую регрессионную модель на практике.
Предпосылка о нормальности случайной составляющей. При построении доверительных интервалов для коэффициентов модели и прогнозов зависимой переменной, проверки статистических гипотез относительно коэффициентов, разработке процедур для анализа адекватности (качества) модели в целом необходимо предположение о нормальном распределении случайной составляющей. С учетом этой предпосылки модель (1) называется классической многомерной линейной моделью регрессии.
Если предпосылки не выполняются, то необходимо строить так называемые обобщенные модели линейной регрессии. От того, насколько корректно (правильно) и осознанно используются возможности регрессионного анализа, зависит успех эконометрического моделирования, и в конечном счете, обоснованность принимаемых решений.
Выбор формы уравнения регрессии.
Для построения уравнения множественной регрессии чаще используются следующие функции
линейная:
.
степенная:
.
экспоненциальная:
.
гипербола:
В виду четкой интерпретации параметров наиболее широко используются линейная и степенная функции. В линейной множественной регрессии параметры при Х называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне.
Пример. Предположим, что зависимость расходов на продукты питания по совокупности семей характеризуется следующим уравнением:
где у – расходы семьи за месяц на продукты питания, тыс.руб.;
х1 – месячный доход на одного члена семьи, тыс.руб.;
х2 – размер семьи, человек.
Анализ данного уравнения позволяет сделать выводы – с ростом дохода на одного члена семьи на 1 тыс. руб. расходы на питание возрастут в среднем на 350 руб. при том же среднем размере семьи. Иными словами, 35% дополнительных семейных расходов тратится на питание. Увеличение размера семьи при тех же ее доходах предполагает дополнительный рост расходов на питание на 730 руб. Параметр а не подлежит экономической интерпретации.
При изучении вопросов потребления коэффициенты регрессии рассматривают как характеристики предельной склонности к потреблению. Например, если функции потребления Сt имеет вид:
Сt = a+b0 Rt + b1 Rt-1 +,
то потребление в период времени t зависит от дохода того же периода Rt и от дохода предшествующего периода Rt-1. Соответственно коэффициент b0 обычно называют краткосрочной предельной склонностью к потреблению. Общим эффектом возрастания как текущего, так и предыдущего дохода будет рост потребления на b= b0 + b1. Коэффициент b рассматривается здесь как долгосрочная склонность к потреблению. Так как коэффициенты b0 и b1 >0, то долгосрочная склонность к потреблению должна превосходить краткосрочную b0. Например, за период 1905 – 1951 гг. (за исключением военных лет) М.Фридман построил для США следующую функцию потребления: Сt = 53+0,58 Rt+0,32 Rt-1 с краткосрочной предельной склонностью к потреблению 0,58 и с долгосрочной склонностью к потреблению 0,9.
Функция потребления может рассматриваться также в зависимости от прошлых привычек потребления, т.е. от предыдущего уровня потребления
Сt-1:
Сt = a+b0 Rt +b1 Сt-1 +,
В этом уравнении параметр b0 также характеризует краткосрочную предельную склонность к потреблению, т.е. влияние на потребление единичного роста доходов того же периода Rt. Долгосрочную предельную склонность к потреблению здесь измеряет выражение b0/(1- b1).
Так, если уравнение регрессии составило:
Сt = 23,4+0,46 Rt +0,20 Сt-1 +,
то краткосрочная склонность к потреблению равна 0,46, а долгосрочная – 0,575 (0,46/0,8).
В степенной функции
коэффициенты bj
являются коэффициентами эластичности.
Они показывают, на сколько процентов
изменяется в среднем результат с
изменением соответствующего фактора
на 1% при неизменности действия других
факторов. Этот вид уравнения регрессии
получил наибольшее распространение в
производственных функциях, в исследованиях
спроса и потребления.
Предположим, что при исследовании спроса на мясо получено уравнение:
где у – количество спрашиваемого мяса
х1 – цена
х2 – доход.
Следовательно, рост цен на 1% при том же доходе вызывает снижение спроса на мясо в среднем на 2.63%. Увеличение дохода на 1% обусловливает при неизменных ценах рост спроса на 1.11%.
В производственных функциях вида:
где P – количество продукта, изготавливаемого с помощью m производственных факторов (F1, F2, ……Fm).
b – параметр, являющийся эластичностью количества продукции по отношению к количеству соответствующих производственных факторов.
Экономический смысл имеют не только коэффициенты b каждого фактора, но и их сумма, т.е. сумма эластичностей: В = b1 +b2+……+bm. Эта величина фиксирует обобщенную характеристику эластичности производства. Производственная функция имеет вид
где Р – выпуск продукции
F1 – стоимость основных производственных фондов
F2 - отработано человеко-дней
F3 – затраты на производство
Эластичность выпуска по отдельным факторам производства составляет в среднем 0,3% с ростом F1 на 1% при неизменном уровне других факторов; 0,2% - с ростом F2 на 1% также при неизменности других факторов производства и 0,5% с ростом F3 на 1% при неизменном уровне факторов F1 и F2. Для данного уравнения В = b1 +b2+b3 = 1. Следовательно, в целом с ростом каждого фактора производства на 1% коэффициент эластичности выпуска продукции составляет 1%, т.е. выпуск продукции увеличивается на 1%, что в микроэкономике соответствует постоянной отдаче на масштаб.
При практических расчетах не всегда
.
Она может быть как больше, так и меньше
1. В этом случае величина В фиксирует
приближенную оценку эластичности
выпуска с ростом каждого фактора
производства на 1% в условиях увеличивающейся
(В>1) или уменьшающейся (В<1) отдачи на
масштаб.
Так, если
,
то с ростом значений каждого фактора
производства на 1% выпуск продукции в
целом возрастает приблизительно на
1.2%.
При оценке параметров модели по МНК мерой (критерием) количества подгонки эмпирической регрессионной модели к наблюдаемой выборке служит сумма квадратов ошибок (остатков).
где е = (e1,e2,…..en)T;
Для уравнения применили равенство:
- скалярная функция
Система нормальных уравнений (1) содержит k линейных уравнений относительно k неизвестных i = 1,2,3……k
=
(2)
Перемножив (2) получим развернутую форму записи систем нормальных уравнений
Оценка коэффициентов
3.7. Стандартизированные коэффициенты регрессии, их интерпретация. Парные и частные коэффициенты корреляции. Множественный коэффициент корреляции. Множественный коэффициент корреляции и множественный коэффициент детерминации. Оценка надежности показателей корреляции.
Параметры уравнения множественной регрессии оцениваются, как и в парной регрессии, методом наименьших квадратов (МНК). При его применении строится система нормальных уравнений, решение которой и позволяет получить оценки параметров регрессии.
Так, для уравнения
система нормальных уравнений составит:
Ее решение может быть осуществлено методом определителей:
,
,…,
,
где – главный определитель системы;
а, b1, …, bp – частные определители.
При этом
а а, b1, …, bp получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы.
Возможен и иной подход в определении параметров множественной регрессии, когда на основе матрицы парных коэффициентов корреляции строится уравнение регрессии в стандартизованном масштабе:
где
- стандартизованные переменные
,
для которых среднее значение равно нулю
,
а среднее квадратическое отклонение
равно единице:
;
- стандартизованные коэффициенты
регрессии.
Применяя МНК к уравнению множественной регрессии в стандартизованном масштабе, после соответствующих преобразований получим систему нормальных вида
Решая ее методом определителей, найдем параметры – стандартизованные коэффициенты регрессии (-коэффициенты).
Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результат, если соответствующий фактор хi изменится на одну сигму при неизменном среднем уровне других факторов. В силу того, что все переменные заданы как центрированные и нормированные, стандартизованные коэффициенты регрессии I сравнимы между собой. Сравнивая их друг с другом, на результат можно ранжировать факторы по силе их воздействия. В этом основное достоинство стандартизованных коэффициентов регрессии в отличие от коэффициентов «чистой» регрессии, которые несравнимы между собой.
Пример. Пусть функция издержек производства у (тыс. руб.) характеризуется уравнением вида
где х1 – основные производственные фонды;
х2 – численность занятых в производстве.
Анализируя его, мы видим, что при той же занятости дополнительный рост стоимости основных производственных фондов на 1 тыс. руб. влечет за собой увеличение затрат в среднем на 1,2 тыс. руб., а увеличение численности занятых на одного человека способствует при той же технической оснащенности предприятий росту затрат в среднем на 1,1 тыс. руб. Однако это не означает, что фактор х1 оказывает более сильное влияние на издержки производства по сравнению с фактором х2. Такое сравнение возможно, если обратиться к уравнению регрессии в стандартизованном масштабе. Предположим, оно выглядит так:
Это означает, что с ростом фактора х1 на одну сигму при неизменной численности занятых затрат на продукцию увеличиваются в среднем на 0,5 сигмы. Так как 1 < 2 (0,5 < 0,8), то можно заключить, что большее влияние оказывает на производство продукции фактор х2, а не х1, как кажется из уравнения регрессии в натуральном масштабе.
В парной зависимости стандартизованный коэффициент регрессии есть не что иное, как линейный коэффициент корреляции rxy. Подобно тому, как в парной зависимости коэффициент регрессии и корреляции связаны между собой, так и в множественной регрессии коэффициенты «чистой» регрессии bi связаны со стандартизованными коэффициентами регрессии i, а именно:
(3.1)
Это позволяет от уравнения регрессии в стандартизованном масштабе
(3.2)
переход к уравнению регрессии в натуральном масштабе переменных:
Параметр а определяется как
(3.3)
Рассмотренный смысл стандартизованных коэффициентов регрессии позволяет их использовать при отсеве факторов – из модели исключаются факторы с наименьшим значением j.
Компьютерные программы построения уравнения множественной регрессии в зависимости от использованного в них алгоритма решения позволяют получить либо только уравнение регрессии для исходных данных, либо, кроме того, уравнение регрессии в стандартизованном масштабе.
При нелинейной зависимости признаков, приводимой к линейному виду, параметры множественной регрессии также определяются МНК с той лишь разницей, что он используется не к исходной информации, а к преобразованным данным. Так, рассматривая степенную функцию
мы преобразовываем ее в линейный вид:
где переменные выражены в логарифмах.
Далее обработка МНК та же, что и описана выше: строится система нормальных уравнений и определяются параметры lg a, b1, b2, … bp. Потенцируя значение lg a, найдем параметр а и соответственно общий вид уравнения степенной функции.
Поскольку параметры степенной функции представляют собой коэффициенты эластичности, то они сравнимы по разным факторам.
Пример. При исследовании спроса на масло получено следующее уравнение:
где
у – количество масла на душу населения (кг);
х1 – цена (руб.)
х2 – доход на душу населения (тыс. руб.).
Анализируя уравнение, видим, что с ростом цены на 1% при том же доходе спрос снижается в среднем на 0,858%, а рост дохода на 1% при неизменных ценах вызывает увеличение спроса в среднем на 1,126%. В виде степенной функции данное уравнение примет вид:
При других нелинейных функциях методика оценки параметров МНК осуществляется так же. В отличие от предыдущих функций параметры более сложных моделей не имеют четкой экономической интерпретации: они не являются показателями силы связи и ее эластичности. Это не исключает возможности их применения, но делает их менее привлекательными в практических расчетах.
Частные уравнения регрессии
На основе линейного уравнения множественной регрессии
могут быть найдены частные уравнения регрессии:
т.е. уравнения регрессии, которые связывают результативный признак с соответствующими факторами х при закреплении других учитываемых во множественной регрессии факторов на среднем уровне. Частные уравнения имеют следующий вид:
При подстановке в эти уравнения средних значений соответствующих факторов они принимают вид парных уравнений линейной регрессии, т.е. имеем:
г
де
В отличие от парной регрессии частные уравнения регрессии характеризуют изолированное влияние фактора на результат, ибо другие факторы закреплены на неизменном уровне. Эффекты влияния других факторов присоединены в них к свободному члену уравнения множественной регрессии.
Это позволяет на основе частных уравнений регрессии определять частные коэффициенты эластичности:
(3.4)
где bi – коэффициенты регрессии для фактора хi в уравнении множественной регрессии;
– частное уравнение регрессии.
Пример. Предположим, что по ряду регионов множественная регрессия величины импорта на определенный товар у относительно отечественного его производства х1, изменения запасов х2 и потребления на внутреннем рынке х3 оказалась следующей:
При этом средние значения для рассматриваемых признаков составили:
На основе данной информации могут найдены средние по совокупности показатели эластичности:
(3.5)
Для данного примера они окажутся равными:
т.е. с ростом величины отечественного производства на 1% размер импорта в среднем по совокупности регионов возрастает на 1,053% при неизменных запасах и потреблении семей.
Для второй переменной коэффициент эластичности составляет:
т.е. с ростом изменения запасов на 1% при неизменном производстве и внутреннем потреблении величина импорта увеличивается в среднем на 0,056%.
Для второй переменной коэффициент эластичности составляет:
т.е. при неизменном объеме производства и величины запасов с увеличением внутреннего потребления на 1% импорт товар возрастает в среднем по совокупности регионов на 1,987%. Средние показатели эластичности можно сравнивать друг с другом и соответственно ранжировать факторы по силе их воздействия на результат. В рассматриваемом примере наибольшее воздействие на величину импорта оказывает размер внутреннего потребления товара х3, а наименьшее – изменение запасов х2.
Наряду со средними показателями эластичности в целом по совокупности регионов на основе частных уравнений регрессии могут быть определены частные коэффициенты эластичности для каждого региона. Частные уравнения регрессии в нашем случае составят:
т.е.
т.е.
т.е.
Подставляя в данные уравнения фактические
значения по отдельным регионам
соответствующих факторов, получим
значения моделируемого показателями
при заданном уровне одного значения и
средних значениях других факторов. Эти
расчетные значения результативного
признака используются для определения
частных коэффициентов по приведенной
выше формуле. Так, если, например, в
регионе х1=160,2; х2=4,0; х3=190,5,
то частные коэффициенты эластичности
составят:
Как видим, частные коэффициенты эластичности для региона несколько отличаются от аналогичных средних показателей по совокупности регионов. Они могут быть использованы при принятии решений относительно развития конкретных регионов.
Множественная корреляция
Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации.
Показатель множественной корреляции характеризует тесноту рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат.
Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:
,
(3.6)
где 2y – общая дисперсия результативного признака;
ост2 – остаточная дисперсия для уравнения у = (х1,х2,….,xp).
Методика построения индекса множественной корреляции аналогична построению индекса корреляции для парной зависимости. Границы его изменения те же: от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции:
При правильном включении факторов в регрессионной анализ величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной зависимости. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем, четвертом знаках). Отсюда ясно, что, сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение регрессии того фактора. Так, если y рассматривается как функция x и z и получен индекс множественной корреляции Ryzx = 0,85, а индексы парной корреляции при этом были Ryx = 0,82 и Ryz = 0,75, то совершенно ясно, что уравнение парной регрессии у = (х) охватывало 67,2% результативного признака под влиянием фактора x а дополнительное анализ фактора z увеличило долю объясненной вариации до 72,3%, т.е. уменьшилась доля остаточной вариации на 5,1 проц. Пункта (с 32,8 до 27,7 %).
Расчет индекса множественной корреляции предполагает определение уравнения множественной регрессии и на его основе остаточной дисперсии:
.
Можно пользоваться следующей формулой индекса множественной корреляции:
.
(3.7)
При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением:
(3.8)
где
-
стандартизованные коэффициенты
регрессии;
-
парные коэффициенты корреляции результата
с каждым фактором.
В справедливости данной формулы можно убедиться, если обратиться к линейному уравнению множественной регрессии в стандартизованном масштабе и определить для его индекс множественной корреляции как
(3.9)
Или, что то же самое,
(3.10)
В формуле (3.10) числитель подкоренного
выражения представляет собой факторную
сумму квадратов отклонений для
стандартизованных переменных:
Поскольку
и
,
индекс множественной корреляции для
линейной уравнения в стандартизованном
масштабе можно записать в виде
(3.11)
Подставим в эту формулу выражение
через
получим:
Так как
то
получим формулу индекса множественной
корреляции следующего вида (3.8):
Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции, или, что то же самое, совокупного коэффициента корреляции.
Возможно также при линейной зависимости определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции:
(3.12)
где r – определитель матрицы парных коэффициентов корреляции;
r11 – определитель матрицы межфакторной корреляции.
Для уравнения
определитель
матрицы коэффициентов парной корреляции
примет вид:
.
(3.13)
Определитель более низкого порядка r11 остается, когда вычеркиваются из матрицы коэффициентов парной корреляции первый столбец и первая строка, что и соответствует матрице коэффициентов парной корреляции между факторами:
.
(3.14)
Как видом, величина множественного коэффициента корреляции зависит не только от корреляции результата с каждым из факторов, но и от межфакторной корреляции. Рассмотренная формула позволяет определить совокупный коэффициент корреляции, не обращаясь при этом к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.
При трех переменных для двухфакторного уравнения регрессии данная формула совокупного коэффициента корреляции легко приводится к следующему виду:
(3.15)
Индекс множественной корреляции равен совокупному коэффициенту корреляции не только при линейной зависимости рассматриваемых признаков. Тожественность этих показателей, как и а парной регрессии, имеет место и для криволинейной зависимости, нелинейной по переменным. Так, если фирмы модель прибыли у имеет вид
,
где х1 – удельные расходы на рекламу;
х2 - капитал фирмы;
х3 – доля продукции фирмы в общем объеме продаж данной группы товаров по региону;
х4 – процент увеличения объема продаж фирмы по сравнению с предыдущим годом.
Тогда независимо от того; что фактор х1 задан линейно, а факторы х2, х3, х4 – в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции. Так, если рассматриваемая модель в стандартизованном виде оказалась следующей:
а парные коэффициенты корреляции прибыли с каждым из ее факторов составили
,
то коэффициент множественной детерминации окажется равным:
Тот же результат даст и индекс множественной детерминации, определенный через соотношение остаточной и общей дисперсии результативного признака.
Иначе обстоит дело с криволинейной регрессией, нелинейной по оцениваемым параметрам. Предположим, что рассматривается производственная функция Кобба – Дугласа:
где P – объем продукции;
L – затраты труда;
K – величина капитала;
b1 + b2 = 1.
Логарифмируя ее, получим линейное в логарифмах уравнение
Оценив параметры этого уравнения по
МНК, можно найти теоретические значения
объема продукции
и
соответственно остаточную сумму
квадратов
,
которая используется в расчете индекса
детерминации (корреляции):
Однако при этом нельзя забывать, что
МНК применяется не к исходным данным
продукции, а к их логарифмам. Поэтому в
индексе корреляции с общей суммой
квадратов
сравнивается
остаточная дисперсия, которая определена
по теоретическим значениям логарифмов
продукции:
–
антилогарифм
,
т.е. по
путем
потенцирования нашли
.
В показателях множественной корреляции (индекс и коэффициент) используется остаточная дисперсия, которая имеет систематическую ошибку в сторону преуменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений n. Если число параметров при xj равно m и приближается к объеме наблюдений, то остаточная дисперсия будет близка к нулю и коэффициент (индекс) корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной регрессии.
Скорректированный индекс множественной
корреляции содержит поправку на число
степеней свободы, а именно остаточная
сумму квадратов
делится
на число степеней свободы остаточной
вариации (n-m-1),
а общая сумма квадратов отклонений
-
на число степеней свободы в целом по
совокупности (n – 1).
Формула скорректированного индекса множественно детерминации имеет вид:
, (3.17)
где m – число параметров при переменных х;
n – число наблюдений.
Поскольку
,
то величину скорректированного индекса
детерминации можно представить в виде
(3.18)
Чем больше величина m,
тем сильнее различия
и
.
Для линейной зависимости признаков
скорректированный коэффициент
множественной корреляции определяется
по той же формуле, что и индекс множественной
корреляции, т.е. как корень квадратный
из
.
Отличие состоит лишь в том, что в линейной
зависимости под m
подразумевается число факторов включенных
в регрессионную модель, а в криволинейной
зависимости m – число
параметров при х и их преобразованиях
(х2, lnx и др.), которое
может быть больше числа факторов как
экономических переменных. Так, если у
= f (x1,
x2), то для линейной
регрессии m=2, а для регрессии
вида
число параметров при х равно 4, т.е. m = 4. При заданном объеме наблюдений при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. Его величина может стать и отрицательной при слабых связях результата с факторами. В этом случае он должен считаться равным нулю. При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.
Пример. Предположим, что при n = 30 для линейного уравнения регрессии с четырьмя факторами R2 = 0,7, а с учетом корректировки на число степеней свободы
.
Чем больше объем совокупности, по которой
исчислена регрессия, тем меньше
различаются показатели
и R2. Так, уже при n
= 50 при том же значении R2
и m величина
составит 0,673.
В статистических пакетах прикладных программ в процедуре множественной регрессии обычно приводится скорректированный коэффициент (индекс) множественной корреляции (детерминации). Величина коэффициента множественной детерминации используется для оценки качества регрессионной модели. Низкое значение коэффициента (индекса) множественной корреляции означает, что в регрессионную модель не включены существенные факторы – с одной стороны, а с другой стороны – рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. Требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.
Частная корреляция
Как было показано выше, ранжирование факторов, участвующих в множественной линейной регрессии, может быть проведено через стандартизованные коэффициенты регрессии ( - коэффициенты). Эта же цель может быть достигнута с помощью частных коэффициентов корреляции – для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включения того или иного фактора в модель показывается величиной показателя частной корреляции.
Частные коэффициенты (или индексы) корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.
Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.
Пример. Предположим, что зависимость объема продукции у от затрат труда x1 характеризуется уравнением
,
Подставив в это уравнение фактические
значения x1, найдем
теоретические величины объема продукции
и соответствующую величину остаточной
дисперсии
:
Включив уравнение регрессии дополнительный фактор x2- теоретическую оснащенность производства, получим уравнение регрессии вида
Для этого уравнения остаточная дисперсия,
естественно, меньше. Предположим, что
,
а
.
Чем большее число факторов включено в
модель, тем меньше величина остаточной
дисперсии.
Сокращение остаточно дисперсии за счет дополнительного включения фактора x2 составит:
Чем больше доля этого сокращения в
остаточной вариации до введения
дополнительного фактора, т. е. в
,
тем теснее связь между y
и x2 при постоянном
действии фактора x1.
Корень квадратный из этой величины и
есть индекс частной корреляции,
показывающий в «чистом» виде тесноту
связи y с x2.
Следовательно, чистое влияние фактора x2 на результат y можно определить как
(3.19)
Аналогично определяется и чистое влияние на результат фактора x1:
(3.20)
Если предположить, что
,
то частные показатели корреляции для
уравнения
составят
и
Сравнивая полученные результаты, видим, что более сильное воздействие на объем продукции оказывает техническая оснащенность предприятий.
Если выразить остаточную дисперсию через показатель детерминации, то формула коэффициента частной корреляции примет вид:
,
(3.21)
Соответственно
(3.22)
Рассмотренные показатели частной корреляции принято называть коэффициентами (индексами) частной корреляции первого порядка, ибо они фиксируют тесноту связи двух переменных при закреплении (элиминировании влияния) одного фактора.
Если рассматривается регрессия с числом
факторов
,
то возможно частные коэффициенты
корреляции не только первого, но и
второго, третьего, …, (
)
порядка, т. е. влияние фактора x1
можно оценить при разных условиях
независимости действия других факторов:
-при
постоянном действии фактора x2;
-при
постоянном действии факторов x2
и x3;
-при
неизменном действии всех факторов,
включенных в уравнение регрессии.
Сопоставление коэффициентов частной корреляции разного порядка по мере увеличения числа включаемых факторов показывает процесс “очищения” зависимости результативного признака с исследуемым фактором.
Например, при изучении зависимости себестоимости добычи угля от объема добычи парный коэффициент корреляции оказался равным -0,75, характеризуя довольно тесную обратную связь признаков. Частный коэффициент корреляции этой зависимости при постоянном влиянии уровня производительности труда составил -0,58 и демонстрирует хотя и достаточную, но уже заметно менее тесную связь себестоимости и объема добычи. Закрепив на постоянном уровне также и размер основных фондов, теснота связи рассматриваемых признаков оказывается еще более низкой, т. е. -0,52.
Хотя частная корреляция разных порядков и может представлять аналитический интерес, в практических исследованиях предпочтение отдают показателям частной корреляции самого высокого порядка, ибо именно эти показатели являются дополнением к уравнению множественной регрессии.
В общем виде при наличии факторов для уравнения
Коэффициент частной корреляции, измеряющий влияние на у фактора xi при неизменном уровне других факторов, можно определить по формуле
(3.23)
Где
-
множественный коэффициент детерминации
всего комплекса
факторов
с результатом;
-
тот же показатель детерминации, но без
введения в модель фактора xi.
При i=1 формула коэффициента частной корреляции примет вид:
(3.24)
Данный коэффициент частной корреляции позволяет измерить тесноту связи между y и x1 при неизменном уровне всех других факторов, включенных в уравнение регрессии.
Порядок частного коэффициента корреляции
определяется количеством факторов,
влияние которых исключается. Например,
-
коэффициент частной корреляции первого
порядка. Соответственно коэффициенты
парной корреляции называются коэффициентами
нулевого порядка. Коэффициенты частной
корреляции более высоких порядков можно
определить через коэффициенты частной
корреляции более низких порядков по
рекуррентной формуле
При двух факторах и i=1 данная формула примет вид:
Соответственно при i=2 и двух факторах частный коэффициент корреляции у с фактором x2 можно определить по формуле
Для уравнения регрессии с тремя факторами частные коэффициенты корреляции второго порядка определяются на основе частных коэффициентов корреляции первого порядка. Так, по уравнению
Возможно исчисление трех частных коэффициентов корреляции второго порядка:
Каждый из которых определяется по рекуррентной формуле.
Например, при i=1 имеем
формулу для расчета
,
а именно
Пример. Предположим, изучается зависимость тиража газеты у от ожидаемого дохода от распродажи газеты x1, количества персонала редакции x2, рейтинга газеты среди других газет, распространяемых в регионе x3. в этом случае матрица парных коэффициентов корреляции составила:
Исходя из этих данных, найдем частные коэффициенты корреляции первого и второго порядка.
Приведем частные коэффициенты корреляции первого порядка зависимости y от x1 и x2.
Т.е. при закреплении фактора x2 на постоянном уровне корреляция y и x1 оказывается более низкой (0,585 против 0,69);
Т. е. при закреплении фактора x1 на постоянном уровне влияние фактора x2 на y оказывается менее сильным (0,409 против 0,58);
Т. е. при закреплении фактора x3 на постоянном уровне влияние фактора x1 на y несколько снизилось по сравнению с парой корреляцией (0,574 против 0,69 ) ввиду некоторой связи факторов x1 и x3 ;
Т. е. при закреплении фактора x3 на постоянном уровне влияние на у фактора x2 оказалось несколько менее сильным (0,465 против 0,58);
Т.е. корреляция фактора x3 с y снизилась при фиксированном влиянии на у фактора x1 (0,55 и 0,327);
Т.е при закреплении фактора x2 на постоянном уровне влияние фактора x3 на у оказалось менее значительным (0,420 и 0,55).
Приведем частные коэффициенты корреляции второго порядка.
При фиксированном влиянии факторов x2 и x3 корреляция у с x1 оказалась еще меньше, чем при частной корреляции первого порядка (при закреплении фактора x2): 0,69 ;0,585 и 0,505.
Корреляция фактора x2 с у снизилась до 0,409 при элиминировании фактора x1 и до 0,362 при элиминировании двух факторов – x1 и x3.
Корреляция у с x3 снизилась с 0,55 в равной регрессии до 0, 327 при закреплении на постоянном уровне фактора x1 и до 0,261 при одновременном закреплении на постоянном уровне факторов x1 и x2. Частная корреляция второго порядка зависимости у с факторами x1,x2 и x3 оказалась значительно более низкой – 0,505; 0,362 и 0,261 против 0,69; 0,58 и 0,55 для парной регрессии.
Рассчитанные по рекуррентной формуле
частные коэффициенты корреляции
изменяются в пределах от -1 до +1, а по
формулам через множественные коэффициенты
детерминации – от 0 до 1. сравнение их
друг с другом позволяет ранжировать
факторы по тесноте их связи с результатом.
Частные коэффициенты корреляции,
подтверждая ранжировку факторов по их
воздействию на результат, на основе
стандартизованных коэффициентов
регрессии (
-
коэффициентов) в отличие от последних
дают конкретную меру тесноты связи
каждого фактора с результатом в числом
виде. Если из стандартизованного
уравнения регрессии
следует, что
т.е. по силе влияния на результат порядок
факторов таков: то этот же порядок
факторов определяется и по соотношению
частных коэффициентов корреляции
Согласованность частной корреляции и
стандартизованных коэффициентов
регрессии наиболее отчетливо видна из
сопоставления их формул при двухфакторном
анализе. Для уравнения регрессии в
стандартизованном масштабе
- коэффициенты могут быть определены по формулам, вытекающим из решения системы уравнений:
(3.29)
Сравнивая их с рекуррентными формулами
расчета частных коэффициентов корреляции
и
можно видеть, что
(3.30)
Иными словами, в двух факторном анализе частные коэффициенты корреляции - это стандартизованные коэффициенты регрессии, умноженные на корень квадратный из соотношения долей остаточных дисперсий фиксируемого фактора на фактор и на результат.
В эконометрике частные коэффициенты
корреляции обычно не имеет самостоятельного
значения. В основном их используют на
стадии формирования модели, в частности
в процедуре отсева факторов. Так, строя
многофакторную модель, например, методом
исключения переменных, на первом шаге
определяется уравнение регрессии с
полным набором факторов и рассчитывается
матрица частных коэффициентов корреляции.
На втором шаге отбирается фактор с
наименьшей и не существенной по т-
критерию Стьюдента величиной показателя
частной корреляции. Исключив его из
модели, строится новое уравнение
регрессии. Процедура продолжается до
тек пор, пока не окажется, что все частые
коэффициенты корреляции существенно
отличается от нуля. Если исключен
несущественный фактор, то множественны
коэффициенты детерминации на двух
смежных друг от друга, т.е
где р- число факторов.
Из приведенных ранее формул частных коэффициентов корреляции видна связь этих показателей с совокупным коэффициентом корреляции. Зная частные коэффициенты корреляции (последовательно первого, второго и более высокого порядка ), можно определить совокупный коэффициент корреляции по формуле
При полной зависимости результативного
признака от исследуемых факторов
коэффициент совокупного их влияния
равен единице. Из единицы вычитается
доля остаточной вариации результативного
признака (1-
),
обусловленная последовательно включенными
в анализ факторами. В результате
подкоренное выражение характеризует
совокупное действие всех исследуемых
факторов.
В рассмотренном примере с тремя факторами величина коэффициента множественной корреляции составила :
Величина множественного коэффициента корреляции всегда больше (или равна) максимального частного коэффициента корреляции, что имеет место в нашем примере: 0,770 по сравнению с 0,505