Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
TEH_Lekcija_No4.docx
Скачиваний:
8
Добавлен:
24.11.2019
Размер:
101.69 Кб
Скачать

Тема 4. Множественная регрессия и корреляция

    1. Множественный корелляционно-регрессионный анализ

Экономические явления, как правило, определяются большим числом одновременно и совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости переменной у от нескольких объясняющих переменных х1, х2, …, хp, которая может быть решена с помощью множественного корреляционно-регрессионного анализа.

Задачи множественного корреляционно-регрессионного анализа:

  1. Измерение тесноты связи между признаками.

  2. Отбор факторных признаков в модель.

  3. Установление неизвестных причин связи.

  4. Определение вида уравнения регрессии.

  5. Построение регрессионной модели (уравнения регрессии).

  6. Проверка значимости параметров связи.

  7. Интервальное оценивание параметров связи.

Модель множественной регрессии – это уравнение, отражающее корреляционную связь между результатом и несколькими факторами. В общем виде оно может быть записано как:

,

где у – зависимая переменная (результат);

х1, х2, … хp – независимые переменные (факторы);

- случайный остаток;

f – некая математическая функция.

В качестве функций множественной регрессии часто выбирают наиболее простые – линейную, показательную и степенную функции:

- линейная функция;

- показательная функция;

- степенная функция,

где а, b1, b2 , … , bp – параметры уравнения регрессии.

Множественная регрессия широко применяется при исследованиях спроса и потребления, доходности акций, изучении функций издержек и производства и т.д. В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Его главная цель заключается в построении модели с большим числом факторов и определении при этом влияния каждого из них в отдельности, а так же их совокупности на моделируемый показатель.

    1. Отбор факторов для включения в уравнение регрессии

При отборе факторов существуют определенные правила, выполнение которых необходимо.

Включение в уравнение множественной регрессии тех или иных факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями, т.е. он должен иметь определенные экономические знания, позволяющие делать вывод о наличии достаточно сильной связи между рассматриваемыми факторами и моделируемым показателем и включить эти факторы в модель. Последние должны отвечать следующим требованиям.

  1. Факторы должны быть количественно измеряемы. Если в модель необходимо включить качественный фактор, не имеющий количественной меры, то ему нужно придать количественную определенность (например, качество работы маркетингового отдела фирмы задается в виде баллов, если признак альтернативный, т.е. имеющий только два значения, это могут быть значения 0 и 1).

  2. Каждый фактор должен быть достаточно тесно связан с результатом (т.е. коэффициент парной линейной корреляции между каждым фактором, включаемым в модель, и результатом должен отличаться от нуля, причем на достаточно большую величину):

  1. Факторы не должны быть тесно связаны между собой и тем более находится в строгой функциональной зависимости (не должны коррелировать друг с другом или, иначе говоря, не должны быть интеркоррелированы, интеркорреляция – связь между двумя факторами).

Существование корреляционной связи между факторами может быть выявлено с помощью показателей корреляции между ними, в частности с помощью парных коэффициентов корреляции, которые можно записать в виде матрицы:

x1

x2

хp

x1

rx1x1

rx1x2

rx1xp

x2

rx2x1

rx2x2

rx2xp

хp

rxpx1

rxpx2

rxpxp

Коэффициент корреляции фактора с самим собой равен единицы (rxixi=1), а коэффициент корреляции фактора i c фактором j равен коэффициенту корреляции фактора j с фактором i (rxixj=rxjxi). Следовательно, данная матрица является симметричной, поэтому в ней указывается только главная диагональ и элементы под ней:

x1

x2

хp

x1

1

x2

rx2x1

1

1

хp

rxpx1

rxpx2

1

Если парный линейный коэффициент корреляции между двумя признаками больше 0,7, то один из этих признаков должен быть исключен из модели. Как правило, исключается тот, чей парный коэффициент корреляции с результативным признаком меньше.

Мультиколлинеарность – связь между несколькими факторами, включенными в модель. Наличие мультиколлинеарности можно подтвердить, найдя определитель матрицы парных коэффициентов корреляции. Если связь между факторами полностью отсутствует, то определитель матрицы равен единице. Если же связь между факторами является тесной, то определитель матрицы близок к нулю. Мультиколлинеарность в эконометрических моделях необходимо избегать, поскольку она их искажает.

Причины возникновения мультиколлинеарности между признаками:

  1. Изучаемые факторные признаки характеризуют одну и ту же сторону явления или процесса (например, показатели объема произведенной продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как оба характеризуют размер предприятия).

  2. Использование в качестве факторов признаков, суммарное значение которых представляет собой постоянную величину (например, коэффициент годности и износа).

  3. Включение в модель факторных признаков, которые являются элементами друг друга (например, затраты на производство продукции и себестоимость продукции)

  4. Включение в модель факторных признаков, которые по экономическому содержанию дублируют друг друга (например, прибыль и рентабельность продукции).

Таким образом, мультиколлинеарности можно избежать еще на этапе экономического анализа изучаемого явления.

Методы устранения или уменьшения мультиколлинеарности.

  1. Сравнение значений линейных коэффициентов корреляции. Из двух связанных друг с другом факторов один исключается из модели.

  2. Метод включения факторов заключается в том, что в модель включаются факторы по одному в определенной последовательности. На первом шаге в модель вводится тот фактор, который имеет наибольший коэффициент корреляции с зависимой переменной. Затем поочередно добавляются другие факторы. Каждый раз оценивается целесообразность включения нового фактора с точки зрения сокращения остаточной дисперсии.

  3. Метод исключения факторов состоит в том, что в модель включаются все факторы. Затем после построения уравнения регрессии из модели исключают фактор, коэффициент при котором незначим. Процесс исключения факторов продолжается до тех пор, пока модель не станет удовлетворять определенным условиям и все коэффициенты регрессии не будут значимы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]