Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 700263.doc
Скачиваний:
19
Добавлен:
01.05.2022
Размер:
1.75 Mб
Скачать

Тема 5. Множественная регрессия и корреляция

В рассмотренных ранее задачах на фактор Y влиял только один фактор X, а влияние всех остальных было мало и приводило к случайному разбросу значений Y. Однако, часто на результирующий фактор Y достаточно сильно может влиять сразу несколько других факторов. Если на переменную Y в равной степени влияют несколько независимых переменных, то такая зависимость описывается множественной регрессией. Переменная Y при этом называется результирующим признаком или результатом, а остальные, влияющие на него показатели – независимыми факторами. Рассмотрим случай, когда независимые переменные входят в уравнение регрессии линейно. Такая множественная регрессия называется линейной. Рассмотрим простейший случай линейной множественной регрессии – двухфакторную регрессию. В этом случае на результат Y влияет два фактора Х1 и Х2. Ее уравнение имеет вид .

Например, предположим, что зависимость расходов на продукты питания по совокупности семей характеризуется следующим уравнением:

,

где y – расходы семьи за месяц на продукты питания, тыс. руб.;

x1 – месячный доход на одного члена семьи, тыс. руб.;

x2 – размер семьи, человек.

Анализ данного уравнения позволяет сделать выводы – с ростом дохода на одного члена семьи на 1 тыс. руб. расходы на питание возрастут в среднем на 350 руб. при том же среднем размере семьи. Иными словами, 35% дополнительных семейных расходов тратится на питание. Увеличение размера семьи при тех же ее доходах предполагает дополнительный рост расходов на питание на 730 руб. Третий параметр не подлежит экономической интерпретации.

Для нахождения неизвестных параметров уравнения в соответствии с методом наименьших квадратов необходимо решать систему линейных уравнений вида:

(5.1)

где суммы – параметры системы уравнений - находятся, как и в случае параболической регрессии (см. формулу (5.1) из предыдущей темы), по всем эмпирическим данным:

Для оценки качества уравнения регрессии используются парные коэффициенты корреляции, которые вычисляются по формулам

(5.2)

Коэффициенты характеризуют влияние каждого фактора Х1 и Х2 на результат Y. Коэффициент характеризует влияние факторов друг на друга. Если это влияние высоко, то это негативный признак, т.к. факторы Х1 и Х2 должны быть независимыми.

Для оценки совокупного влияния факторов Х1 и Х2 на результат рассчитывается множественный коэффициент корреляции, который для двухфакторной модели равен:

. (5.3)

Чем ближе этот коэффициент к единице, тем лучше факторы в совокупности определяют результат и, соответственно, тем лучше уравнение множественной регрессии описывает зависимость.

Пример. По четырем предприятиям региона изучается зависимость выработки продукции на одного работника y (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%).

Требуется написать уравнение множественной линейной регрессии , найти парные коэффициенты корреляции и , найти множественный коэффициент корреляции .

Номер предприятия

1

2

3

4

, (%)

1

2

3

5

, (%)

0

1

3

4

, (тыс. руб.)

6

11

19

28