Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МММ в экономике(испр).doc
Скачиваний:
24
Добавлен:
10.12.2018
Размер:
1.16 Mб
Скачать

5.2 Линейная парная регрессия

Данные статистической зависимости удобно давать в виде кореляционной таблицы. Рассмотрим в качестве примера зависимость между суточной выработкой продукции Y(в т) и величиной основных производственных фондов Х (в млн. рублей) для совокупности 29 предприятий кондитерской промышленности.

Величина осн. произв. фондов, млн. руб.

Середины интервалов

Суточная выработка

продукции, т Y

Всего

ni

Групповая средняя

x

yj

3-5

5-7

7-9

yi

хi

4

6

8

6-10

8

3

1

-

4

4.5

10-14

12

1

5

-

6

5.7

14-18

16

-

8

2

10

6.4

18-22

20

-

3

6

9

7.3

всего nj

4

17

8

29

Групповая средняя xj

9

15.1

19

В таблице xi и yj обозначены середины соответствующих интервалов, а ni и nj- их частоты.

Для каждого значения xi (i=1, ...., l), т.е. для каждой строки корреляционной таблицы вычислим групповые средние yi:

(5.2.1)

Вычисленные групповые средние поместим в последнем столбце корреляционной таблицы.

Аналогично для каждого значения yj(j=1, ... , m) вычислим групповые средние по формуле:

(5.2.2)

Полученные значения поместим в нижнюю строчку корреляционной таблицы.

Изобразим полученную зависимость графически точками координационной плоскости. Такое изображение статистической зависимости называют полем корреляции ( рис. 5.2.1).

Y

9

тонн

7

++

++++++

(20; 7,3)

Эмпирическая

линия регрессии

y по х

5

(12; 5,7)

+++++++

++++++

++

(16; 6,4)

+++

3

(8; 4,5)

1

0

Х млн. рублей

6 10 14 18 22

Рис. 5.2.1

В этом же поле корреляции покажем графически в виде ломаной линии зависимость у по х. Эту ломаную называют эмпирической линией регрессии у по х. По виду ломаной можно предположить наличие линейной корреляционной зависимости у по х между двумя рассматриваемыми переменными.

Уравнение регрессии будем искать в виде:

ух=ах+b; (5.2.3)

Для нахождения параметров a и b воспользуемся известным по теме № 2 методом наименьших квадратов:

(5.2.4)

Запишем систему нормальных уравнений следующим образом:

(5.2.5)

В отличие от метода наименьших квадратов здесь рассматриваются взвешенные суммы: вместо вместо и т.д.

Число рассматриваемых предприятий:

(5.2.6)

Разделим оба уравнения системы (5.2.5) на n:

(5.2.7)

(5.2.8)

(5.2.9)

(5.2.10)

(5.2.11)

(Для всех формул i= 1,2,...l; j=1,2,...m)

С учетом формул (5.2.8) - (5.2.11) перепишем систему (5.2.7):

(5.2.12)

отсюда (5.2.13)

Подставим в уравнение регрессии (5.2.3) полученное значение b:

(5.2.14)

В уравнении регрессии коэффициент а называют коэффициентом регрессии у по х.

Обозначим а=аух, тогда уравнение регрессии у по х запишется так:

(5.2.15)

Коэффициент регрессии у по х показывает, на сколько единиц в среднем изменяется переменная у при изменении х на единицу.

Выполним с системой (5.2.14) (с учетом обозначения а=аух) следующие действия:

умножим первое уравнение на х

* x;

вычтем из второго уравнения первое, получим:

отсюда:

(5.2.16)

или

(5.2.17)

где (5.2.18) - корреляционный момент или ковариация переменных.

(5.2.19) - выборочная дисперсия переменной х.

Можно провести аналогичные рассуждения относительно зависимости х по у и уравнения регрессии

(5.2.20)

Тогда получим уравнение регрессии

(5.2.21)

где (5.2.22)

- коэффициент регрессии х по у. Он показывает, на сколько единиц в среднем изменяется переменная х при изменении у на одну единицу .

(5.2.23)

Sy2- выборочная дисперсия переменной у.

Числители в формулах (5.2.16) и (5.2.22) совпадают, а знаменатели положительны, поэтому коэффициенты регрессии аух и аху имеют одинаковые знаки, определяемые знаком, m.

Вернемся к нашему примеру и вычислим уравнения регрессии у по х и х по у. Для этого найдем все необходимые элементы уравнений:

Из первого уравнения регрессии у по х следует, что при изменении величины основных производственных фондов на 1 млн.руб. суточная выработка кондитерской продукции изменяется в среднем на 0, 195 т.

Второе уравнение регрессии х по у показывает, что для увеличения суточной выработки продукции на 1 т необходимо в среднем увеличить величину основных фондов на 2,75 млн.рублей.

Свободные члены в уравнениях регрессии не имеют реального смысла.