Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
конспект лекций статистика со ссылками.doc
Скачиваний:
36
Добавлен:
08.12.2018
Размер:
3.75 Mб
Скачать

9.2.Парная регрессия на основе метода наименьших квадратов и метода группировок

Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описы­вается уравнениями:

прямой

гиперболы (9.3)

параболы

и так далее.

Определить тип уравнения можно, исследуя зависимость графиче­ски, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если ре­зультативный и факторный признаки возрастают одинаково, то это сви­детельствует о том, что связь между ними линейная, а при обратной свя­зи - гиперболическая. Если результативный признак увеличивается в арифметической профессии, а факторный значительно быстрее, то ис­пользуется параболическая или степенная регрессия.

Оценка параметров уравнений регрессии (, , - в уравнении параболы второго порядка) осуществляется методом наименьших квад­ратов, в основе которого лежит предположение о независимости наблю­дений исследуемой совокупности и нахождении параметров модели (, ), при которых минимизируется сумма квадратов отклонений эмпири­ческих (фактических) значений результативного признака от теоретиче­ских, полученных по выбранному уравнению регрессии:

Система нормальных уравнений для нахождения параметров ли­нейной парной регрессии методом наименьших квадратов имеет сле­дующий вид:

(9.4.)

где n - объем исследуемой совокупности (число единиц наблюде­ния).

В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков; коэффициент регрессии показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Например, имеются данные, характеризующие деловую активность закрытого акционерного общества (ЗАО): прибыль (млн. руб.) и затраты на 1 руб. произведенной продукции.

Таблица 9.2.

Зависимость между прибылью ЗАО и затратами на 1 руб. произведенной продукции

№ п/п

Прибыль (млн. руб.)

Затраты на 1 руб. произведенной продукции (коп.)

1

221

96

9216

21216

247

2

1070

77

5929

82390

1013

3

1001

77

5929

77077

1013

4

606

89

7921

53934

530

5

779

82

6724

63878

811

6

789

81

6561

63909

852

Итого

4466

502

42280

362404

4467

Предположим наличие линейной зависимости между рассматриваемыми признаками.

Система нормальных уравнений для данного приема имеет вид:

Отсюда: ;

Следовательно,

На практике исследования часто проводятся по большому числу наблюдений. В этом случае исходные данные удобнее представлять в сводной групповой таблице. При этом анализу подвергаются сгруппиро­ванные данные и по факторному (х) и по результативному (у) признакам, то есть уравнения парной регрессии целесообразно строить на основе сгруппированных данных.

Если значения х и у заданы в определенных интервалах (а, b), то для каждого интервала сначала необходимо определить середину (х'/у' = (а+b)/2), а затем уже коррелировать значения х' и у' и строить уравне­ния регрессии между ними.

Например, определим зависимость между величиной уставного капитала и числом занятых на предприятиях, выставивших акции на чековые аукционы в 2007 г. в одном из регионов, который характеризуется следующими данными:

Таблица 9.3.

Распределение предприятий, выставивших акции на чековые аукционы в 2007 г., по величине уставного капитала и числу занятых в одном из регионов

Уставный капитал (млн. руб.)

Число занятых (чел.)

Число предприятий,

14-70

70-126

126-182

182-238

42

98

154

210

745-2684

2684-4624

4624-6564

6564-8503

8503-125842

1714,5

3654,0

5594,0

7533,5

67172,5

4

1

-

1

2

6

3

1

1

-

2

-

1

2

1

3

-

-

-

2

15

4

2

4

5

2517,5

14616,0

11188,0

30134,0

335862,5

2904363

1227744

1409688

3374995

44199505

Число предприятий,

-

8

11

6

5

30

417518,0

53533813

-

336

1078

924

1050

3388

14112

105644

142296

220500

482552

Предположим наличие линейной зависимости между рассматриваемыми признаками.

Система нормальных уравнений для определения коэффициентов уравнения регрессии примет вид:

где n = 30 – число анализируемых предприятий;

- число предприятий, согласно распределению, соответственно по факторному и результативному признакам;

- значения результативного и факторного признака по конкретной группе предприятий.

Так для первой группы:

;

Таким образом, поставив в систему суммарные значения, получим:

Отсюда