Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
статистика 3 курс.docx
Скачиваний:
42
Добавлен:
03.05.2015
Размер:
201.93 Кб
Скачать

Корреляционно-регрессионный анализ

На основании произведенных расчетов проведем корреляционно-регрессионный анализ

Форма уравнения регрессии – линейная.

График зависимости результативного признака от факторного, составленный по исходным данным

Для наших данных система уравнений имеет вид

14a + 29772235 b = 449894

29772235 a + 79752791962413 b = 1363745023867

Из первого уравнения выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: b = 0.02476, a = -20514.3174

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 0.02476 x - 20514.3174

Для расчета параметров регрессии построим расчетную таблицу

Численность населения за 2010 год

Кол-во лиц совершивших преступление Поволжском регионе за 2010 год

x2

y2

x • y

4060957

229121

16491371755849

52496432641

930450528797

690349

34341

476581741801

1179304281

23707275009

818566

5339

670050296356

28504921

4370323874

3822038

5335

14607974473444

28462225

20390572730

1517692

26478

2303389006864

701084484

40185448776

1243431

13197

1546120651761

174160809

16409558907

2634461

8921

6940384760521

79584241

23502026581

1319076

10886

1739961493776

118504996

14359461336

3289841

19825

10823053805281

393030625

65221097825

2016086

18077

4064602759396

326777929

36444786622

1368657

8491

1873221983649

72097081

11621266587

3213289

30072

10325226197521

904325184

96630026808

2503305

24181

6266535923025

584720761

60532418205

1274487

15630

1624317113169

244296900

19920231810

29772235

449894

79752791962413

57331287078

1363745023867

1. Параметры уравнения регрессии.

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

1.1. Коэффициент корреляции

Ковариация.

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Линейный коэффициент корреляции принимает значения от –1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X умеренная и прямая.

Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:

1.2. Уравнение регрессии (оценка уравнения регрессии).

Линейное уравнение регрессии имеет вид y = 0.0248 x -20514.32

Коэффициентам уравнения линейной регрессии можно придать экономический смысл.

Коэффициент регрессии b = 0.0248 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.0248.

Коэффициент a = -20514.32 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.

Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.

Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе - обратная). В нашем примере связь прямая.

Коэффициент эластичности находится по формуле:

В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х на 1%, Y изменится более чем на 1%. Другими словами - Х существенно влияет на Y.

Бета – коэффициент

Т.е. увеличение x на величину среднеквадратического отклонения Sx приведет к увеличению среднего значения Y на 0.48 среднеквадратичного отклонения Sy.