Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Statistika1chastPGU (2).doc
Скачиваний:
29
Добавлен:
24.08.2019
Размер:
4.87 Mб
Скачать

Тема 7. Использование корреляционного анализа при установлении статистической связи между социально-экономическими показателями

Корреляционный метод анализа является составляющим элементом более общего метода количественного статистического анализа связей – корреляционно-регрессионного.

При этом корреляционно-регрессионный анализ как общее понятие включает в себя измерение тесноты и направления связи (корреляционный анализ), а также установление аналитического выражения формы связи (регрессионный анализ).

Количественно оценить тесноту и направление связи между двумя признаками при парной корреляции можно посредством расчета линейного коэффициента корреляции.

Линейный коэффициент корреляции характеризует тесноту и направление связи между двумя коррелируемыми признаками в случае наличия между ними линейной зависимости.

Линейный коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределение которых близко к нормальному.

На практике применяются различные модификации формул для расчета данного коэффициента. Наиболее простой из них является зависимость вида

. (27)

Физическая интерпретация значений коэффициента корреляции приведена в табл. 16.

Таблица 16

Оценка линейного коэффициента корреляции

Значение линейного коэффициента корреляции

Характер связи

Интерпретация связи

r = 0

Отсутствует

0 < r < 1

Прямая

С увеличением x увеличивается y

–1 < r < 0

Обратная

С увеличением x уменьшается y, и наоборот

r = 1

Функциональная

Каждому значению факторного признака строго соответствует одно значение результативного признака

Значимость линейного коэффициента корреляции проверяется на основе t-критерия Стьюдента. При этом выдвигается и проверяется нулевая гипотеза (Н0) о равенстве коэффициента корреляции нулю [Н0: r = 0] При проверке этой гипотезы используется t-статистика:

. (28)

Если расчетное значение (табличного), то гипотеза Н0 отвергается, что свидетельствует о значимости линейного коэффициента корреляции, а следовательно, и о статистической существенности зависимости между Х и У.

Примечание. Данный критерий оценки значимости применяется для совокупностей n < 50.

При большем числе наблюдений (n > 100) используется следующая формула для определения t-статистики:

. (29)

Пример. По исходным данным, приведенным в табл. 17, рассчитать линейный коэффициент корреляции. Сделать выводы.

Для удобства и наглядности промежуточных расчетов перестроим табл. 17 к виду, представленному в табл. 18.

Таблица 17

Характеристика использования библиотечного фонда библиотек районных муниципальных образований Пензенской области в 2004 г.

Районы Пензенской области

Фонд yi, тыс. экз.

Пользователи xi, тыс. чел.

Башмаковский

240,1

17,0

Беднодемьяновский

179,8

10,6

Бековский

178,5

10,8

Белинский

416,5

25,2

Бессоновский

181,6

15,3

Вадинский

193,8

7,0

Городищенский

268,4

19,0

Земетчинский

289,1

21,7

Иссинский

147,1

11,5

Каменский

246,4

16,2

Таблица18

К расчету линейного коэффициента корреляции

Районы Пензенской

области

Фонд yi, тыс. экз.

Пользователи xi, тыс. чел.,

Башмаковский

240,1

17,0

4081,7

35,6

2,5

Беднодемьяновский

179,8

10,6

1905,9

2951,7

23,3

Бековский

178,5

10,8

1927,8

3094,7

21,4

Белинский

416,5

25,2

10495,8

33258,8

95,5

Бессоновский

181,6

15,3

2778,5

2759,4

0,0

Вадинский

193,8

7,0

1356,6

1626,5

71,1

Городищенский

268,4

19,0

5099,6

1174,4

12,7

Земетчинский

289,1

21,7

6273,5

3021,7

39,3

Иссинский

147,1

11,5

1691,7

7574,2

15,4

Каменский

246,4

16,2

3991,7

150,6

0,6

Сумма

2341,3

154,3

39602,7

55647,7

281,9

Средняя арифметическая невзвешенная определяется по зависимости

,

где xii-е значение показателя; n – объем статистической совокупности (для рассматриваемого примера n =10 – число районных муниципальных образований).

Тогда имеем

;

Далее в соответствии с зависимостью (27) определяем числитель:

Дисперсия невзвешенная определяется по зависимости

.

Тогда имеем

Средние квадратические  и отклонения равны

Окончательно линейный коэффициент корреляции равен

Физическая интерпретация численного значения линейного коэффициента корреляции приведена в табл. 19.

Таблица 19

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]