![](/user_photo/2706_HbeT2.jpg)
- •Часть II
- •Содержание
- •Часть I
- •Часть II
- •Тема 4. Корреляционный анализ § 4.1. Статистическая зависимость
- •§ 4.2. Вычисление коэффициента корреляции по выборке
- •По диаграмме рассеяния.
- •Корреляционная таблица
- •§ 4.3. Свойства и значимость коэффициента корреляции
- •§ 4.4. Коэффициент детерминации
- •§ 4.5. Частный и множественный коэффициенты корреляции
- •Вопросы для самопроверки
§ 4.3. Свойства и значимость коэффициента корреляции
Напомним следующие свойства коэффициента корреляции (см. корреляция в [7]).
1. Коэффициент корреляции – величина безразмерная, следовательно, он сопоставим для различных экономических показателей.
2. rxy изменяется в пределах от -1 до +1.
Значение r = ±1 свидетельствует о функциональной линейной зависимости между Х и Y, так что при данном Х = х значение Y точно определено, rxy = 0 указывает на отсутствие линейной зависимости между Х и Y.
Коэффициент корреляции вычисляется по выборке, поэтому подвержен влиянию случайности. Следовательно, необходимо проверить гипотезу о его значимости, т.е. существенно ли xy отличается от нуля или это отличие можно приписать влиянию случайности, вызванной выборкой.
Сформулируем нулевую и альтернативную гипотезы.
.
В качестве критерия принимается случайная величина
Эта величина при справедливости H0 имеет распределение Стьюдента с n – 2 степенями свободы.
Пример. При изучении
себестоимости (Y) и
зарплаты (Х) (выборка объема n
= 42) rxy
= 0,65. Нужно проверить
гипотезу о существенности отличия от
нуля XY.
Положим
= 0,05.
.
Тнабл > Ткр, гипотеза H0 отвергается.
§ 4.4. Коэффициент детерминации
Величина
называется коэффициентом детерминации.
Он характеризует, на сколько процентов
изменчивость одной переменной можно
объяснить изменчивостью другой
переменной. Остальные
относятся к воздействию других переменных,
которые нам неизвестны.
Например, в предыдущей задаче коэффициент корреляции между Y – себестоимостью и Х – зарплатой был равен 0,65. Тогда Kd = 42,25%. Следовательно, 42,25% изменчивости себестоимости продукции объясняется изменчивостью зарплаты. Остальные 57,75% объясняются другими факторами, например, стоимостью покупных комплектующих изделий, стоимостью энергообеспечения, стоимостью материалов и т.д.
Пример. Рассмотрим зависимость между ростом Х (в см) и весом Y (в кг) женщин. Пусть по результатам случайной выборки объема n = 15 получена таблица:
Х |
164 |
161 |
170 |
159 |
161 |
164 |
161 |
170 |
159 |
164 |
161 |
164 |
159 |
161 |
170 |
Y |
65 |
64 |
70 |
60 |
64 |
65 |
64 |
70 |
61 |
68 |
65 |
68 |
61 |
67 |
72 |
Требуется: а) построить диаграмму рассеяния;
б) составить корреляционную таблицу;
в) вычислить условные
средние
;
г) вычислить парный коэффициент корреляции rxy и проверить его значимость на уровне значимости = 0,10;
д) вычислить коэффициент детерминации и объяснить его смысл.
Решение. а) Диаграмму
рассеяния получим, если нанесем пары
значений
на координатную плоскость ХОУ.
В скобках указана
частота встречаемости значений
.
б) Построим таблицу с
двумя входами Х и Y.
Для каждой переменной составим
вариационный ряд. Частоту встречаемости
в выборке запишем на пересечении i-ой
строки и j-го столбца
. Таким образом, получим корреляционную
таблицу.
X |
60 |
61 |
64 |
65 |
67 |
68 |
70 |
72 |
ni. |
159 |
1 |
2 |
|
|
|
|
|
|
3 |
161 |
|
|
3 |
1 |
1 |
|
|
|
5 |
164 |
|
|
|
2 |
|
2 |
|
|
4 |
170 |
|
|
|
|
|
|
2 |
1 |
3 |
n.j |
1 |
2 |
3 |
3 |
1 |
2 |
2 |
1 |
15 |
Последние строка и столбец содержат итоговые частоты по столбцам (n.j) и строкам (ni.). Сумма частот итоговой строки и столбца равны между собой и и равны объему выборки n = 15.
в) Для каждого значения
Х вычислим средние значения Y,
т.е.
и запишем их в таблицу. Так, для
кг;
кг;
кг;
кг.
Х |
159 |
161 |
164 |
170 |
|
60,6 |
64,8 |
66,5 |
70,7 |
г) Вычислим оценку парного коэффициента корреляции по корреляционной таблице
Итак,
.
Для проверки гипотезы
против альтернативы
вычислим наблюдаемое значение критерия
.
По таблице распределения
Стьюдента определим
.
Так как
(7,53 > 2,16), то гипотеза Н0
отвергается, что было очевидно и без
проверки гипотезы, т.к. rxy
= 0,9.
д) Вычислим коэффициент
детерминации
=
81%, т.е. изменение веса женщины на
81% зависит от роста, а на 19% зависит от
других факторов, которыми могут быть
наследственность, состояние здоровья
и т.п.