- •Тема 7. Статистическое измерение связи между явлениями.
- •Виды связей и методы их изучения.
- •Корреляционно-регрессионный метод анализа связей.
- •Определение параметров корреляционного уравнения.
- •Измерение тесноты связи.
- •Шкала Чеддока
- •2.4 Определение тесноты связи при множественной корреляции
- •2.5.Оценка параметров уравнения и тесноты связи.
- •Метод сравнения параллельных рядов.
- •Измерение тесноты связи альтернативных признаков.
2.5.Оценка параметров уравнения и тесноты связи.
Оценка надежности параметров уравнений регрессии и показателей тесноты связи необходима, т.к. расчеты данных показателей проводятся, как правило, по выборочным данным, и могут быть расхождения между генеральными и выборочными характеристиками.
Точность коэффициента регрессии - параметра а1 - оценивается по t-критерию Стьюдента:
(7.24)
для оценки параметра а0 используют формулу:
, (7.25)
где а1, а0 - расчетные значения параметров;
n - количество пар значений признаков х и у;
- остаточная дисперсия, которая рассчитывается следующим образом:
. (7.26)
- дисперсия факторного признака, рассчитываемая по формуле:
. (7.27)
расчетные значения t-критериев сравнивают с табличными значениями для заданного уровня значимости α. Уровень значимости α показывает вероятность того, что рассчитанные показатели попадут в предельные интервалы. Вероятность равна:
. (7.28)
например, при уровне значимости 0,01 вероятность расчетов определяется из формулы (7.32):
.
Р = 0,995 означает, что в 995 случаях из 1000 рассчитанные показатели попадут в теоретические пределы.
Коэффициент корреляции оценивается при помощи t-критерия Стьюдента:
, (7.29)
где r - расчетное значение коэффициента корреляции.
Индекс корреляции надежен в тех случаях, если расчетное значение F-критерия Фишера больше его табличного значения.
, (7.30)
где m - число параметров уравнения регрессии;
n - количество пар значений признаков х и у.
-
Метод сравнения параллельных рядов.
Помимо коэффициента и индекса корреляции для определения тесноты связи используются и другие, менее точные показатели, например, коэффициент корреляции рангов Спирмэна. Этот показатель рассчитывается на основе метода выстраивания параллельных рядов и ранжирования значений «х» и «у».
Коэффициент Спирмэна определяется по формуле:
, (7.31)
где d - разность рангов (порядковых номеров) признаков х и у;
n - количество пар значений х и у.
Коэффициент Спирмэна может принимать значения от -1 до 1. Чем ближе значение «» к 1, тем сильнее связь. Если «» равен 0, связь отсутствует, если «» равен 1 – связь функциональная. Знак показывает направление связи, если «-» - связь обратная, т.е.при возрастании «х» уменьшается значение «у».
Пример расчета коэффициент корреляции рангов Спирмэна.
На основе данных табл. 7.2 выявите наличие связи между возрастом оборудования и затратами на ремонт. В качестве показателя тесноты связи используйте коэффициент корреляции рангов Спирмэна.
Таблица 7.2
Номер предприятия |
Возраст оборудования, лет |
Затраты на ремонт, тыс. руб. |
Номер предприятия |
Возраст оборудования, лет |
Затраты на ремонт, тыс. руб. |
1 |
4 |
1,5 |
6 |
10 |
4,0 |
2 |
5 |
2,0 |
7 |
8 |
2,3 |
3 |
5 |
1,4 |
8 |
7 |
2,5 |
4 |
6 |
2,3 |
9 |
11 |
6,6 |
5 |
8 |
2,7 |
10 |
6 |
1,7 |
Решение. в данном примере в качестве факторного признака «х» выступает возраст оборудования, в качестве результативного «у» - затраты на ремонт.
Для расчета коэффициента корреляции рангов необходимо проранжировать «х» и «у» и сравнить полученные порядковые номера. Для этого воспользуемся табл. 7.3.
При ранжировании данных часто встречаются признаки с одинаковым значением. В этом случае ранг каждого признака определяется как средняя из порядковых номеров. Например, у заводов 5 и 7 одинаковое значение признака х. В этом случае предполагают, что их порядковые номера будут равны 7 и 8, а обоим заводам присваивается одинаковый ранг - 7,5. Следующей по величине признак будет иметь ранг 9.
Таблица 7.3
№ п/п |
х |
у |
ранг х |
ранг у |
разность рангов, d |
d2 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1 |
4 |
1,5 |
1,0 |
2,0 |
-1,0 |
1,00 |
2 |
5 |
2,0 |
2,5 |
4,0 |
-1,5 |
2,25 |
3 |
5 |
1,4 |
2,5 |
1,0 |
1,5 |
2,25 |
4 |
6 |
2,3 |
4,5 |
5,5 |
-1,0 |
1,00 |
5 |
8 |
2,7 |
7,5 |
8,0 |
-0,5 |
0,25 |
6 |
10 |
4,0 |
9,0 |
9,0 |
0 |
0 |
7 |
8 |
2,3 |
7,5 |
5,5 |
2,0 |
4,00 |
8 |
7 |
2,5 |
6,0 |
7,0 |
-1 |
1,00 |
9 |
11 |
6,6 |
10,0 |
10,0 |
0 |
0 |
10 |
6 |
1,7 |
4,5 |
3,0 |
1,5 |
2,25 |
Итого |
70 |
27,0 |
х |
х |
х |
14,0 |
Определим значение коэффициента корреляции рангов Спирмэна по формуле (7.31):
.
Таким образом, значение ρ свидетельствует, что между возрастом оборудования и затратами на ремонт существует тесная прямая связь, т.е. с увеличением возраста оборудования растут и затраты на ремонт оборудования.