- •4.5. Выборочный коэффициент корреляции
- •4.6. Доверительный интервал для генерального коэффициента корреляции.
- •4.7. Свойства выборочного коэффициента корреляции
- •4.8. Выборочное корреляционное отношение
- •4.9. Свойства выборочного корреляционного отношения
- •4.10. Основные понятия множественной корреляции
- •4.11. Показатели связи для порядковых и качественных признаков.
4.10. Основные понятия множественной корреляции
Существуют задачи, в которых необходимо исследовать связь между несколькими признаками. В этом случае корреляцию называют множественной.
В простейшем случае число признаков равно трем и связь между ними линейная. Основные задачи теории корреляции в этом случае таковы:
1) по данным измерений оценить тесноту корреляционной связи между признаком Z и признакимиX и Y;
2) оценить тесноту корреляционной связи между ZиX(при постоянномY ), а также междуZи Y (при постоянномX );
3) найти выборочное уравнение связи вида =ax +by +c, то есть найти выборочные коэффициенты регрессииа иb и параметрс, где- условное среднее признакаz.
Теснота корреляционной связи между признаком Z и признакамиX и Y, совместно влияющими наZ, оценивается величиной выборочного коэффициента множественной корреляции
, (4.18)
где rxz ,ryz ,rxy – выборочные парные коэффициенты корреляции между признакамиX и Z,Y и Z ,X и Y соответственно. Коэффициент множественной корреляции всегда не меньше соответствующих парных, т.е.rz,xy ≥ |rzx | ,rz,xy ≥ |rzy | . Значимость коэффициента множественной корреляции определяется с помощью таблицы критических значений коэффициента корреляции (Приложение 8) приf =n – (m+ 2), гдеm – число признаков.
Теснота корреляционной связи между ZиX(при постоянномY ), а также междуZи Y (при постоянномX) оценивается частными выборочными коэффициентами корреляции:
, (4.19)
(4.20)
соответственно. Постоянство Y (постоянствоX) означает частичное или полное исключение его влияния на связь между значениями признаковZиX (признаковZи Y ). Значимость частных коэффициентов корреляции определяют так же, как и парных, беря число степеней свободыf =n – (m+ 2), гдеm – число фиксируемых признаков.
Коэффициенты корреляции rz,xy ,rzx(y) иrzy(x)имеют такие же свойства и смысл, что и выборочный коэффициент корреляции между двумя признаками – все они дают оценку тесноты линейной связи между признаками. Значения их должны удовлетворять неравенствам: 0 ≤rz,xy ≤ 1, 0 ≤rzx(y) ≤ 1, 0 ≤rzy(x) ≤ 1.
Выборочное уравнение регрессии удобнее искать в виде
-,
где
,
- выборочные средние,- выборочные средние квадратичные отклонения признаковZ ,X иY .
Пример 4.8. Пусть известны выборочные парные коэффициенты корреляции между признакамиX ,Z иY :rxz = - 0,16 ;rxy = 0,48 ;ryz = 0,60 . Вычислить выборочный коэффициент множественной корреляцииrz,xy и частные выборочные коэффициенты корреляции.
Решение. Вычисляем выборочный коэффициент множественной корреляции:
(rz,xy)2 == 0,6208,
rz,xy == 0,79.
Связь признака Z с признакамиX иY оказалась высокой.
Вычислим частные выборочные коэффициенты корреляции. По формуле (4.19) мера связи между Z иX (при постоянномY )
rzx(y) = = - 0,64.
Видим, что при исключенном признаке Y связь получилась обратная и значительная. А при неисключенном влиянии признакаY она слабая (rxz = - 0,16) и также обратная.
Для связи между между Zи Y (при постоянномX) получаем
rzy(x) =0,78.
Связь прямая и высокая. А при неисключенном влиянии признака X она была заметно ниже (ryz = 0,60).
Полученные значения частных коэффициентов корреляции имеют следующее объяснение. Связь между признаками Z иX обратная, а междуZи Y – прямая. То есть действие наZпризнакаX уменьшает действие наZпризнака Y . Поэтому, например, при исключении признакаX действие признакаY проявляется сильнее и коэффициент корреляции увеличивается с 0,6 до 0,78.