
8 Хнэу. Кафедра кСиТ. Курс «Стандартизация и метрология…». Практика 3 Практическое занятие 3 Корреляционный анализ
Учебный материал
Корреляционный анализ – это совокупность методов математической статистики, предназначенных для установления факта наличия или отсутствия взаимосвязей, взаимозависимости между двумя или несколькими количественными показателями (признаками).
В рамках корреляционного анализа используются следующие приемы:
- оценка парной корреляции – позволяет исследовать связь между двумя показателями;
- множественная корреляция – для оценки зависимости одного показателя от группы показателей;
- каноническая корреляция – для анализа связи между группами показателей;
- частная корреляция - позволяет исследовать связь между двумя показателями, элиминируя влияние других показателей;
- ранговая корреляция – для анализа связей между качественными показателями.
Для исследования связи между двумя показателями, имеющими нормальное распределение, используется коэффициент парной корреляции:
(-1
rxy
+1),
где:
X, Y – случайные величины, распределенные по нормальному закону;
xi – i-тое наблюдение показателя X,
yi – i-тое наблюдение показателя Y,
– выборочное
среднее показателя X
(центр группировки),
– выборочное
среднее показателя Y
(центр группировки).
Положительный знак коэффициента парной корреляции означает, что с увеличением одной переменной увеличивается и другая, отрицательный – что с увеличением одной другая уменьшается.
Абсолютная величина коэффициента означает силу связи (условно принимаем: 0 – 0,3 – слабая связь, 0,3 – 0,7 – связь средней силы, 0,7 – 1 – сильная связь). Связь между показателями может быть полной, то есть функциональной, тогда коэффициент равен 1 или -1, а может вовсе отсутствовать, тогда коэффициент равен 0. Если зависимость неполная, поскольку она искажена влиянием других, посторонних факторов, то коэффициент будет принимать промежуточные значения (между –1, 0, 1) в зависимости от тесноты связи. Например, производительность труда зависит от стажа работы, но реально существуют и другие факторы, изменяющие эту зависимость (здоровье и т.п.).
С помощью коэффициента корреляции можно получить ответы на следующие вопросы:
- есть ли связь между показателями X и Y?
- насколько тесна связь между показателями X и Y?
Сильная корреляция означает закономерность: чем более отличается от своего среднего значение одной переменной, тем дальше от своего среднего значение другой. При этом нужно помнить, что коэффициент корреляции применим только в отношении случайных величин, имеющих нормальное распределение.
Корреляционный анализ непосредственно не выявляет причинные связи, он только устанавливает численное значение силы этих связей. Более того: корреляция не есть причина. В результате применения корреляционного анализа исследователь устанавливает только один факт - есть или нет связь между двумя переменными, изменяется одна переменная вместе с другой или нет. Необходимо отдавать себе отчет в том, что наличие связи ничего не говорит о ее причине, о том, чем данная связь может быть обусловлена. Причина взаимосвязи переменных может, как заключаться в одной из этих переменных, так и лежать вне рассматриваемых явлений.
Пример.
Требуется оценить тесноту взаимосвязи ряда показателей, характеризующих студентов вуза N:
Y – Успеваемость по предмету (бал.)
X1 – Посещаемость лекций (%)
X2 – Материальное положение (бал.)
X3 – Отношение к преподавателю (бал.)
Испытуемые (студенты) |
Успеваемость |
Посещаемость |
Материальное положение |
Отношение к преподавателю |
1 |
5,0 |
100 |
7 |
10 |
2 |
4,5 |
84 |
5 |
9 |
3 |
4,6 |
90 |
7 |
7 |
4 |
5,0 |
93 |
5 |
10 |
5 |
3,2 |
60 |
9 |
5 |
6 |
4,5 |
84 |
7 |
8 |
7 |
2,4 |
52 |
7 |
7 |
8 |
2,2 |
34 |
9 |
6 |
9 |
3,5 |
68 |
5 |
8 |
10 |
4,7 |
93 |
6 |
5 |
11 |
4,3 |
88 |
8 |
4 |
12 |
3,1 |
74 |
6 |
9 |
13 |
3,6 |
78 |
7 |
10 |
14 |
2,4 |
65 |
9 |
6 |
15 |
4,5 |
88 |
4 |
7 |
16 |
4,9 |
93 |
8 |
9 |
17 |
5,0 |
94 |
6 |
8 |
18 |
3,0 |
79 |
5 |
5 |
19 |
4,1 |
75 |
6 |
10 |
20 |
4,9 |
92 |
8 |
6 |
21 |
4,0 |
69 |
4 |
7 |
22 |
3,0 |
78 |
7 |
9 |
23 |
4,8 |
96 |
8 |
10 |
24 |
2,0 |
54 |
8 |
6 |
25 |
4,9 |
75 |
4 |
5 |
26 |
4,2 |
89 |
5 |
8 |
27 |
3,6 |
68 |
8 |
8 |
28 |
4,8 |
95 |
10 |
9 |
29 |
4,0 |
96 |
7 |
6 |
30 |
3,4 |
89 |
5 |
4 |