[ММвЛХ] Лекция 5 Корреляционный анализ
.pdfПоволжский государственный технологический университет
Корреляционный анализ
Разработчик: доцент каф. ЛТ и Л, к. с.-х. наук Власова Н.А.
Корреляционный анализ
•Корреляционным анализом называется многообразие методов исследования параметров генеральной совокупности, распределенной по нормальному закону. Корреляционный анализ позволяет с помощью выборки делать выводы о степени статистической связи (мере связи), между признаками.
Меры связи между признаками
•Наиболее распространѐнная мера статистической линейной связи между признаками – коэффициент корреляции Пирсона:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X i |
|
Yi |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
r |
|
X |
Y |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
X i |
|
2 Yi |
|
2 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
Y |
|||||||||
|
где S xy X i |
|
|
Yi |
|
– среднее квадратическое |
||||||||||||||||||||
• |
X |
Y |
||||||||||||||||||||||||
|
отклонение по хy; |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
• |
S x |
|
xi |
|
|
|
– среднее квадратическое отклонение по х; |
|||||||||||||||||||
x |
||||||||||||||||||||||||||
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
k |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
• |
S y |
yi |
|
|
|
|
|
– среднее квадратическое отклонение по у. |
||||||||||||||||||
y |
|
|
|
|||||||||||||||||||||||
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Меры связи между признаками
•Коэффициент корреляции изменяется от -1 до +1.
•Если r = 0, то линейная связь между изучаемыми случайными величинами отсутствует,
•если r = ±1, то связь функциональная;
•«-» – отрицательная зависимость,
•«+» – положительная.
•При положительной связи с увеличением (уменьшением) одного признака происходит увеличение (уменьшение) другого: ↑x↑y или ↓x↓y.
•При отрицательной – при увеличении одного признака другой уменьшается, и наоборот: ↑x↓y, ↓x↑y.
Графический анализ связи
r = 0 |
|
r = +1 |
|
|
|
r = -1 |
|
r = +0,5 |
|
|
|
Меры связи между признаками
•Корреляционное отношение η характеризует тесноту зависимости между случайными величинами при любой форме связи. Вычисляется как отношение среднего квадратического
отклонения групповых средних Syx к общему среднему квадратическому отклонению Sy.
• |
|
|
|
|
|
yx S yx / S y |
|
|
|
|
|
|
||||
• |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
• |
|
|
|
y |
|
|
y |
|
2 |
yi |
|
ˆ |
2 |
|
||
|
|
|
|
|
|
|
|
|
|
yi |
|
|
||||
|
yx |
|
|
i |
|
|
i |
|
|
|
|
|||||
|
|
|
|
y y |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
i |
i |
|
|
|
|
|
|
Меры связи между признаками
•Корреляционное отношение показывает, какую часть общей вариации результативного признака составляет вариация частных средних этого признака.
•Корреляционное отношение имеет всегда положительное значение, которое изменяется от 0 до 1.
•Когда групповые средние одинаковы, то η=0 и связь отсутствует.
•В случае строгой прямолинейной связи η=r=1.
•Чем ближе η к 1, тем связь теснее.
•Чем больше различие между η и r, тем связь более криволинейна. В предельном случае, когда связь строго криволинейна и кривая проходит через групповые средние так, что Syx=Sy, то η=1, а r=0.
Таблица 3. Шкала оценки меры связи
r ( η ) |
Характеристика меры связи между |
|
случайными величинами |
0 – 0,30 |
Слабая |
|
|
0,31 – 0,50 |
Умеренная |
|
|
0,51 – 0,70 |
Значительная |
|
|
0,71 – 0,90 |
Большая (тесная) |
|
|
0,91 – 1 |
Очень тесная |
|
|
Обработка качественной информации
Коэффициент ранговой корреляции Спирмена
Пример
•Семь пород, обозначенных А, Б,… ранжированы по светолюбию и по устойчивости к фитозаболеваниям (табл.
4).
•Таблица 4. Вычисление коэффициента ранговой корреляции
Показатель |
Породы |
|
|
|
А |
Б |
В |
Г |
Д |
Е |
Ж |
∑ |
|
|
|
|
|
|
|
|
|
Ряд 1 |
2 |
4 |
7 |
3 |
5 |
1 |
6 |
- |
|
|
|
|
|
|
|
|
|
Ряд 2 |
3 |
1 |
2 |
4 |
7 |
6 |
5 |
- |
|
|
|
|
|
|
|
|
|
di |
-1 |
3 |
5 |
-1 |
-2 |
-5 |
1 |
0 |
|
|
|
|
|
|
|
|
|
d 2 |
1 |
9 |
25 |
1 |
4 |
25 |
1 |
66 |
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
•Требуется установить, существует ли связь между светолюбием и фитоустойчивостью.