Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

[ММвЛХ] Лекция 5 Корреляционный анализ

.pdf
Скачиваний:
48
Добавлен:
03.05.2015
Размер:
822.47 Кб
Скачать

Поволжский государственный технологический университет

Корреляционный анализ

Разработчик: доцент каф. ЛТ и Л, к. с.-х. наук Власова Н.А.

Корреляционный анализ

Корреляционным анализом называется многообразие методов исследования параметров генеральной совокупности, распределенной по нормальному закону. Корреляционный анализ позволяет с помощью выборки делать выводы о степени статистической связи (мере связи), между признаками.

Меры связи между признаками

Наиболее распространѐнная мера статистической линейной связи между признаками – коэффициент корреляции Пирсона:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X i

 

Yi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

 

X

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X i

 

2 Yi

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

Y

 

где S xy X i

 

 

Yi

 

– среднее квадратическое

X

Y

 

отклонение по хy;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S x

 

xi

 

 

 

среднее квадратическое отклонение по х;

x

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S y

yi

 

 

 

 

 

– среднее квадратическое отклонение по у.

y

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Меры связи между признаками

Коэффициент корреляции изменяется от -1 до +1.

Если r = 0, то линейная связь между изучаемыми случайными величинами отсутствует,

если r = ±1, то связь функциональная;

«-» – отрицательная зависимость,

«+» – положительная.

При положительной связи с увеличением (уменьшением) одного признака происходит увеличение (уменьшение) другого: ↑x↑y или ↓x↓y.

При отрицательной – при увеличении одного признака другой уменьшается, и наоборот: ↑x↓y, ↓x↑y.

Графический анализ связи

r = 0

 

r = +1

 

 

 

r = -1

 

r = +0,5

 

 

 

Меры связи между признаками

Корреляционное отношение η характеризует тесноту зависимости между случайными величинами при любой форме связи. Вычисляется как отношение среднего квадратического

отклонения групповых средних Syx к общему среднему квадратическому отклонению Sy.

 

 

 

 

 

yx S yx / S y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

y

 

2

yi

 

ˆ

2

 

 

 

 

 

 

 

 

 

 

 

yi

 

 

 

yx

 

 

i

 

 

i

 

 

 

 

 

 

 

 

y y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

i

i

 

 

 

 

 

 

Меры связи между признаками

Корреляционное отношение показывает, какую часть общей вариации результативного признака составляет вариация частных средних этого признака.

Корреляционное отношение имеет всегда положительное значение, которое изменяется от 0 до 1.

Когда групповые средние одинаковы, то η=0 и связь отсутствует.

В случае строгой прямолинейной связи η=r=1.

Чем ближе η к 1, тем связь теснее.

Чем больше различие между η и r, тем связь более криволинейна. В предельном случае, когда связь строго криволинейна и кривая проходит через групповые средние так, что Syx=Sy, то η=1, а r=0.

Таблица 3. Шкала оценки меры связи

r ( η )

Характеристика меры связи между

 

случайными величинами

0 – 0,30

Слабая

 

 

0,31 – 0,50

Умеренная

 

 

0,51 – 0,70

Значительная

 

 

0,71 – 0,90

Большая (тесная)

 

 

0,91 – 1

Очень тесная

 

 

Обработка качественной информации

Коэффициент ранговой корреляции Спирмена

Пример

Семь пород, обозначенных А, Б,… ранжированы по светолюбию и по устойчивости к фитозаболеваниям (табл.

4).

Таблица 4. Вычисление коэффициента ранговой корреляции

Показатель

Породы

 

 

 

А

Б

В

Г

Д

Е

Ж

 

 

 

 

 

 

 

 

 

Ряд 1

2

4

7

3

5

1

6

-

 

 

 

 

 

 

 

 

 

Ряд 2

3

1

2

4

7

6

5

-

 

 

 

 

 

 

 

 

 

di

-1

3

5

-1

-2

-5

1

0

 

 

 

 

 

 

 

 

 

d 2

1

9

25

1

4

25

1

66

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Требуется установить, существует ли связь между светолюбием и фитоустойчивостью.