Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
163
Добавлен:
10.04.2015
Размер:
835.07 Кб
Скачать

Практическая работа 4

4. Корреляционный анализ

Корреляционный анализ в научных исследованиях применяется для установления прямолинейной связи между варьирующими признаками. После установления закона распределения можно переходить к корреляционному анализу.

4.1. Параметрические показатели связи

Сопряженность между переменными величинами X и Y можно установить с помощью показателя, который называют эмпирическим коэффициентом корреляции r. Коэффициент корреляции нашел широкое применение в практике, но он не является универсальным показателем корреляционных связей, так как способен характеризовать только линейные связи. При наличии нелинейной зависимости между варьирующими признаками применяют другие показатели связи – непараметрические критерии.

4.2. Установление наличия связи между выборками.

В исследованиях редко приходится иметь дело с функциональными связями, когда каждому значению одной величины соответствует строго определенное значение другой величины. Чаще приходится анализировать такие соотношения, когда каждому значению признака Х соответствует не одно, а множество значений признака Y. Такого рода зависимости называются стохастическими (вероятностными) или корреляционными [5].

Функциональные связи легко обнаружить и измерить на единичных и групповых объектах, однако этого нельзя проделать с корреляционными связями, которые можно изучать только на групповых объектах методами математической статистики. Корреляционная связь между признаками бывает линейной и нелинейной, положительной и отрицательной. Задача корреляционного анализа сводится к установлению направления и формы связи между варьирующими признаками, измерению ее тесноты и, наконец, к проверке достоверности выборочных показателей корреляции.

По форме корреляционные зависимости могут быть как прямолинейными, так и криволинейными. Под прямолинейной корреляционной зависимостью между двумя признаками Х и Y понимают такую зависимость, которая носит линейный характер и выражается уравнением прямой линии. Мы будем рассматривать только линейную корреляционную зависимость.

В качестве числового показателя парной линейной корреляции, характеризующего тесноту и направление связи, используется коэффициент корреляции -r. Он является безразмерной величиной, изменяющейся в области от 0 до  1 (-1  r  +1). Положительные значения r указывают на прямую связь ( с увеличением Х увеличивается Y(х)), отрицательные значения r - на обратную ( с увеличением Х уменьшается Y(х)). Чем | r | ближе к единице, тем теснее связь. При | r | равной единице связь является функциональной. Для различного рода задач считается, что при | r |  0.30 теснота связи слабая, при 0.30  | r |  0.70 - средняя, при | r |  0.70 - тесная.

Пример. На конкретном примере проведем корреляционный анализ. Оценим тесноту связи между Х и Y ( Х - урожайность на одном участке за 10 лет, Y - урожайность на втором участке за 10 лет).

  1. Определим коэффициент корреляции, для чего вначале определим средние квадратические отклонения х и y по следующим формулам

(4.1)

= 0.94 ;

(4.2)

= 0.91

- далее определяем ковариацию по следующей формуле

(4.3)

= -1.54/10 = -0.154

для расчета ковариации проведем промежуточные расчеты в следующей таблице

Таблица 4.1 Исходные данные и промежуточные расчеты

Хi

Yi

Хi -

Yi -

(Xi -)(Yi -)

16.8

16.4

0.1

-1.5

-0.15

15.5

17.1

-1.2

-0.8

0.96

15.8

18.4

-0.9

0.5

-0.45

17.0

18.9

0.3

1.0

0.3

17.5

17.4

0.8

-0.5

-0.4

18.4

18.2

1.7

0.3

0.51

15.2

19.6

-1.5

1.7

-2.55

16.9

17.7

0.2

-0.2

-0.04

17.1

18.4

0.4

0.5

0.2

16.6

17.1

-0.1

-0.8

0.08

166.8

179.2

-1.54

далее определяем коэффициент корреляции по следующей формуле

(4.4)

= -0.154/ 0.85 = -0.19;

или по формуле

(4.5)

=,

Для расчета по формуле 4.5 используем следующую таблицу

Таблица 4.2 Исходные данные и вспомогательные расчеты

N

Х

Y

ХY

X2

Y2

1

16.8

16.4

275.5

282.2

269.0

2

15.5

17.1

265.1

240.2

292.4

3

15.8

18.4

290.7

249.6

338.6

4

17.0

18.9

321.3

289.0

357.2

5

17.5

17.4

304.5

306.2

302.8

6

18.4

18.2

334.9

338.6

331.2

7

15.2

19.6

297.9

231.0

384.2

8

16.9

17.7

299.1

285.6

313.3

9

17.1

18.4

314.6

292.4

338.6

10

16.6

17.1

283.9

275.6

292.4

166.8

179.2

2987.5

2790.4

3219.7

Полученные расчеты показывают, что между Х и Y связь отсутствует, коэффициент корреляции  0.3.

Далее необходимо оценить коэффициент корреляции на значимость. Эмпирический коэффициент корреляции, как и любой другой выборочный показатель, служит оценкой его генерального параметра  и как величина случайная сопровождается ошибкой. Оценим эту ошибку по следующей формуле

(4.6)

=0.35, отношение выборочного коэффициента корреляции к своей ошибке служит критерием для проверки нулевой гипотезы т. е. предполагают, что в генеральной совокупности этот показатель равен 0,  = 0.

Определим критерий Стьюдента фактический

tф = r/Sr (4.7)

tф = r/Sr = -0.19/0.35 = -0.54;

Определяем табличный или критический критерий Стьюдента tst = 2.31 (по числу степеней свободы k = n-2 и уровню значимости а = 5% по таблице в приложении 8).

Далее оцениваем нулевую гипотезу: если tф  tst, то нулевая гипотеза принимается, следовательно коэффициент корреляции не значимый.

Достоверность выборочного коэффициента корреляции можно проверить по специальной таблице приложения 9, в которой содержатся критические точки коэффициента корреляции rst. Критический коэффициент корреляции определяется по уровню значимости а = 5% и числу степеней свободы k = 10 – 2 = 8. Получаем, что rst = 0.63, следовательно и этот метод оценки коэффициента корреляции на достоверность подтверждает, что коэффициент корреляции не значимый.

Задание. Для двух выборок X и Y рассчитать коэффициент корреляции, оценить его достоверность двумя методами, оценивая нулевую гипотезу по критерию Стьюдента и критическому коэффициенту корреляции. По полученным результатам оценить наличие связи между этими выборками. Исходные данные из предыдущих работ.

Соседние файлы в папке Основы научных исследований