
- •О с н о в ы н а у ч н ы х и с л е д о в а н и й
- •1. Определение проблемы;
- •1.2 Анализ сомнительных вариант
- •2.1 Определение необходимого объема выборки
- •3.1 Применение коэффициентов асимметрии и эксцесса для проверки нормальности распределения
- •Практическая работа 4
- •4. Корреляционный анализ
- •4.1. Параметрические показатели связи
- •4.2. Установление наличия связи между выборками.
- •Практическая работа 5
- •5. Регрессионный анализ
- •Первый этап - определение параметров линейной регрессии
- •5.2. Оценка достоверности показателей регрессии
- •Практическая работа 6
- •6. Общие правила подготовки и написания отчетов по научно-исследовательской работе
- •6.1. Порядок составления отчетов
- •6.2. Титульный лист
- •Практическая работа 7
- •7. Составление библиографической записи документа
- •7.1. Одноуровневое библиографическое описание.
- •7.2. Аналитическое и библиографическое описание
- •Заключение
- •Период 2000 – 2010гг
- •Виноградова л.И. Основы научных исследований
- •660017, Красноярск, ул. Ленина, 117
Практическая работа 4
4. Корреляционный анализ
Корреляционный анализ в научных исследованиях применяется для установления прямолинейной связи между варьирующими признаками. После установления закона распределения можно переходить к корреляционному анализу.
4.1. Параметрические показатели связи
Сопряженность между переменными величинами X и Y можно установить с помощью показателя, который называют эмпирическим коэффициентом корреляции r. Коэффициент корреляции нашел широкое применение в практике, но он не является универсальным показателем корреляционных связей, так как способен характеризовать только линейные связи. При наличии нелинейной зависимости между варьирующими признаками применяют другие показатели связи – непараметрические критерии.
4.2. Установление наличия связи между выборками.
В исследованиях редко приходится иметь дело с функциональными связями, когда каждому значению одной величины соответствует строго определенное значение другой величины. Чаще приходится анализировать такие соотношения, когда каждому значению признака Х соответствует не одно, а множество значений признака Y. Такого рода зависимости называются стохастическими (вероятностными) или корреляционными [5].
Функциональные связи легко обнаружить и измерить на единичных и групповых объектах, однако этого нельзя проделать с корреляционными связями, которые можно изучать только на групповых объектах методами математической статистики. Корреляционная связь между признаками бывает линейной и нелинейной, положительной и отрицательной. Задача корреляционного анализа сводится к установлению направления и формы связи между варьирующими признаками, измерению ее тесноты и, наконец, к проверке достоверности выборочных показателей корреляции.
По форме корреляционные зависимости могут быть как прямолинейными, так и криволинейными. Под прямолинейной корреляционной зависимостью между двумя признаками Х и Y понимают такую зависимость, которая носит линейный характер и выражается уравнением прямой линии. Мы будем рассматривать только линейную корреляционную зависимость.
В качестве числового показателя парной линейной корреляции, характеризующего тесноту и направление связи, используется коэффициент корреляции -r. Он является безразмерной величиной, изменяющейся в области от 0 до 1 (-1 r +1). Положительные значения r указывают на прямую связь ( с увеличением Х увеличивается Y(х)), отрицательные значения r - на обратную ( с увеличением Х уменьшается Y(х)). Чем | r | ближе к единице, тем теснее связь. При | r | равной единице связь является функциональной. Для различного рода задач считается, что при | r | 0.30 теснота связи слабая, при 0.30 | r | 0.70 - средняя, при | r | 0.70 - тесная.
Пример. На конкретном примере проведем корреляционный анализ. Оценим тесноту связи между Х и Y ( Х - урожайность на одном участке за 10 лет, Y - урожайность на втором участке за 10 лет).
Определим коэффициент корреляции, для чего вначале определим средние квадратические отклонения х и y по следующим формулам
(4.1)
=
0.94 ;
(4.2)
=
0.91
- далее определяем ковариацию по следующей формуле
(4.3)
=
-1.54/10 = -0.154
для расчета ковариации проведем промежуточные расчеты в следующей таблице
Таблица 4.1 Исходные данные и промежуточные расчеты
Хi |
Yi |
Хi
-
|
Yi
- |
(Xi
- |
16.8 |
16.4 |
0.1 |
-1.5 |
-0.15 |
15.5 |
17.1 |
-1.2 |
-0.8 |
0.96 |
15.8 |
18.4 |
-0.9 |
0.5 |
-0.45 |
17.0 |
18.9 |
0.3 |
1.0 |
0.3 |
17.5 |
17.4 |
0.8 |
-0.5 |
-0.4 |
18.4 |
18.2 |
1.7 |
0.3 |
0.51 |
15.2 |
19.6 |
-1.5 |
1.7 |
-2.55 |
16.9 |
17.7 |
0.2 |
-0.2 |
-0.04 |
17.1 |
18.4 |
0.4 |
0.5 |
0.2 |
16.6 |
17.1 |
-0.1 |
-0.8 |
0.08 |
166.8 |
179.2 |
|
|
-1.54 |
далее определяем коэффициент корреляции по следующей формуле
(4.4)
=
-0.154/ 0.85 = -0.19;
или по формуле
(4.5)
=
,
Для расчета по формуле 4.5 используем следующую таблицу
Таблица 4.2 Исходные данные и вспомогательные расчеты
-
N
Х
Y
ХY
X2
Y2
1
16.8
16.4
275.5
282.2
269.0
2
15.5
17.1
265.1
240.2
292.4
3
15.8
18.4
290.7
249.6
338.6
4
17.0
18.9
321.3
289.0
357.2
5
17.5
17.4
304.5
306.2
302.8
6
18.4
18.2
334.9
338.6
331.2
7
15.2
19.6
297.9
231.0
384.2
8
16.9
17.7
299.1
285.6
313.3
9
17.1
18.4
314.6
292.4
338.6
10
16.6
17.1
283.9
275.6
292.4
166.8
179.2
2987.5
2790.4
3219.7
Полученные расчеты показывают, что между Х и Y связь отсутствует, коэффициент корреляции 0.3.
Далее необходимо оценить коэффициент корреляции на значимость. Эмпирический коэффициент корреляции, как и любой другой выборочный показатель, служит оценкой его генерального параметра и как величина случайная сопровождается ошибкой. Оценим эту ошибку по следующей формуле
(4.6)
=0.35,
отношение выборочного коэффициента
корреляции к своей ошибке служит
критерием для проверки нулевой гипотезы
т. е. предполагают, что в генеральной
совокупности этот показатель равен 0,
= 0.
Определим критерий Стьюдента фактический
tф = r/Sr (4.7)
tф = r/Sr = -0.19/0.35 = -0.54;
Определяем табличный или критический критерий Стьюдента tst = 2.31 (по числу степеней свободы k = n-2 и уровню значимости а = 5% по таблице в приложении 8).
Далее оцениваем нулевую гипотезу: если tф tst, то нулевая гипотеза принимается, следовательно коэффициент корреляции не значимый.
Достоверность выборочного коэффициента корреляции можно проверить по специальной таблице приложения 9, в которой содержатся критические точки коэффициента корреляции rst. Критический коэффициент корреляции определяется по уровню значимости а = 5% и числу степеней свободы k = 10 – 2 = 8. Получаем, что rst = 0.63, следовательно и этот метод оценки коэффициента корреляции на достоверность подтверждает, что коэффициент корреляции не значимый.
Задание. Для двух выборок X и Y рассчитать коэффициент корреляции, оценить его достоверность двумя методами, оценивая нулевую гипотезу по критерию Стьюдента и критическому коэффициенту корреляции. По полученным результатам оценить наличие связи между этими выборками. Исходные данные из предыдущих работ.