
- •Корреляционный анализ.
- •82.1. Функциональная, статистическая и корреляционная зависимости
- •82.3 Условные средние
- •82.3 Выборочные уравнения регрессии
- •82.4 Нахождение параметров выборочного уравнения прямой линии среднеквадратичной регрессии по несгруппированным данным
- •82.2Корреляционная таблица и корреляционное поле
- •Выборочный коэффициент корреляции
- •11. Выборочное корреляционное отношение
- •Свойства выборочного корреляционного отношения
- •Корреляционное отношение как мера корреляционной связи. Достоинства и недостатки этой меры
- •82.5 Простейшие случаи криволинейной корреляции
- •Множественная корреляция
Выборочный коэффициент корреляции
Так
как
,
получаем
,
,
(82.3)
где
выборочный
коэффициент корреляции,
-
исправленные
выборочные
средние квадратические
отклонения.
Подставив правую часть равенства (82.3) в (82.2) окончательно получим выборочное уравнение прямой линии регрессии Y на X и X на Y вида
,
.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. |
82.1 |
|
|
Отсюда следует, что коэффициент корреляции r измеряет силу (тесноту) линейной связи между Y и X.
Если
n
велико, то
близок к истинному
.
Использование
как меры связи
имеет смысл для нормального или близкого
к нему распределения, для которых
естественной мерой связи является
.
Можно доказать,
что
,
где
–
часть дисперсии , которая обусловлена
линейной , прогнозируемой при каждом
значении X
компонентой Y,
=
- остаточная, не
коррелируемая с X
компонента.
Выборочный
коэффициент корреляции
является оценкой
коэффициента корреляции
генеральной
совокупности
и поэтому также служит для измерения
линейной
связи между величинами — количественными
признаками
Y
и
X.
Допустим,
что выборочный коэффициент корреляции,
найденный по выборке, оказался отличным
от
нуля. Так как выборка отобрана случайно,
то отсюда еще
нельзя заключить, что коэффициент
корреляции генеральной
совокупности также отличен от нуля.
Возникает
необходимость проверить гипотезу о
значимости (существенности) выборочного
коэффициента корреляции.
Пусть
распределение случайной величины X
близко к нормальному. Тогда для больших
выборок можно найти доверительные
интервалы. Пусть надежность
задана.
Тогда доверительные интервалы для
генерального коэффициента корреляции
и
углового коэффициента линии регрессии
равны /2, стр. 323/
;
;
где
значения е находим из уравнения 2
,
- функция Лапласа.
Проверим
гипотезу, что коэффициент корреляции
генеральной совокупности равен нулю
-
.
Конкурирующая
гипотеза -
.
В качестве критерия проверки нулевой гипотезы примем случайную величину
Величина T при справедливости нулевой гипотезы имеет распределение Стьюдента с k = n - 2 степенями свободы.
Поскольку
конкурирующая гипотеза имеет вид
,
критическая область — двусторонняя.
Обозначим значение критерия, вычисленное
по данным наблюдений, через
и
сформулируем правило проверки нулевой
гипотезы.
Правило.
Для того чтобы при заданном уровне
значимости
проверить
нулевую гипотезу
о равенстве нулю генерального
коэффициента корреляции нормальной
случайной двумерной величины при
конкурирующей гипотезе
,
надо вычислить наблюдаемое значение
критерия:
и по
таблице критических точек распределения
Стьюдента, по заданному уровню значимости
и числу степеней свободы k
= n
- 2 найти
критическую точку
для
двусторонней критической области.
Если
,
то
нет оснований отвергать нулевую
гипотезу.
Если
- нулевую гипотезу отвергают.
Пример. По выборке объема n =122, извлеченной из нормальной двумерной совокупности, найден выборочный коэффициент корреляции = 0,4. При уровне значимости =0,05 проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе .
Решение. Найдем наблюдаемое значение критерия:
=
0,4
.
По условию, конкурирующая гипотеза
имеет вид
,
поэтому критическая область —
двусторонняя.
По
уровню значимости 0,05 и числу степеней
свободы k
=
122 – 2 = 120 находим по таблице для
двусторонней критической области
критическую точку
=
(0,05; 120) = 1,98.
Поскольку > - нулевую гипотезу отвергаем. Другими словами, выборочный коэффициент корреляции значимо отличается от нуля, т. е. X и Y коррелированы.