Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Л 31 32 Коррел анализ.doc.DOC
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
690.18 Кб
Скачать

Выборочный коэффициент корреляции

Так как , получаем

,

, (82.3)

где выборочный коэффициент корреляции, - исправленные выборочные средние квадратические отклонения.

Подставив правую часть равенства (82.3) в (82.2) оконча­тельно получим выборочное уравнение прямой линии регрессии Y на X и X на Y вида

, .

Рис.

82.1

Известно, что если величины Y и X независимы, то коэффициент корреляции r =0, если r=±1, то Y и X связаны линейной функциональной зависимостью. Если зависимость между Х и У функциональна и криволинейна, то коэффициент корреляции r = 0. (см. рис.82.1)

Отсюда следует, что коэффициент корреляции r измеряет силу (тесноту) линейной связи между Y и X.

Если n велико, то близок к истинному . Использование как меры связи имеет смысл для нормального или близкого к нему распределения, для которых естественной мерой связи является .

Можно доказать, что , где – часть дисперсии , которая обусловлена линейной , прогнозируемой при каждом значении X компонентой Y, = - остаточная, не коррелируемая с X компонента.

Выборочный коэффициент корреляции является оценкой коэффициента корреляции генеральной сово­купности и поэтому также служит для измерения линей­ной связи между величинами — количественными призна­ками Y и X. Допустим, что выборочный коэффициент корреляции, найденный по выборке, оказался отличным от нуля. Так как выборка отобрана случайно, то отсюда еще нельзя заключить, что коэффициент корреляции ге­неральной совокупности также отличен от нуля. Возни­кает необходимость проверить гипотезу о значимости (существенности) выборочного коэффициента корреляции.

Пусть распределение случайной величины X близко к нормальному. Тогда для больших выборок можно найти доверительные интервалы. Пусть надежность задана. Тогда доверительные интервалы для генерального коэффициента корреляции и углового коэффициента линии регрессии равны /2, стр. 323/

;

;

где значения е находим из уравнения 2 , - функция Лапласа.

Проверим гипотезу, что коэффициент корреляции генеральной совокупности равен нулю - . Конкурирующая гипотеза - .

В качестве критерия проверки нулевой гипотезы примем случайную величину

Величина T при справедливости нулевой гипотезы имеет распределение Стьюдента с k = n - 2 степенями свободы.

Поскольку конкурирующая гипотеза имеет вид , критическая область — двусторонняя. Обозначим значение критерия, вычисленное по дан­ным наблюдений, через и сформулируем правило проверки нулевой гипотезы.

Правило. Для того чтобы при заданном уровне зна­чимости проверить нулевую гипотезу о ра­венстве нулю генерального коэффициента корреляции нормальной случайной двумерной величины при конку­рирующей гипотезе , надо вычислить наблюда­емое значение критерия:

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней сво­боды k = n - 2 найти критическую точку для двусторонней критической области.

Если , то нет оснований отвергать нуле­вую гипотезу.

Если - нулевую гипотезу отвергают.

Пример. По выборке объема n =122, извлеченной из нормальной двумерной совокупности, найден выборочный коэффициент корреля­ции = 0,4. При уровне значимости =0,05 проверить нулевую гипо­тезу о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе .

Решение. Найдем наблюдаемое значение критерия:

= 0,4 . По условию, конкурирующая гипотеза имеет вид , поэтому критическая область — двусторонняя.

По уровню значимости 0,05 и числу степеней свободы k = 122 – 2 = 120 находим по таблице для двусторонней критической области критическую точку = (0,05; 120) = 1,98.

Поскольку > - нулевую гипотезу отвергаем. Другими словами, выборочный коэффициент корреляции значимо отличается от нуля, т. е. X и Y коррелированы.