
Корреляционное отношение
В том случае статистическую зависимость между признаками определяют с помощью корреляционного отношения.
Рассмотрим
дисперсию случайной величины
(43)
Последнее слагаемое в этом выражении равно нулю. Докажем справедливость этого утверждения для дискретного распределения
(44)
Учитывая,
что
,
(45)
получим
.
(46)
Следовательно,
можно представить в виде
(47)
или
(48)
Здесь
первое слагаемое
представляет собой дисперсию признака
относительно функции регрессии
на
,
которая называется остаточной дисперсией
или условной дисперсией. Она является
мерой рассеяния признака
около линии регрессии. Остаточной
дисперсией называется та часть рассеивания
результативного признака, которую
нельзя объяснить действием наблюдаемого
признака. Остаточная дисперсия может
служить для оценки точности подбора
вида функции регрессии (модельного
уравнения регрессии).
Если
и
независимы, то все условные математические
ожидания совпадают с безусловными и
.
Второе
слагаемое
представляет собой дисперсию функции
регрессии
на
относительно математического ожидания
признака
,
она измеряет влияние признака
на
.
Ее можно использовать для оценки тесноты
связи между
и
.
Введем корреляционное отношение
(49)
Разделим
обе части (48) на и
получим затем корреляционное отношение
в виде
.
(50)
Из (50) следует,
1)
,
так как
является
составной частью
и
поэтому
.
2)только тогда, когда
,
т.е. отсутствует влияние всех прочих
факторов и все распределение
сконцентрировано на кривой регрессии
.
3)
только тогда, когда
,
т.е
В этом случае линия регрессии
на
– горизонтальная прямая, проходящая
через центр распределения. Тогда
переменная
не
коррелированна с
,
т.е. коэффициент корреляции равен нулю
.
Если
регрессия
на
линейна, т.е. линия регрессии –прямая
,
то
и
.
Если
,
то
и
связаны точной линейной зависимостью,
если же
,то
между
и
нет функциональной зависимости. Точная
функциональная зависимость
от
,
отличная от линейной, имеет место тогда
и только тогда, когда
.
Значения
,
лежащие в интервале
являются показателями тесноты группировки
точек около кривой регрессии независимо
от ее вида (формы связи). Корреляционное
отношение
связано с коэффициентом корреляции
соотношениями
.
В случае линейной зависимости между
переменными
.
Разность
может быть использована как показатель
нелинейности связи между переменными,
т.е. в качестве индикатора отклонения
регрессии от линейной.
Все
утверждения относительно
переносятся на
–
показатель тесноты связи между
и
.