- •1.1.2. Функциональные и стохастические связи
- •1.1.3. Различные виды взаимосвязи природных процессов
- •1.2.2. Коэффициент корреляции
- •1.2.3. Оценка коэффициента корреляции и уравнения регрессии. Преобразование Фишера
- •Оценка коэффициентов корреляции и регрессии
- •Преобразование Фишера
- •Анализ погрешностей расчетов по уравнению регрессии
- •1.2.4. Граничные условия математической модели парной корреляции
1.2.2. Коэффициент корреляции
Второй задачей определения взаимосвязи двух величин является определение тесноты связи.
Направление линий регрессии в поле графика (см. рис. 1.5) определяется коэффициентами регрессии а и а'. Первый из них представляет собой тангенс угла наклона линии регрессии y = f(x) к оси х; второй — тангенс угла наклона линии регрессии x = f(y) к оси у.
Рис. 1.5. Линии регрессии в поле графика (y, x).
Обозначим эти углы через а и β. Тогда коэффициенты регрессии
a = tg α, a = tg β. (1.16)
Сумма
углов a,
β,
φ
(см. рис. 1.5) составляет 90°. В случае, если
связь между У и X
функциональная,
то
= 0°
и
+
=
90°.
Отсюда
=
90°—
,
tg
α=tg(900-β)=
ctgβ=
1/tg
и
tgα
tgβ=1.
Если
связь между Y
и
X
отсутствует,
то
=90°,
=
=
0 и tg
α∙tgβ=0.
C
увеличением тесноты связи угол
φ
уменьшается
от 90
до 0°;
вместе с тем увеличиваются углы a
и
β,
а следовательно, тангенсы этих углов и
их произведение. Таким
образом, произведение тангенсов углов
α
и
может служить мерой
тесноты связи X
и
Y.
Обычно
в качестве критерия степени
близости корреляционной связи к линейной
функциональной
зависимости используется корень
квадратный из произведения
tgα
tgβ
(1.17)
Это произведение называется коэффициентом корреляции двух переменных величин и обозначается через r или R. Коэффициент корреляции принимается положительным, если У возрастает с увеличением X, и отрицательным, если У уменьшается с увеличением X.
Подставляя значения а и а', вычисленные по формулам (1.11) (1.14), в формулу (1.19), получаем
(1.19)
Преобразуем уравнение регрессии У по X и X по У, выразив коэффициенты регрессии а и а' через коэффициент корреляции.
Тогда получаем обычно используемые формулы уравнений регрессии:
|
|
(1.20) |
или
(1.21)
где
(xi)
и
(yi
)
—
соответственно средние из возможных У
и X
при
данных xi
и
yi,
σх
и
σу
—
средние квадратические отклонения У
и X;
и
—средние значения X
и
У;
r
—коэффициент
корреляции.
1.2.3. Оценка коэффициента корреляции и уравнения регрессии. Преобразование Фишера
Параметры
уравнения регрессии в практических
расчетах определяются по выборкам.
Поэтому естественно, что они носят
выборочный характер и могут
использоваться лишь как более или менее
достоверные оценки действительных
значений. Обозначим выборочные оценки
параметров а
и
b
и
коэффициента корреляции r
через
,
,
соответственно.
Известно
[6, 60], что эмпирический (выборочный)
коэффициент
корреляции
представляет собой состоятельную
оценку. Однако точность этой оценки или
близость ее к действительному значению
может быть установлена только при
достаточно большом объеме выборки и
невысоком коэффициенте корреляции,
когда распределение его оценок может
приниматься нормальным. Если же число
испытаний невелико (п
<
30),
а коэффициент корреляции велик (
0,4),
то распределение выборочных значений
в частичных совокупностях из п
пар
значений, взятых из нормальной общей
совокупности двух случайных величин,
в которых коэффициент корреляции равен
r,
существенно
отличается от нормального.
Например, на рис. 1.6 представлено распределение оценок коэффициента корреляции r для значений r = 0; 0,4; 0,8 при n= 12.
Рис.
1.6. Распределения выборочного коэффициента
(а)
и
преобразования
Фишера z(б)
при
п
= 12
и различных значениях r.
Таким образом, при значениях r, приближающихся к 1, кривая распределения коэффициента корреляции в частных совокупностях становится все более асимметричной. Обычные методы оценки в этом случае непригодны.
