Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекция_весна 1.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
451.07 Кб
Скачать

1.2.2. Коэффициент корреляции

Второй задачей определения взаимосвязи двух величин является определение тесноты связи.

Направление линий регрессии в поле графика (см. рис. 1.5) определяется коэффициентами регрессии а и а'. Первый из них представляет собой тангенс угла наклона линии регрессии y = f(x) к оси х; второй — тангенс угла наклона линии регрессии x = f(y) к оси у.

Рис. 1.5. Линии регрессии в поле графика (y, x).

Обозначим эти углы через а и β. Тогда коэффициенты регрессии

a = tg α, a = tg β. (1.16)

Сумма углов a, β, φ (см. рис. 1.5) составляет 90°. В случае, если связь между У и X функциональная, то = и + = 90°. Отсюда = 90°— , tg α=tg(900-β)= ctgβ= 1/tg и tgα tgβ=1. Если связь между Y и X отсутствует, то =90°, = = 0 и tg αtgβ=0.

C увеличением тесноты связи угол φ уменьшается от 90 до ; вместе с тем увеличиваются углы a и β, а следовательно, тангенсы этих углов и их произведение. Таким образом, произведение тангенсов углов α и может служить мерой тесноты связи X и Y. Обычно в качестве критерия степени близости корреляционной связи к линейной функциональной зависимости используется корень квадратный из произведения tgα tgβ

(1.17)

Это произведение называется коэффициентом кор­реляции двух переменных величин и обозначается через r или R. Коэффициент корреляции принимается положительным, если У возрастает с увеличением X, и отрицательным, если У уменьша­ется с увеличением X.

Подставляя значения а и а', вычисленные по формулам (1.11) (1.14), в формулу (1.19), получаем

(1.19)

Преобразуем уравнение регрессии У по X и X по У, выразив коэффициенты регрессии а и а' через коэффициент корреляции.

Тогда получаем обычно используемые формулы уравнений регрессии:

(1.20)

или

(1.21)

где (xi) и (yi ) — соответственно средние из возможных У и X при данных xi и yi, σх и σу — средние квадратические отклонения У и X; и —средние значения X и У; r —коэффициент корре­ляции.

1.2.3. Оценка коэффициента корреляции и уравнения регрессии. Преобразование Фишера

Параметры уравнения регрессии в практических расчетах опре­деляются по выборкам. Поэтому естественно, что они носят вы­борочный характер и могут использоваться лишь как более или менее достоверные оценки действительных значений. Обозначим выборочные оценки параметров а и b и коэффициента корреляции r через , , соответственно.

Известно [6, 60], что эмпирический (выборочный) коэффициент корреляции представляет собой состоятельную оценку. Однако точность этой оценки или близость ее к действительному значению может быть установлена только при достаточно большом объеме выборки и невысоком коэффициенте корреляции, когда распределение его оценок может приниматься нормальным. Если же число испытаний невелико (п < 30), а коэффициент корреляции велик ( 0,4), то распределение выборочных значений в частичных совокупностях из п пар значений, взятых из нормальной общей совокупности двух случайных величин, в которых коэффициент корреляции равен r, существенно отличается от нормального.

Например, на рис. 1.6 представлено распределение оценок коэффициента корреляции r для значений r = 0; 0,4; 0,8 при n= 12.

Рис. 1.6. Распределения выборочного коэффициента (а) и преобразования Фишера z(б) при п = 12 и различных значениях r.

Таким образом, при значениях r, приближающихся к 1, кри­вая распределения коэффициента корреляции в частных совокупностях становится все более асимметричной. Обычные методы оценки в этом случае непригодны.