Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
11_Конспекты лекций.doc
Скачиваний:
42
Добавлен:
11.11.2019
Размер:
1.19 Mб
Скачать

3. Оценка тесноты связи. Коэффициент корреляции (выборочный), его определение и свойства

Рассмотрим случай линейной корреляции. Уравнение прямой регрессии Y по X равносильно уравнению (при условии, что sx и sy отличаются от нуля). Величина показывает, на сколько величин sy изменится в среднем величина Y, когда величина X изменится на sx .

Определение 1. Коэффициентом корреляции (выборочным) называется величина

.

Коэффициент корреляции является показателем тесноты связи между случайными величинами Х и Y .

Так как , то , т.е. формула для коэффициента корреляции r симметрична относительно переменных Х и Y .

Следовательно, то же значение тесноты связи между случайными величинами Х и Y будет получено при рассмотрении уравнения прямой регрессии X по Y:

.

Отсюда получаем или , причем коэффициент корреляции имеет тот же знак, что и выборочные коэффициенты прямых регрессии.

Можно показать, что коэффициент корреляции принимает значения из отрезка [-1;1]. Чем ближе r к 1, тем теснее связь между случайными величинами Х и Y . При этом различают связь слабую, умеренную, заметную, достаточно тесную, тесную и весьма тесную.

Если r = 1, то корреляционная зависимость является линейной функциональной зависимостью.

Если r = 0, то линейная корреляционная связь отсутствует.

4. Коэффициент детерминации и корреляционное отношение.

Согласно основной идее дисперсионного анализа

,

где - групповая средняя для i-го уровня фактора.

Последнее равенство запишем в виде:

Q = QR + Qe ,

где Q – общая сумма квадратов отклонений зависимой переменной от средней, QR – сумма квадратов, обусловленная регрессией, а Qe - остаточная сумма квадратов, характеризующая влияние неучтенных факторов.

Схему дисперсионного анализа представим в виде таблицы:

Компоненты

дисперсии

Сумма

квадратов

Число степеней

свободы

Средние

квадраты

Регрессия

QR=

m-1

Остаточная

Qe=

mn-m

Общая

Q=

mn-1

Часто возникает необходимость в достоверном показателе интенсивности связи при любой форме зависимости. Для получения такого показателя запишем правило сложения дисперсий:

sy2 = siy/ 2 + δiy 2,

где sy2 – общая дисперсия переменной y, siy/ 2 – средняя групповых дисперсий siy2 или остаточная дисперсия и δiy 2 – межгрупповая дисперсия. Остаточная диспесия измеряет ту часть колеблемости Y, которая возникает из-за изменчивости неучтенных факторов, не зависящих от Х. Межгрупповая дисперсия выражает ту часть вариации Y, которая обусловлена изменчивостью Х.

Величина называется эмпирическим корреляционным отношением Y по Х. Чем теснее связь, тем большее влияние на вариацию переменной Y оказывает изменчивость Х по сравнению с неучтенными факторами, тем выше ηух. Величина ηух2 , называемая эмпирическим коэффициентом детерминации, показывает, какая часть общей вариации Y обусловлена вариацией Х. Аналогично вводится эмпирическое корреляционное отношение Х по Y.

Основные свойства корреляционных отношений:

1. Корреляционное отношение есть неотрицательная величина, не превосходящая 1: 0 ≤ η ≤ 1.

2. Если η = 0, то корреляционная связь отсутствует.

3. Если η = 1, то между переменными существует функциональная зависимость.

Эмпирическое корреляционное отношение ηух является показателем рассеяния точек корреляционного поля относительно эмпирической линии регрессии, которое преувеличивает тесноту связи. Поэтому рассматривается показатель тесноты связи Ryx, характеризующий рассеяние точек корреляционного поля относительно линии регрессии ух. Показатель Ryx получил название теоретического корреляционного отношения или индекса корреляции Y по Х:

.

Можно показать, что Ryx = .

Коэффициент детерминации R2, равный квадрату индекса корреляции, показывает долю общей вариации зависимой переменной, обусловленной регрессией или изменчивостью объясняющей переменной. Чем ближе R2 к 1, тем теснее наблюдения примыкают к линии регрессии, тем лучше регрессия описывает зависимость переменных.

Расхождение между η2 и R2 может быть использовано для проверки линейности корреляционной зависимости.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]