Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЭконометрикаУМК20010__УчПособие.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.47 Mб
Скачать

2.7. Коэффициенты корреляции. Оценка тесноты связи

Наряду с построением уравнения регрессии осуществляется оценка тесноты связи между явлениями (между переменными).

Тесноту связи в случае линейной зависимости характеризуют с помощью выборочного коэффи­циента корреляции rxy

(2.28)

или

. (2.29)

Здесь σx, σy  средние квадратические отклонения переменных x и y.

Выборочный коэффи­циент корреляции rxy связан с коэффициентом линейной регрессии b соотношением

(2.30)

Выборочный коэффи­циент корреляции rxy принимает значения в диапазоне

–1 ≤ 1.

Чем ближе величина rxy к единице, тем теснее линейная связь и тем лучше линейная зависимость согласуется с данными наблюдений. При rxy = 1 связь становится функциональной, т. е. соотношение выполняется для всех наблюдений.

При > 0 связь является прямой, при < 0 – обратной.

Тесноту нелинейной связи (задаваемой уравнением нелинейной регрессии ) оценивают с помощью индекса корреляции R

. (2.31)

Индекс корреляции R принимает значения в диапазоне 0 R 1.

Чем ближе величина R к единице, тем теснее данная связь, тем лучше зависимость согласуется с данными наблюдений. При R = 1 (R2 = 1) связь становится функциональной, т. е. соотношение выполняется для всех наблюдений.

В случае линейной зависимости выборочный коэффи­циент корреляции rxy и коэффициент детерминации R2 связаны соотношением

R2 = r2xy. (2.32)

Коэффициент детерминации R2 может использоваться для оценки качества (точности) построенной модели регрессии. Чем выше этот показатель, тем лучше модель описывает исходные данные.

2.8. Точность коэффициентов регрессии. Проверка значимости

Полученные согласно формулам (2.13) оценки коэффициентов регрессии зависят от используемой выборки значений переменных x и y и являются случайными величинами. Представление о точности полученных оценок, о том насколько далеко они могут отклониться от истинных значений коэффициентов можно получить, используя, так называемые, «стандартные ошибки» коэффициентов регрессии.

Под стандартной ошибкой коэффициента регрессии понимается оценка стандартного отклонения функции плотности вероятности коэффициента.

Стандартные ошибки коэффициентов регрессии (sa), (sb) определяются соотношениями

, (2.33)

, (2.34)

где s2ост представляет собой несмещенную оценку остаточной дисперсии

. (2.35)

Сопоставляя оценки параметров и их стандартные ошибки можно сделать вывод о надежности (точности) полученных оценок.

Отношения

и (2.36)

в случае нормально распределенной ошибки εi являются t-статистиками, т. е. случайными величинами, распределенными по закону Стьюдента с числом степеней свободы n2. Через и обозначены точные значения коэффициентов регрессии.

Для оценки статистической значимости коэффициентов регрессии применяется t-критерий Стьюдента, согласно которому выдвигается «нулевая» гипотеза H0 о статистической незначимости коэффициента уравнения регрессии (т. е. о статистически незначимом отличии величины а или b от нуля). Эта гипотеза отвергается при выполнении условия t > tкрит, где tкрит определяется по таблицам t-критерия Стьюдента (П2) по числу степеней свободы k1 = nk1 (k  число независимых переменных в уравнении регрессии) и заданному уровню значимости α.

t-критерий Стьюдента может использоваться и для оценки статистической значимости выборочного коэффициента корреляции , так как величина

(2.37)

распределена по закону Стьюдента с числом степеней свободы n2. Здесь обозначает стандартную ошибку коэффициента корреляции

. (2.38)

Проверка значимости оценок параметров ничего не говорит о том, насколько эти оценки могут отличаться от точных значений. Ответ на этот вопрос дает построение доверительных интервалов.

Под доверительным интервалом понимаются пределы, в которых лежит точное значение определяемого показателя с заданной вероятностью (P = 1α).

Доверительные интервалы для параметров a и b уравнения линейной регрессии определяются соотношениями:

at1α,n-2sa < < a + t1α,n-2sa; bt1α,n-2sb.< < b + t1α,n-2sb (2.39)

Величина t1α,n-2 представляет собой табличное значение t-критерия Стьюдента при уровне значимости α и числе степеней свободы n–2.

Если в границы доверительного интервала попадает ноль, т. е. нижняя граница отрицательна, а верхняя положительна, то оцени­ваемый параметр принимается равным нулю, так как он не может одно­временно принимать и положительное, и отрицательное значения.

Для статистически значимого коэффициента кор­реляции интервальные оценки (доверительный интервал) получают с использованием Z-преобразования Фишера:

. (2.40)

Первоначально определяется интервальная оценка для z

(2.41)

где t1α/2 – квантиль стандартного нормального распределения порядка 1–α/2, z' = Z (rxy) – значение Z-преобразования Фишера, соответствующее полученному значению коэффициента кор­реляции rxy.

Граничные значения доверительного интервала (r , r+) для rxy получаются из граничных значений доверительного интервала (z , z+) для z с помощью обратного Z-преобразования Фишера

. (2.42)