Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вся эконометрика / Вся эконометрика / Эконометрика_Лекции_2011 / Проверка качества уравнения регрессии.doc
Скачиваний:
152
Добавлен:
27.03.2015
Размер:
732.16 Кб
Скачать

Интервальные оценки коэффициентов линейного уравнения регрессии.

Для оценки статистической значимости коэффициентов регрессии и корреляции, кроме t-критерия Стъюдента, рассчитываются также доверительные интервалы каждого из показателей.

Одной из базовых предпосылок метода наименьших квадратов является предположение о нормальном распределении отклонений с нулевым математическим ожиданием и постоянной дисперсией. Тогда статистики

,

или

имеют распределение Стьюдента с числом степеней свободы и можно определить доверительные интервалы, которые с надежностью накрывают определяемые параметры и:

(1)

Аналогичное двойное неравенство можно вывести для :

(2)

находится с помощью уровня значимости α и степенью свободы .

В экономических исследованиях все проверки гипотез осуществляются либо при 5%-ном, либо при 1%-ном уровнях значимости: α=0,05; α=0,01.

Доверительные интервалы для параметров регрессии говорят о следующем: теоретические значения параметров регрессии с вероятностью 95% попадают в интервал (1) или (2).

Лекция 7

Проверка общего качества уравнения регрессии. Коэффициент детерминации .

Общее качество уравнения регрессии оценивается по тому, насколько хорошо эмпирическое уравнение регрессии согласуется со статистическими (фактическими) данными. Если все точки лежат на построенной прямой, то говорят, что регрессия y на x «идеально» объясняет поведение результативного признака.

Суммарной мерой общего качества уравнения регрессии (соответствия уравнения регрессии статистическим данным) является коэффициент детерминации .

Вообще проверка значимости уравнения регрессии проводится на основе дисперсионного анализа. В математической статистике дисперсионный анализ рассмотрен как самостоятельный метод статистического анализа. Здесь же он применятся как вспомогательное средство для изучения качества регрессионной модели.

Рассмотрим следующие суммы:

– дисперсия фактических (наблюдаемых) значений y (общая сумма),

– дисперсия расчетных значенийy (объясненная регрессией),

дисперсия регрессионных остатков (необъясненная регрессией).

Рассмотрим общую сумму:

==

Можно показать, что если оценки иопределены по методу наименьших квадратов, то сумма =0 .

Тогда

=(1)

общая объясненная остаточная сумма

сумма квадратов регрессией или

факторная сумма

квадратов

Коэффициентом детерминации R2 называется отношение факторной суммы к общей сумме.

(2)

Соотношение (2) характеризует долю вариации (разброса) зависимой переменной, объясненную с помощью уравнения регрессии.

Если все точки лежат на регрессионной прямой, то R2=1.

Если R2=1, то получается подгонка абсолютно точная, т.е. все точки наблюдений лежат на прямой, значит, имеется функциональная связь.

Если R2=0, то получается, что уравнение регрессии ничего не дает.

Чем ближе R2 к 1, тем уравнение регрессии лучше.

В практических задачах для оценки силы связи используется следующая таблица:

Значение R2

[0,1-0,3)

[0,3-0,5)

[0,5-0,7)

[0,7-0,9)

[0,9-0,99)

сила связи

слабая

умеренная

заметная

высокая

весьма высокая

Замечание: Вычисление R2 корректно, если константа включена в уравнение регрессии.

Коэффициент детерминации можно выразить иначе:

или , откуда

, то есть .

Для линейной парной регрессии коэффициент детерминации равен квадрату коэффициента корреляции.