Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Предпосылки МНК.doc
Скачиваний:
3
Добавлен:
26.08.2019
Размер:
633.86 Кб
Скачать

В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров определяется его стандартная ошибка: и .

Стандартная ошибка коэффициента регрессии определяется по формуле:

, (1.17)

где - остаточная дисперсия на одну степень свободы.

Величина стандартной ошибки совместно с t - распределением Стьюдента при n - 2 степенях свободы применяется для проверки существенности коэффициента регрессии и для расчета его доверительных интервалов.

Для оценки существенности коэффициента регрессии его величина сравнивается с его стандартной ошибкой, т.е. определяется фактическое значение t - критерия Стьюдента: , которое затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы (n - 2).

Если фактическое значение t - критерия превышает табличное гипотезу о несущественности коэффициента регрессии можно отклонить.

Доверительный интервал для коэффициента регрессии определяется как .

Поскольку коэффициент регрессии в эконометрических исследованиях имеет четкую экономическую интерпретацию, то доверительные границы интервала для коэффициента регрессии не должны содержать противоречивых результатов, например, . Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже 0, чего не может быть.

Стандартная ошибка параметра a определяется по формуле:

. (1.18)

Процедура оценивания существенности данного параметра не отличается от рассмотренной выше для коэффициента регрессии; вычисляется t - критерий: , его величина сравнивается с табличным значением при df = n - 2 степенях свободы.

Значимость линейного коэффициента корреляции проверяется на основе величины ошибки коэффициента корреляции :

. (1.19)

Фактическое значение t - критерия Стьюдента определяется как:

. (1.20)

Данная формула свидетельствует, что в парной линейной регрессии , ибо, как уже указывалось, . Кроме того, . Следовательно, . Таким образом, проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.

Рассмотренная формула оценки коэффициента корреляции рекомендуется к применению при большом числе наблюдений и если r не близко к +1 или -1. Если же величина коэффициента корреляции близка к +1, то распределение его оценок отличается от нормального или распределения Стьюдента, так как величина коэффициента корреляции ограничена значениями от -1 до +1. Чтобы обойти это затруднение, Р. Фишером было предложено для оценки существенности r ввести вспомогательную величину z, связанную с коэффициентом корреляции следующим отношением:

. (1.21)

При изменении r от -1 до +1 величина z изменяется от до , что соответствует нормальному распределению. Математический анализ доказывает, что распределение величины z мало отличается от нормального даже при близких к 1 значениях коэффициента корреляции. Стандартная ошибка величины z определяется по формуле:

, (1.22)

где n - число наблюдений.

При , ; а . Величину z можно не рассчитывать, а воспользоваться готовыми таблицами z - преобразования, в которых приведены значения величины z для соответствующих значений r.

Далее выдвигаем нулевую гипотезу Н0, которая состоит в том, что корреляция отсутствует, т.е. теоретическое значение коэффициента корреляции равно нулю. Коэффициент корреляции значимо отличен от нуля, если , т.е. если фактическое значение превышает его табличное значение на уровне значимости или . Иными словами, если , то коэффициент корреляции значимо отличен от нуля.

В виду того, что r и z связаны между собой приведенным выше соотношением, можно вычислить критические значения r, соответствующие каждому из значений z. Таблицы критических значений z разработаны для уровня значимости 0,05 и 0,01 и соответствующего числа степеней свободы. Критические значения r предполагают справедливость нулевой гипотезы, т.е. r мало отлично от нуля. Если фактическое значение коэффициента корреляции по абсолютной величине превышает табличное, то данное значение r считается существенным. Если же r оказывается меньше табличного, то фактическое значение r несущественно.

1.2.4. Интервалы прогноза по линейному уравнению регрессии

В прогнозных расчетах по уравнению регрессии определяется предсказываемое (yp) значение как точечный прогноз при xp = xk, т.е. путем подстановки в уравнение регрессии соответствующего значения x. Однако точечный прогноз явно не реален. Поэтому он дополняется расчетом стандартной ошибки , т.е. и соответственно, интервальной оценкой прогнозного значения:

Чтобы понять, как строится формула для определения величин стандартной ошибки , обратимся к уравнению линейной регрессии: . Подставим в это уравнение выражение параметра a:

,

тогда уравнение регрессии примет вид:

.

Отсюда вытекает, что стандартная ошибка зависит от ошибки y и ошибки коэффициента регрессии b, т.е.

. (1.23)

Из теории выборки известно, что . Используя в качестве оценки 2 остаточную дисперсию на одну степень свободы S 2, получим формулу расчета ошибки среднего значения переменной y:

. (1.24)

Ошибка коэффициента регрессии, как уже было показано, определяется формулой:

.

Считая, что прогнозное значение фактора xp = xk, получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения, т.е. :

. (1.25)

Соответственно имеет выражение:

. (1.26)

Рассмотренная формула стандартной ошибки предсказываемого среднего значения y при заданном значении xk характеризует ошибку положения линии регрессии. Величина стандартной ошибки , как видно из формулы, достигает минимума при , и возрастает по мере того, как "удаляется" от в любом направлении. Иными словами, чем больше разность между xk и x, тем больше ошибка , с которой предсказывается среднее значение y для заданного значения xk. Можно ожидать наилучшие результаты прогноза, если признак-фактор x находится в центре области наблюдений x и нельзя ожидать хороших результатов прогноза при удалении xk от . Если же значение xk оказывается за пределами наблюдаемых значений x, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько xk отклоняется от области наблюдаемых значений фактора x.

На графике доверительные границы для представляют собой гиперболы, расположенные по обе стороны от линии регрессии (рис. 1.5).

Рис. 1.5 показывает, как изменяются пределы в зависимости от изменения xk: две гиперболы по обе стороны от линии регрессии определяют 95% -ые доверительные интервалы для среднего значения y при заданном значении x.

Однако фактические значения y варьируют около среднего значения . Индивидуальные значения y могут отклоняться от на величину случайной ошибки , дисперсия которой оценивается как остаточная дисперсия на одну степень свободы S2. Поэтому ошибка предсказываемого индивидуального значения y должна включать не только стандартную ошибку , но и случайную ошибку S.

Средняя ошибка прогнозируемого индивидуального значения y составит:

. (1.27)

При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки индивидуального значения y, но и от точности прогноза значения фактора x. Его величина может задаваться на основе анализа других моделей, исходя из конкретной ситуации, а также анализа динамики данного фактора.

Рассмотренная формула средней ошибки индивидуального значения признака y ( ) может быть использована также для оценки существенности различия предсказываемого значения, исходя из регрессионной модели и выдвинутой гипотезы развития событий.