Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Алтайский Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Эконометрика / glava7_predposylki.doc

Скачиваний:

111

Добавлен:

15.05.2015

Размер:

254.46 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>

7.3. Проверка выполнимости предпосылок мнк. Статистика Дарбина-Уотсона

Статистическая значимость коэффициентов регрессии и близкое к единице значение коэффициента детерминации R² не гарантируют высокое качество уравнения регрессии. Для иллюстрации этого факта весьма нагляден пример из [3, 11], в котором анализируется зависимость реального объема потребления CONS (млрд $, в ценах 1982 г.) от численности населения POP (млн чел.) в США в 1931—1990 г. Корреляционное поле статистических данных изображено на рисунке 7.1.

Линейное уравнение регрессии, построенное по МНК по реальным статистическим данным, имеет вид:

CONS = -1817,3 + 16,7РОР.

Стандартные ошибки коэффициентов S_b₀ = 84,7, S_b₁ = 0,47. Следовательно, их t-статистики t_b₀ = -1817,3/84,7 = -21,4 , t_b₁ = 36,8. Эти значения существенно превышают 3, что свидетельствует о статистической значимости коэффициентов. Коэффициент детерминации R2 = 0,96 (т.е. уравнение «объясняет» 96% дисперсии объема потребления). Однако уже по расположению точек на рисунке видно, что зависимость между POP и CONS не является линейной, а будет скорее экспоненциальной. Для качественного прогноза уровня потребления линейная функция, безусловно, не может быть использована. За рассматриваемый период времени население США росло почти линейно (с постоянными годовыми приростами), а объем потребления — экспоненциально (с почти постоянными темпами прироста), т.е. существенно выросло потребление на душу населения.

Рис. 7.1. Построение линейной регрессии зависимости реального потребления от численности населения

Таким образом, при весьма хороших значениях t-статистик и F-статистики предложенное уравнение регрессии не может быть признано удовлетворительным (отметим, что R = 0,96, скорее всего, в силу того, что и CONS и POP имели временной тренд). Можно ли определить причину этого?

Нетрудно заметить, что в данном случае не выполняются необходимые предпосылки МНК об отклонениях _i точек наблюдений от линии регрессии. Эти отклонения явно не обладают постоянной дисперсией и не являются взаимно независимыми. Нарушение необходимых предпосылок делает неточными полученные оценки коэффициентов регрессии, увеличивая их стандартные ошибки, и обычно свидетельствует о неверной спецификации самого уравнения. Поэтому следующим этапом проверки качества уравнения регрессии является проверка выполнимости предпосылок МНК. Причины и последствия невыполнимости этих предпосылок, методы корректировки регрессионных моделей будут подробно рассмотрены далее. В данном пункте мы лишь обозначим эти проблемы, а также обсудим весьма популярную в регрессионном анализе статистику Дарбина-Уотсона.

Оценивая линейное уравнение регрессии, мы предполагаем, что реальная взаимосвязь переменных линейна, а отклонения от регрессионной прямой являются случайными, независимыми друг от друга величинами с нулевым математическим ожиданием и постоянной дисперсией. Если эти предположения не выполняются, то оценки коэффициентов регрессии не обладают свойствами несмещенности, эффективности и состоятельности, и анализ их значимости будет неточным.

Причинами, по которым отклонения не обладают перечисленными выше свойствами, могут быть либо нелинейный характер зависимости между рассматриваемыми переменными, либо наличие не учтенного в уравнении существенного фактора. Действительно, при нелинейной зависимости между переменными (рис. 7.1) отклонения от прямой регрессии не случайно распределены вокруг нее, а обладают определенными закономерностями, которые зачастую выражаются в существенном преобладании числа пар соседних отклонений _i_-1 и _i с совпадающими знаками над числом пар с противоположными знаками. Отсутствие в уравнении регрессии какого-либо существенного фактора может также служить причиной устойчивых отклонений зависимой переменной от линии регрессии в ту или иную сторону. Добиться выполнимости предпосылок МНК в этих ситуациях можно либо путем оценивания какой-то нелинейной формулы, либо включением в уравнение регрессии новой объясняющей переменной. Это позволит реалистичнее отразить поведение зависимой переменной.

При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки, а именно: условия статистической независимости отклонений между собой. Поскольку значения _i теоретического уравнения регрессии Y =  + X +  остаются неизвестными ввиду неопределенности истинных значений коэффициентов регрессии, то проверяется статистическая независимость их оценок — отклонений e_i, i = 1, 2,...,n. При этом обычно проверяется их некоррелированность, являющаяся необходимым, но недостаточным условием независимости. Причем проверяется некоррелированность не любых, а только соседних величин e_i. Соседними обычно считаются соседние во времени (при рассмотрении временных рядов) или по возрастанию объясняющей переменной X (в случае перекрестной выборки) значения e_i. Для этих величин несложно рассчитать коэффициент корреляции, называемый в этом случае коэффициентом автокорреляции первого порядка:

Если здесь учесть, что M(e_i) = 0, i = 1, 2, ..., n, то получим

. (7.7)

На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно с ним связанную статистику Дарбина-Уотсона DW, рассчитываемую по формуле

. (7.8)

Действительно,

Здесь сделано допущение, что при больших n выполняется соотношение: e_i_-1²=  e_i² .

Тогда

Нетрудно заметить, что если e_i = e_i_-1, то r_е_i_,_ei_-1 = 1 и DW = 0. Если e_i = -e_i_-1, то r_е_i_,_ei_-1 = -1 и DW = 4. Во всех других случаях 0 < DW < 4 .

К этому же результату можно подойти с другой стороны. Если каждое следующее отклонение e_i приблизительно равно предыдущему e_i_-1, то каждое слагаемое (e_i-e_i_-1) в числителе дроби (7.15) близко к нулю. Тогда, очевидно, числитель дроби (7.15) будет существенно меньше знаменателя и, следовательно, статистика DW окажется близкой к нулю. Например, для зависимости CONS и POP (рис. 7.2) DW = 0,045, что очень близко к нулю и подтверждает наличие положительной автокорреляции остатков первого порядка (линейной зависимости между остатками).

В другом крайнем случае, когда точки наблюдений поочередно отклоняются в разные стороны от линии регрессии (e_i  -e_i_-1), значит, e_i - e_i_-1  2e_i и

DW = = 4.

Это случай отрицательной автокорреляции остатков первого порядка.

При случайном поведении отклонений можно предположить, что в одной половине случаев знаки последовательных отклонений совпадают, а в другой — противоположны. Так как абсолютная величина отклонений в среднем предполагается одинаковой, то можно считать, что в половине случаев e_i  e_i_-1, а в другой e_i  - e_i_-1. Тогда

DW =.

Таким образом, необходимым условием независимости случайных отклонений является близость к двойке значения статистики Дарбина-Уотсона. Тогда, если DW  2, мы считаем отклонения от регрессии случайными (хотя они в действительности могут и не быть таковыми). Это означает, что построенная линейная регрессия, вероятно, отражает реальную зависимость. Скорее всего, не осталось неучтенных существенных факторов, влияющих на зависимую переменную. Какая-либо другая нелинейная формула не превосходит по статистическим характеристикам предложенную линейную. В этом случае, даже когда R невелико, вполне вероятно, что необъясненная дисперсия вызвана влиянием на зависимую переменную большого числа различных факторов, индивидуально слабо влияющих на исследуемую переменную, и может быть описана как случайная нормальная ошибка.

Возникает вопрос, какие значения DW можно считать статистически близкими к двум?

Для ответа на этот вопрос разработаны специальные таблицы критических точек статистики Дарбина-Уотсона (приложение 3), позволяющие при данном числе наблюдений n, количестве объясняющих переменных m и заданном уровне значимости  определять границы приемлемости (критические точки) наблюдаемой статистики DW.

Для заданных , n, m в таблице (приложение 3) указываются два числа: d_l - нижняя граница (индексом внизу является первая буква от английского слова low – нижний) и d_u — верхняя граница (индексом внизу является первая буква от слова upper – верхний). Для проверки гипотезы об отсутствии автокорреляции остатков используется числовой отрезок, изображенный на рисунке 7.2.

Рис. 7.2. Области, в которые попадает статистика Дарбина-Уотсона

Выводы осуществляются по следующей схеме.

Если DW < d_l, то это свидетельствует о положительной автокорреляции остатков.

Если DW > 4 -d_l, то это свидетельствует об отрицательной автокорреляции остатков.

При d_u<DW< 4-d_u гипотеза об отсутствии автокорреляции остатков принимается.

Если d_l <DW< d_u или 4-d_u<DW< 4-d_l , то гипотеза об отсутствии автокорреляции не может быть ни принята, ни отклонена.

Не обращаясь к таблице критических точек Дарбина-Уотсона, можно пользоваться «грубым» правилом и считать, что автокорреляция остатков отсутствует, если 1,5 < DW < 2,5. Для более надежного вывода целесообразно обращаться к табличным значениям.

При наличии автокорреляции остатков полученное уравнение регрессии обычно считается неудовлетворительным.

Конечно, статистический анализ построенной регрессии является достаточно сложным и многоступенчатым процессом, имеющим определенную специфику в каждом конкретном случае. Однако базовыми пунктами такого анализа являются описанные в данной главе проверка статистической значимости коэффициентов регрессии и коэффициента детерминации, анализ статистики Дарбина-Уотсона.

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>

Соседние файлы в папке Эконометрика

#
15.05.2015196.61 Кб164glava11_dinamic_mod_Koick_Almon.doc
#
15.05.2015780.8 Кб133glava1_2_3.doc
#
15.05.2015181.25 Кб97glava4_nonlinear.doc
#
15.05.2015438.27 Кб92glava5_mn_regr.doc
#
15.05.2015129.02 Кб64glava6_standartiz1.doc
#
15.05.2015254.46 Кб111glava7_predposylki.doc
#
15.05.2015532.48 Кб118glava8_proverka_hipothesis.doc
#
15.05.2015427.01 Кб163glava9_fictitious.doc
#
15.05.2015342.02 Кб56prilogenies.doc
#
15.05.201513.82 Кб81P_Q.xls
#
15.05.20151.06 Mб53themes_kurs_rab.doc