
- •Институт экономики переходного периода
- •В.П. Носко
- •Эконометрика для начинающих
- •Основные понятия, элементарные методы, границы применимости, интерпретация результатов
- •Оглавление
- •Часть 1. Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов 7
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений 85
- •Часть 3. Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках 180
- •Предисловие
- •Часть 1. Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов
- •1.1. Эконометрика и ее связь с экономической теорией
- •1.2. Две переменные: меры изменчивости и связи
- •1.3. Метод наименьших квадратов. Прямолинейный характер связи между двумя экономическими факторами
- •1.4. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
- •1.5. «Обратная» модель прямолинейной связи
- •1.6. Пропорциональная связь между переменными
- •1.7. Примеры подбора линейных моделей связи между двумя факторами. Фиктивная линейная связь
- •1.8. Очистка переменных. Частный коэффициент корреляции
- •1.9. Процентное изменение факторов в линейной модели связи
- •1.10. Нелинейная связь между переменными
- •1.11. Пример подбора моделей нелинейной связи, сводящихся к линейной модели.
- •1.12. Линейные модели с несколькими объясняющими переменными
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений
- •2.1. Вероятностное моделирование ошибок
- •2.2. Гауссовское (нормальное) распределение ошибок в линейной модели наблюдений
- •2.3. Числовые характеристики случайных величин и их свойства
- •2.4. Нормальные линейные модели с несколькими объясняющими переменными
- •2.5. Нормальная множественная регрессия: доверительные интервалы для коэффициентов
- •2.6. Доверительные интервалы для коэффициентов: реальные статистические данные
- •2.7. Проверка статистических гипотез о значениях коэффициентов
- •2.8. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
- •2.9. Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерии
- •2.10. Проверка гипотез о значениях коэффициентов: односторонние критерии
- •2.11. Некоторые проблемы, связанные с проверкой гипотез о значениях коэффициентов
- •2.12. Использование оцененной модели для прогнозирования
- •Часть 3. Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках
- •3.1. Проверка адекватности подобранной модели имеющимся статистическим данным: графические методы
- •3.2. Проверка адекватности подобранной модели имеющимся статистическим данным: формальные статистические процедуры
- •3.3. Неадекватность подобранной модели: примеры и последствия
- •3.4. Коррекция статистических выводов при наличии гетероскедастичности (неоднородности дисперсий ошибок)
- •3.5. Коррекция статистических выводов при автокоррелированности ошибок
- •3.6. Коррекция статистических выводов при наличии сезонности. Фиктивные переменные
- •Заключение
- •Список литературы
2.5. Нормальная множественная регрессия: доверительные интервалы для коэффициентов
Рассматривая нормальную модель линейной множественной регрессии
с
i. i. d.
,
мы установили, что оценка наименьших
квадратов
неизвестного истинного значения
коэффициента при
—
ой объясняющей переменной имеет
нормальное распределение, причем
Рассмотрим теперь случайную величину
получаемую путем вычитания из случайной величины ее математического ожидания и деления полученной разности на корень из дисперсии (т. е. путем центрирования и нормирования случайной величины ). При совершении этих двух действий мы не выходим из семейства нормальных случайных величин, получая опять же нормальную случайную величину, но только уже с другими математическим ожиданием и дисперсией. Используя упомянутые ранее свойства математического ожидания и дисперсии, находим:
так что
Иными словами, в
результате центрирования и нормирования
случайной величины
мы получили случайную величину, имеющую
стандартное нормальное распределение,
т. е. нормальное распределение с
нулевым математическим ожиданием и
единичной дисперсией. Функцию
распределения и функцию плотности
распределения такой случайной величины
обозначают, соответственно, как
и
:
Для каждого значения
,
определим символом
число, для которого
,
так что если случайная величина
имеет стандартное нормальное распределение,
то тогда
Такое число называется квантилью уровня p стандартного нормального распределения.
1-p
zp
Заштрихованная
площадь под графиком плотности
стандартного нормального распределения
находится правее квантили
уровня
;
эта квантиль равна
.
Поэтому площадь под кривой, лежащая
левее точки
,
равна
,
а заштрихованная площадь равна
.
Последняя величина есть вероятность
того,что случайная величина
,
имеющая стандартное нормальное
распределение, примет значение,
превышающее
.
Если мы возьмем
какое-нибудь число
в пределах от
до
,
и выделим интервал
то получим следующую картину:
Из симметрии
функции плотности нормального
распределения вытекает равенство
площадей областей, заштрихованных на
последнем рисунке. Но площадь правой
заштрихованной области равна
;
следовательно, такова же и площадь левой
заштрихованной области. Это, в частности,
означает, что вероятность того, что
случайная величина
примет значение, не превышающее
,
равна
,
так что
Часть площади под кривой стандартной нормальной плотности, лежащая в пределах выделенного интервала, меньше единицы на сумму площадей заштрихованных областей («хвостов»), т. е. равна
Эта величина равна вероятности того, что случайная величина , имеющая стандартное нормальное распределение, примет значение в пределах указанного интервала2:
Но ранее мы установили, что стандартное нормальное распределение имеет случайная величина
Поэтому для этой случайной величины справедливо соотношение
так что с вероятностью,
равной
,
выполняется двойное неравенство
т. е.
Иными словами, с вероятностью, равной , случайный интервал
накрывает истинное значение коэффициента j. Такой интервал называется доверительным интервалом для j с уровнем доверия (доверительной вероятностью) , или ()-доверительным интервалом, или 100()-процентным доверительным интервалом для j.
Последний рисунок
был получен при значении
.
Поэтому площади заштрихованных областей
(«хвосты») равны
,
сумма этих площадей равна
и площадь области
под кривой в пределах интервала
равна
Остается заметить, что
так что случайный интервал
является 95%-доверительным интервалом для j. Его длина
пропорциональна
— среднеквадратической ошибке
(среднеквадратическому отклонению)
оценки коэффициента
j.
Хотелось бы, конечно, прямо сейчас построить доверительные интервалы для коэффициентов линейной модели по каким-нибудь реальным статистическим данным. Однако этому препятствует то обстоятельство, что в выражения для дисперсий
входит не известное нам значение .