- •В.П. Носко
- •Оглавление
- •Часть 1.Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов7
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений85
- •Часть 3.Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках180
- •Предисловие
- •Часть 1. Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов
- •1.1. Эконометрика и ее связь с экономической теорией
- •1.2. Две переменные: меры изменчивости и связи
- •1.3. Метод наименьших квадратов. Прямолинейный характер связи между двумя экономическими факторами
- •1.4. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
- •1.5. «Обратная» модель прямолинейной связи
- •1.6. Пропорциональная связь между переменными
- •1.7. Примеры подбора линейных моделей связи между двумя факторами. Фиктивная линейная связь
- •1.8. Очистка переменных. Частный коэффициент корреляции
- •1.9. Процентное изменение факторов в линейной модели связи
- •1.10. Нелинейная связь между переменными
- •1.11. Пример подбора моделей нелинейной связи, сводящихся к линейной модели.
- •1.12. Линейные модели с несколькими объясняющими переменными
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений
- •2.1. Вероятностное моделирование ошибок
- •2.2. Гауссовское (нормальное) распределение ошибок в линейной модели наблюдений
- •2.3. Числовые характеристики случайных величин и их свойства
- •2.4. Нормальные линейные модели с несколькими объясняющими переменными
- •2.5. Нормальная множественная регрессия: доверительные интервалы для коэффициентов
- •2.6. Доверительные интервалы для коэффициентов: реальные статистические данные
- •2.7. Проверка статистических гипотез о значениях коэффициентов
- •2.8. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
- •2.9. Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерии
- •2.10. Проверка гипотез о значениях коэффициентов: односторонние критерии
- •2.11. Некоторые проблемы, связанные с проверкой гипотез о значениях коэффициентов
- •2.12. Использование оцененной модели для прогнозирования
- •Часть 3. Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках
- •3.1. Проверка адекватности подобранной модели имеющимся статистическим данным: графические методы
- •3.2. Проверка адекватности подобранной модели имеющимся статистическим данным: формальные статистические процедуры
- •3.3. Неадекватность подобранной модели: примеры и последствия
- •3.4. Коррекция статистических выводов при наличии гетероскедастичности (неоднородности дисперсий ошибок)
- •3.5. Коррекция статистических выводов при автокоррелированности ошибок
- •3.6. Коррекция статистических выводов при наличии сезонности. Фиктивные переменные
- •Заключение
- •Список литературы
2.5. Нормальная множественная регрессия: доверительные интервалы для коэффициентов
Рассматривая нормальную модель линейной множественной регрессии
с i. i. d. , мы установили, что оценка наименьших квадратовнеизвестного истинного значениякоэффициента при— ой объясняющей переменной имеет нормальное распределение, причем
Рассмотрим теперь случайную величину
получаемую путем вычитания из случайной величины ее математического ожидания и деления полученной разности на корень из дисперсии(т. е. путемцентрированияинормирования случайной величины). При совершении этих двух действий мы не выходим из семейства нормальных случайных величин, получая опять женормальнуюслучайную величину, но только уже с другими математическим ожиданием и дисперсией. Используя упомянутые ранее свойства математического ожидания и дисперсии, находим:
так что
Иными словами, в результате центрирования и нормирования случайной величины мы получили случайную величину, имеющуюстандартное нормальное распределение, т. е.нормальное распределение с нулевым математическим ожиданием и единичной дисперсией. Функцию распределения и функцию плотности распределения такой случайной величины обозначают, соответственно, каки:
Для каждого значения , определим символомчисло, для которого, так что если случайная величинаимеет стандартное нормальное распределение, то тогда
Такое число называется квантилью уровня p стандартного нормального распределения.
1-p
zp
Заштрихованная площадь под графиком плотности стандартного нормального распределения находитсяправееквантилиуровня;
эта квантиль равна . Поэтому площадь под кривой, лежащаялевееточки, равна, азаштрихованная площадь равна. Последняя величина есть вероятность того,что случайная величина, имеющая стандартное нормальное распределение, примет значение,превышающее .
Если мы возьмем какое-нибудь число в пределах отдо, и выделим интервал
то получим следующую картину:
Из симметрии функции плотности нормального распределения вытекает равенство площадей областей, заштрихованных на последнем рисунке. Но площадь правой заштрихованной области равна ; следовательно, такова же и площадь левой заштрихованной области. Это, в частности, означает, что вероятность того, что случайная величинапримет значение, не превышающее, равна, так что
Часть площади под кривой стандартной нормальной плотности, лежащая в пределах выделенного интервала, меньше единицы на сумму площадей заштрихованных областей («хвостов»), т. е. равна
Эта величина равна вероятноститого, что случайная величина, имеющаястандартное нормальное распределение,примет значение в пределах указанного интервала2:
Но ранее мы установили, что стандартное нормальное распределение имеет случайная величина
Поэтому для этой случайной величины справедливо соотношение
так что с вероятностью, равной , выполняется двойное неравенство
т. е.
Иными словами, с вероятностью, равной ,случайный интервал
накрывает истинное значение коэффициента j. Такой интервал называетсядоверительным интервалом для j с уровнем доверия (доверительной вероятностью) , или()-доверительным интервалом, или100()-процентным доверительным интервалом для j.
Последний рисунок был получен при значении .Поэтому площади заштрихованных областей («хвосты») равны , сумма этих площадей равна и площадь области под кривой в пределах интерваларавна Остается заметить, что
так что случайный интервал
является 95%-доверительным интервалом для j. Егодлина
пропорциональна—среднеквадратической ошибке (среднеквадратическому отклонению) оценки коэффициента j.
Хотелось бы, конечно, прямо сейчас построить доверительные интервалы для коэффициентов линейной модели по каким-нибудь реальным статистическим данным. Однако этому препятствует то обстоятельство, что в выражения для дисперсий
входит не известное нам значение .