- •Isbn 978-5-7944-1210-9 © зао «прогноз», 2008 содержание
- •Предисловие
- •1.Введение Историческая справка
- •Эволюция термина
- •Некоторые сведения об истории возникновения эконометрики
- •Выделение эконометрики в самостоятельную науку
- •Место эконометрики в системе экономических знаний
- •Примеры эконометрических моделей Модель кривой спроса
- •Цена автомобиля на вторичном рынке
- •Цена жилья на вторичном рынке
- •Наполняемость федерального бюджета
- •Производственная функция Кобба-Дугласа
- •Цели и методология эконометрического исследования
- •2. Необходимые сведения из теории вероятностей и математической статистики
- •Основные сведения Основные определения
- •Основные числовые характеристики абсолютно непрерывной случайной величины
- •Статистические точечные оценки числовых характеристик
- •Некоторые свойства статистических оценок (определения)
- •Общий подход к построению интервальных статистических оценок параметров
- •Наиболее часто используемые в эконометрике распределения
- •Критические значения распределения случайной величины
- •Интервальные оценки параметров нормального распределения по результатам наблюдений Доверительный интервал для , если известно
- •Доверительный интервал для , если неизвестно
- •Доверительный интервал для при известном значении
- •Доверительный интервал для при неизвестном
- •Проверка статистических гипотез
- •Правила проверки гипотез относительно параметров нормального распределения
- •Проверка гипотезы относительно при известном
- •Проверка гипотезы относительно a при неизвестном
- •Проверка гипотезы относительно при неизвестном
- •3. Линейная парная регрессия Постановка задачи
- •Идентификация модели (нахождение точечных оценок параметров)
- •Необходимые и достаточные условия минимума суммы квадратов остатков. Система нормальных уравнений
- •Свойства оценок мнк
- •Условия Гаусса–Маркова
- •Линейность оценок
- •Несмещенность оценок
- •Состоятельность оценок
- •Эффективность оценок
- •Интервальные оценки коэффициентов парной регрессии, полученные с помощью мнк
- •Теоретические интервальные оценки
- •Практические интервальные оценки
- •Оценка качества модели линейной парной регрессии
- •Оценка значимости коэффициента линейной парной регрессии (t - тест)
- •Оценка качества модели линейной парной регрессии в целом (f-тест)
- •Прогнозирование с помощью модели линейной парной регрессии, оценка качества прогноза Точечный прогноз
- •Интервальный прогноз
- •Геометрическая интерпретация точности прогноза
- •Геометрический подход к нахождению коэффициентов линейной регрессии
- •4. Линейная множественная регрессия
- •Описание модели линейной множественной регрессии
- •Идентификация модели
- •Геометрическая интерпретация метода наименьших квадратов
- •Свойства точечных оценок мнк
- •Оценка модели линейной множественной регрессии в целом. Коэффициент детерминации
- •Геометрическая иллюстрация зависимости точности прогноза от расстояния до средней точки
- •Некоторые обобщения мнк Обобщенный мнк
- •Взвешенный мнк
- •5. Некоторые проблемы, возникающие при практическом применении мнк
- •Проблема мультиколлинеарности: понятие, обнаружение, способы преодоления проблемы Понятие мультиколлинеарности
- •Методы обнаружения мультиколлинеарности
- •Методы устранения мультиколлинеарности
- •Проблема гетероскедастичности: понятие, тесты на гетероскедастичность, способы преодоления проблемы Понятие гетероскедастичности
- •Тесты на наличие в модели гетероскедастичности
- •Методы преодоления гетероскедастичности
- •Проблема автокорреляции (ак): понятие, методы обнаружения, способы преодоления проблемы, авторегрессионное преобразование первого порядка Понятие автокорреляции
- •Методы обнаружения автокорреляции
- •Методы преодоления автокорреляции
- •Авторегрессионное преобразование первого порядка
- •6. Системы одновременных уравнений. Косвенный мнк. Двухшаговый мнк
- •Кейнсианская модель формирования доходов
- •Косвенный мнк
- •Проблема идентифицируемости модели
- •Двухшаговый мнк
- •Трехшаговый мнк
- •Общий вид системы одновременных уравнений
- •7. Фиктивные переменные. Применение фиктивных переменных для исследования устойчивости коэффициентов регрессии. Тест чоу Фиктивные переменные (качественные переменные)
- •Использование качественных переменных для анализа устойчивости коэффициентов регрессии. Тест Чоу
- •8. Нелинейные регрессионные модели
- •Модели, нелинейные по переменным
- •Модели, нелинейные по параметрам
- •Общий вид модели наблюдений в случае существенно нелинейной модели
- •Сравнение регрессионных моделей с различными функциональными формами. Тест Бокса–Кокса
- •9. Временные ряды Определение временного ряда. Основные понятия
- •Метод экспоненциального сглаживания
- •Список литературы
- •Словарь
- •Предметный указатель
- •Приложения
- •614990, Г. Пермь, ул. Букирева, 15
- •614990, Г. Пермь, ул. Букирева, 15
Оценка модели линейной множественной регрессии в целом. Коэффициент детерминации
Для такой оценки используется F-тест. При построении статистики используются следующие вспомогательные переменные:
1) полная вариация
, (4.33)
2) объясненная вариация
, (4.34)
3) остаточная вариация
. (4.35)
Наиболее часто в практических расчетах для оценки качества всего уравнения в целом применяется коэффициент детерминации, т.е. доля объясненной вариации в полной вариации. Считается, что чем больше эта доля, тем лучше уравнение регрессии описывает изучаемое явление.
Имеет место тождество
, (4.36)
откуда получаем
.
Коэффициент детерминации обозначается и определяется следующим соотношением:
. (4.37)
Для проверки гипотезы о значимости модели в целом вводится -статистика
. (4.38)
Статистика (4.39) подчиняется распределению Фишера с и степенями свободы.
Сформулируем правила проверки гипотезы:
Если
<
,
при заданном уровне значимости
модель
в целом не значима.
Если > , при заданном уровне значимости модель в целом значима.
Здесь – правосторонняя критическая граница распределения Фишера.
В случае множественной регрессии -тест и -тест не эквивалентны (как это было в случае парной регрессии). Может оказаться значимой модель со всеми «незначимыми» коэффициентами.
Отметим связь коэффициента детерминации с коэффициентами парной корреляции:
. (4.39)
Для доказательства воспользуемся равенствами
Возводя
в квадрат и суммируя по
,
получаем
(4.40)
Записывая
в виде
и учитывая, что
(см. условия ортогональности (4.14)),
получаем (4.40)
в
виде
,
откуда
В
случае парной регрессии
эта формула совпадает с (3.109). Число
называют выборочным
коэффициентом множественной корреляции.
Использование только одного коэффициента детерминации для выбора наилучшего уравнения регрессии может оказаться недостаточным. На практике встречаются случаи, когда плохо определенная модель регрессии может дать сравнительно высокий коэффициент . Недостатком коэффициента детерминации является то, что он увеличивается при добавлении новых объясняющих переменных, хотя это и необязательно означает улучшение качества регрессионной модели. В этом смысле предпочтительнее использовать скорректированный коэффициент детерминации . Чем больше число объясняющих переменных, тем меньше скорректированный коэффициент детерминации по сравнению с .
Скорректированный коэффициент детерминации
Скорректированный коэффициент детерминации определяется следующим соотношением:
. (4.41)
При введении в модель новой переменной скорректированный коэффициент детерминации (в отличие от ) возрастает тогда и только тогда, когда -статистика коэффициента при новой переменной по абсолютной величине оказывается больше единицы.
Интервальный прогноз в случае множественной регрессии. Оценка качества прогноза
Точечный прогноз
Точечный
прогноз по уравнению регрессии
осуществляется путем подстановки
значений независимых переменных в
оценку детерминированной составляющей
(
= (
,
…,
)):
, (4.42)
где
прогнозное значение объясняющей
переменной с номером j.
Этот прогноз является несмещенным, так как несмещенными являются оценки параметров регрессии:
. (4.43)
Интервальный прогноз
Интервальный
прогноз строится так же, как интервальная
оценка для параметров регрессии: за
середину доверительного интервала
выбираем точечную оценку детерминированной
составляющей
,
а затем отступаем от середины на величину,
пропорциональную стандартному отклонению
оценки
,
с коэффициентом пропорциональности,
равным двусторонней критической границе
распределения Стьюдента
,
отвечающей уровню значимости α.
Необходимо
оценить значение объясняемой переменной
в точке
.
представляет собой вектор прогнозных
значений объясняемых переменных:
. (4.44)
Для того чтобы получить прогнозное значение объясняемой переменной, нужно подставить вектор (4.44) в следующее выражение:
. (4.45)
В свою очередь, детерминированная составляющая описывается соотношением
, (4.46)
где – вектор истинных значений параметров модели. Отсюда
. (4.47)
т.е.
– случайная величина, имеющая нормальное
распределение с математическим ожиданием,
совпадающим с детерминированной
составляющей.
Вычислим дисперсию :
(4.48)
Используя равенства , и получаем
.
Таким образом,
. (4.49)
Отсюда при заданном уровне значимости получаем теоретический интервальный прогноз
(4.50)
и практический интервальный прогноз
, (4.51)
где
; (4.52)
. (4.53)
Из неравенств (4.50) и (4.51) следует, что качество прогноза (длина доверительного интервала) меняется с удалением от средних значений объясняющих переменных. При этом длина доверительного интервала увеличивается, вследствие чего качество прогноза падает.
