- •Министерство науки и образования российской федерации
- •Тема 1. Предмет, метод и задачи ЭконометрикИ 6
- •Тема 2. Линейные однофакторные регрессионные
- •Тема 3. Линейная модель множественной
- •Тема 4. Нелинейные модели регрессии и их
- •4.6. Практический блок 56
- •4.7. Самостоятельная работа студентов 61
- •Тема 5. Оценка качества эконометрических
- •Тема 6. Временные ряды 112
- •Тема 7. Задачи экономического анализа, решаемые на основе эконометрических моделей 135
- •Тема 8. Системы эконометрических уравнений 167
- •Введение
- •1.2. Соотношения между экономическими переменными.
- •Регрессионные модели как инструмент анализа и прогнозирования экономических явлений.
- •Практический блок
- •Самостоятельная работа студентов Рекомендуемые темы рефератов
- •Литература для самостоятельной работы
- •Интернет-ресурсы:
- •Тема 2. Линейные однофакторные регрессионные модели эконометрики
- •2.7. Практический блок 22
- •2.8. Самостоятельная работа студентов 31
- •2.1. Определения. Линейная регрессионная модель для случая одной факторной переменной
- •Метод наименьших квадратов (мнк).
- •2.3. Свойства оценок мнк.
- •2.4.Регрессия по эмпирическим (выборочным) данным и теоретическая регрессия.
- •Таким образом, получено уравнение регрессии
- •2.5. Экономическая интерпретация параметров линейного уравнения регрессии.
- •2.6. Измерение и интерпретация случайной составляющей.
- •Практический блок Примеры
- •Контрольные вопросы
- •Задания и задачи
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •Тема 3. Линейная модель множественной регрессии
- •3.6. Практический блок 42
- •3.7 Самостоятельная работа студентов 49
- •3.1. Отбор факторов при построении множественной регрессии.
- •3.2. Линейная регрессионная модель со многими переменными.
- •3.3. Оценка и интерпретация параметров.
- •3.4. Описание связей между макроэкономическими переменными.
- •3.5. Формирование регрессионных моделей на компьютере с помощью ппп Excel
- •3.5.1. Однофакторная регрессия.
- •3.5.2. Многофакторная регрессия.
- •Практический блок Примеры
- •Контрольные вопросы
- •Задания и задачи
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •Тема 4. Нелинейные модели регрессии и их линеаризация
- •4.6. Практический блок 56
- •4.7. Самостоятельная работа студентов 61
- •4.1. Общие понятия
- •4.2. Мультипликативные модели регрессии и их линеаризация.
- •4.3. Гиперболическая и логарифмическая регрессии. Полиномиальная и кусочно-полиномиальная регрессия.
- •4.4. Экспоненциальная и степенная однофакторная регрессии.
- •Формирование нелинейных однофакторных регрессионных моделей на компьютере с помощью ппп Excel
- •Практический блок Пример
- •Контрольные вопросы
- •Задания и задачи
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •5.8. Практический блок 97
- •5.9. Самостоятельная работа студентов 111
- •5.1. Доверительные интервалы для коэффициентов: реальные статистические данные
- •5.2. Проверка статистических гипотез о значениях коэффициентов
- •5.3. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
- •5.4. Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерии
- •Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.
- •5.6. Обобщенный метод наименьших квадратов. Метод Главных Компонент.
- •5.7.Прогнозирование. Доверительный интервал прогноза.
- •Практический блок
- •Контрольные вопросы
- •Задания и задачи
- •3. Имеются данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 2006 г.).
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •6 . Временные ряды.
- •6.6. Практический блок 123
- •6.7. Самостоятельная работа студентов 134
- •6.1. Характеристики временных рядов. Выявление тренда в динамических рядах экономических показателей.
- •Моделирование сезонных и циклических колебаний.
- •6.3. Статистика Дарбина-Уотсона.
- •6.4. Динамические эконометрические модели
- •6.5. Интерпретация параметров моделей с распределенным лагом
- •Практический блок Пример.
- •Задания и задачи
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •7.Задачи экономического анализа, решаемые на основе регрессионных эконометрических моделей
- •7.3. Практический блок 148
- •7.4. Самостоятельная работа студентов 166
- •7.1. Измерение тесноты связи между результативным и факторными признаками.
- •Анализ влияния отдельных факторных признаков на результативный признак.
- •Практический блок Пример
- •Контрольные вопросы
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •8. Системы эконометрических уравнений.
- •8.4. Практический блок 172
- •8.5. Самостоятельная работа студентов 181
- •8.1. Структура систем эконометрических уравнений
- •8.2. Проблема идентификации
- •Методы решения систем эконометрических уравнений
- •Практический блок
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •Методические рекомендации
- •1. Методические рекомендации по изучению теоретического материала.
- •2. Методические рекомендации по решению практических задач.
- •3. Методические рекомендации по выполнению контрольных работ.
- •4. Требования к критериям оценки выполнения практических заданий, контрольных работ.
- •Вопросы для подготовки к зачету
- •Контрольные задания
- •Глоссарий
- •Список рекомендуемой литературы
- •Предметный указатель
- •Приложения
5.3. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
Приводимая ниже таблица 5.1 содержит ежегодные данные о следующих показателях экономики Франции за период с 1949 по 1960 годы (млрд. франков, в ценах 1959 г.):
Y – объем импорта товаров и услуг во Францию;
X1 – валовой национальный продукт;
X2 – потребление семей.
Таблица 5.1
год |
Y |
X1 |
X2 |
год |
Y |
X1 |
X2 |
1949 |
15.9 |
149.3 |
4.2 |
1955 |
22.7 |
202.1 |
2.1 |
1950 |
16.4 |
161.2 |
4.1 |
1956 |
26.5 |
212.4 |
5.6 |
1951 |
19.0 |
171.5 |
3.1 |
1957 |
28.1 |
226.1 |
5.0 |
1952 |
19.1 |
175.5 |
3.1 |
1958 |
27.6 |
231.9 |
5.1 |
1953 |
18.8 |
180.8 |
1.1 |
1959 |
26.3 |
239 |
0.7 |
1954 |
20.4 |
190.7 |
2.2 |
1960 |
31.1 |
258 |
5.6 |
Выберем модель наблюдений в виде
где – значение показателя в i-м наблюдении (i-му наблюдению соответствует год. Будем, как обычно, предполагать что нормально распределенные случайные величины с параметрами и что значение нам не известно. Регрессионный анализ дает следующие результаты: и
Переменная |
Коэф-т |
Ст. ошибка |
t-статист. |
P-знач. |
1 |
–8.570 |
2.869 |
-2.988 |
0.0153 |
X1 |
0.029 |
0.110 |
0.267 |
0.7953 |
X2 |
0.177 |
0.166 |
1.067 |
0.3136 |
Обращают на себя внимание выделенные курсивом -значения. В соответствии с ними, проверка каждой отдельной гипотезы , (даже при уровне значимости ) приводит к решению о ее неотклонении. Соответственно, при реализации каждой из этих двух процедур проверки соответствующий параметр или признается статистически незначимым. И это выглядит противоречащим весьма высокому значению коэффициента детерминации.
По-существу, вопрос стоит таким образом: необходимо построить статистическую процедуру для проверки гипотезы
конкретизирующей значения не какого-то одного, а сразу двух коэффициентов.
И вообще, как проверить гипотезу
(гипотеза значимости регрессии) в рамках нормальной линейной модели множественной регрессии
Соответствующий статистический критерий основывается на так называемой F-статистике
Здесь – остаточная сумма квадратов, получаемая при оценивании полной модели (с объясняющими переменными, включая тождественную единицу), а – остаточная сумма квадратов, получаемая при оценивании модели с наложенными гипотезой ограничениями на параметры. Но последняя (редуцированная) модель имеет вид
и применение к ней метода наименьших квадратов приводит к оценке
так что
Следовательно,
В некоторых пакетах статистического анализа (например, в EXCEL) в распечатках результатов приводятся значения числителя и знаменателя этой статистики (в графе Средние квадраты – Mean Squares).
Если нормально распределенные случайные величины с параметрами , то указанная -статистика, рассматриваемая как случайная величина, имеет при гипотезе H0 (т. е. когда действительно α1 αm ) стандартное распределение , называемое F-распределением Фишера с m и (n-m-1) степенями свободы.
Чем больше отношение , тем больше есть оснований говорить о том, что совокупность переменных действительно помогает в объяснении изменчивости объясняемой переменной .
В соответствии с этим, гипотеза
отвергается при «слишком больших» значениях F, скорее указывающих на невыполнение этой гипотезы. Соответствующее пороговое значение определяется как квантиль уровня распределения , обозначаемая символом .
Итак, гипотеза Н0 отвергается, если выполняется неравенство
При этом вероятность ошибочного отвержения гипотезы равна .
Статистические пакеты, выполняющие регрессионный анализ, приводят среди прочих результатов такого анализа также значение указанной -статистики и соответствующее ему P-значение (P-value), т. е. вероятность
В частности, в рассмотренном выше примере с импортом товаров и услуг во Францию вычисленное (наблюдаемое) значение -статистики равно , в то время как критическое значение
Соответственно, -значение крайне мало – в распечатке результатов приведено значение . Значит, здесь нет практически никаких оснований принимать составную гипотезу , хотя каждая из частных гипотез
и ,
рассматриваемая сама по себе, в отрыве от второй, не отвергается.
Подобное положение встречается не так уж и редко и связано с проблемой мультиколлинеарности данных. Далее мы уделим этой проблеме определенное внимание.
Пример 5.5. Анализ данных об уровнях безработицы среди белого и цветного населения США приводит к следующим результатам:
, , -значение , так что при выборе гипотеза не отвергается, а при выборе отвергается.
Пример 5.6. Анализ зависимости спроса на куриные яйца от цены приводит к значениям
, , -значение , так что гипотеза отвергается, а регрессия признается статистически значимой.
Пример 5.7. Зависимость производства электроэнергии в США от мирового рекорда по прыжкам в высоту с шестом:
, , -значение , регрессия признается статистически значимой.
Пример 5.8. Потребление свинины в США в зависимости от оптовых цен:
, , -значение , так что гипотеза не отвергается даже при выборе .
Отметим, наконец, еще одно обстоятельство. Во всех четырех рассмотренных примерах регрессионного анализа модели простой (парной) линейной регрессии (m=1) вычисленные -значения -статистик совпадают с -значениями -статистик, используемых для проверки гипотезы . Факт такого совпадения отнюдь не случаен и может быть доказан с использованием алгебраических преобразований.
Применение критериев, основанных на статистиках, имеющих при нулевой гипотезе -распределение Фишера (F-критерии), отнюдь не ограничивается только что рассмотренным анализом статистической значимости регрессии. Такие критерии широко применяются в процессе подбора модели.
Пусть мы находимся в рамках множественной линейной модели регрессии
c объясняющими переменными, и гипотеза состоит в том, что в модели последние коэффициентов равны нулю, т. е.
Тогда при гипотезе (т. е. в случае, когда она верна) мы имеем редуцированную модель
уже с объясняющими переменными.
Пусть - остаточная сумма квадратов в полной модели , а – остаточная сумма квадратов в редуцированной модели . Если гипотеза верна и выполнены стандартные предположения о модели (в частности, нормально распределенные случайные величины с параметрами ), то тогда F-статистика
рассматриваемая как случайная величина, имеет при гипотезе H0 (т. е. когда действительно αm αm-1 αm-q+1 ) F-распределение Фишера F (q, n-m-1) с q и (n-m-1) степенями свободы.
F-статистика измеряет, в соответствующем масштабе, возрастание объясненной суммы квадратов вследствие включения в модель дополнительного количества объясняющих переменных.
Естественно считать, что включение дополнительных переменных существенно, если указанное возрастание объясненной суммы квадратов достаточно велико. Это приводит нас к критерию проверки гипотезы
основанному на F-статистике и отвергающему гипотезу , когда наблюдаемое значение этой статистики удовлетворяет неравенству
где – выбранный уровень значимости критерия (вероятность ошибки 1-го рода).
Пример 5.9. В таблице 5.2. приведены данные по США о следующих макроэкономических показателях:
– годовой совокупный располагаемый личный доход;
– годовые совокупные потребительские расходы;
– финансовые активы населения на начало календарного года
(все показатели указаны в млрд. долларов, в ценах 1996 г.).
Таблица 5.2
-
год
C
DPI
A
1986
1300.5
1433.0
1641.6
1987
1339.4
1494.9
1675.2
1988
1405.9
1551.1
1772.6
1989
1458.3
1601.7
1854.7
1990
1491.8
1668.1
1862.2
1991
1540.3
1730.1
1902.8
1992
1622.3
1797.9
2011.4
1993
1687.9
1914.9
2190.6
1994
1672.4
1894.9
2301.8
1995
1710.8
1930.4
2279.6
1996
1804.0
2001.0
2308.4
Рассмотрим модель наблюдений
где индексу соответствует год. Это модель с 3 объясняющими переменными:
символ обозначает переменную, значения которой запаздывают на одну единицу времени относительно значений переменной, . Оценивание этой модели дает следующие результаты:
— статистика критерия проверки значимости регрессии в целом
Регрессия имеет очень высокую статистическую значимость. Вместе с тем, каждый из коэффициентов при двух последних переменных статистически незначим, так что, в частности, не следует придавать особого значения отрицательности оценок этих коэффициентов.
Используя – критерий, мы могли бы попробовать удалить из модели какую-нибудь одну из двух последних переменных, и если оставшиеся переменные окажутся значимыми, то остановиться на модели с 2 объясняющими переменными; если же и в новой модели окажутся статистически незначимые переменные, то произвести еще одну редукцию модели.
Рассмотрим, в этой связи, модель
с удаленной переменной . Для нее получаем:
F-статистика критерия проверки значимости регрессии в этой модели
Поскольку здесь остается статистически незначимым коэффициент при переменной , можно произвести дальнейшую редукцию, переходя к модели
Для этой модели
-статистика критерия проверки значимости регрессии в этой модели
и эту модель в данном контексте можно принять за окончательную.
С другой стороны, обнаружив при анализе модели (посредством применения t-критериев) статистическую незначимость коэффициентов при двух последних переменных, мы можем попробовать выяснить возможность одновременного исключения из этой модели указанных объясняющих переменных, опираясь на использование соответствующего F-критерия.
Исключение двух последних переменных из модели соответствует гипотезе
при которой модель редуцируется сразу к модели . Критерий проверки гипотезы основывается на статистике
где – остаточная сумма квадратов в модели , – остаточная сумма квадратов в модели , – количество зануляемых параметров, .
Для наших данных получаем значение
которое следует сравнить с критическим значением Поскольку , мы не отвергаем гипотезу и можем сразу перейти от модели к модели .
Замечание. В рассмотренном примере мы действовали двумя способами:
Дважды использовали -критерии, сначала приняв (не отвергнув) гипотезу в рамках модели , а затем приняв гипотезу в рамках модели .
Однократно использовали F-критерий, приняв гипотезу в рамках модели .
Выводы при этих двух альтернативных подходах оказались одинаковыми. Однако, из выбора модели в подобной последовательной процедуре, вообще говоря, не следует что такой же выбор будет обязательно сделан и при применении -критерия, сравнивающего первую и последнюю модели.