- •Федеральное агентство по образованию
- •Южно-уральский государственный университет
- •Факультет экономики и предпринимательства
- •Кафедра «предпринимательство и менеджмент»
- •Учебно-методический комплекс
- •Оглавление
- •Цель, задачи и содержание дисциплины
- •Календарно-тематический план работы студента
- •Рабочая программа
- •Федеральное агентство по образованию
- •Южно-уральский государственный университет
- •Факультет экономики и предпринимательства
- •Кафедра «предпринимательство и менеджмент»
- •Рабочая программа
- •1. Введение
- •2. Разделы дисциплины, виды и объем занятий
- •3. Требования к практическим видам занятий при освоении дисциплины
- •4. Рекомендуемая литература
- •Требования к практическим видам занятий при освоении дисциплины
- •Методические рекомендации
- •1. Методические рекомендации по изучению теоретического материала.
- •2. Методические рекомендации по решению практических задач.
- •3. Методические рекомендации по выполнению контрольных работ.
- •4. Требования к критериям оценки выполнения практических заданий, контрольных работ.
- •Краткий курс лекций
- •1. Предмет, метод и задачи курса «Эконометрика».
- •1.1. Соотношения между экономическими переменными.
- •2.1. Определения. Линейная регрессионная модель для случая одной факторной переменной.
- •2.3. Свойства оценок мнк.
- •2.4.Регрессия по эмпирическим (выборочным) данным и теоретическая регрессия.
- •Таким образом, получено уравнение регрессии
- •2.5. Экономическая интерпретация параметров линейного уравнения регрессии.
- •2.6. Измерение и интерпретация случайной составляющей.
- •3. Линейная модель множественной регрессии
- •3.1. Обоснование и отбор факторов при построении множественной регрессии.
- •3.2. Линейная регрессионная модель со многими переменными.
- •3.3. Оценка и интерпретация параметров.
- •3.4. Описание связей между макроэкономическими переменными.
- •3.5. Формирование регрессионных моделей на компьютере с помощью ппп Excel
- •3.5.1. Однофакторная регрессия.
- •3.5.2. Многофакторная регрессия.
- •4. Нелинейные модели регрессии и их линеаризация
- •4.1. Мультипликативные модели регрессии и их линеаризация.
- •4.2. Гиперболическая и логарифмическая регрессии. Полиномиальная и кусочно-полиномиальная регрессия.
- •4.3. Экспоненциальная и степенная регрессии.
- •5.1. Доверительные интервалы для коэффициентов: реальные статистические данные
- •5.2. Проверка статистических гипотез о значениях коэффициентов
- •5.3. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
- •5.4. Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерии
- •5.6. Обобщенный метод наименьших квадратов. Метод Главных Компонент.
- •5.7.Прогнозирование. Доверительный интервал прогноза.
- •6. Временные ряды.
- •6.1. Характеристики временных рядов. Выявление тренда в динамических рядах экономических показателей.
- •6.3. Статистика Дарбина-Уотсона.
- •7.Задачи экономического анализа, решаемые на основе регрессионных эконометрических моделей
- •7.1. Измерение тесноты связи между результативным и факторными признаками.
- •18. Имеются данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 2006 г.).
- •Вопросы к экзамену(зачету) по дисциплине «Эконометрика».
- •Контрольные задания по дисциплине «Эконометрика».
- •Рекомендуемая литература
5.3. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
Приводимая ниже таблица содержит ежегодные данные о следующих показателях экономики Франции за период с 1949 по 1960 годы (млрд. франков, в ценах 1959 г.):
Y – объем импорта товаров и услуг во Францию;
X1 – валовой национальный продукт;
X2 – потребление семей.
|
год |
Y |
X1 |
X2 |
год |
Y |
X1 |
X2 |
|
1949 |
15.9 |
149.3 |
4.2 |
1955 |
22.7 |
202.1 |
2.1 |
|
1950 |
16.4 |
161.2 |
4.1 |
1956 |
26.5 |
212.4 |
5.6 |
|
1951 |
19.0 |
171.5 |
3.1 |
1957 |
28.1 |
226.1 |
5.0 |
|
1952 |
19.1 |
175.5 |
3.1 |
1958 |
27.6 |
231.9 |
5.1 |
|
1953 |
18.8 |
180.8 |
1.1 |
1959 |
26.3 |
239 |
0.7 |
|
1954 |
20.4 |
190.7 |
2.2 |
1960 |
31.1 |
258 |
5.6 |
Выберем модель наблюдений в виде
![]()
где
–
значение показателя
вi-м
наблюдении (i-му
наблюдению соответствует
год. Будем, как обычно, предполагать что
нормально распределенные случайные
величины с параметрами
и что значение
нам не
известно. Регрессионный анализ дает
следующие результаты:
и
|
Переменная |
Коэф-т |
Ст. ошибка |
t-статист. |
P-знач. |
|
1 |
–8.570 |
2.869 |
-2.988 |
0.0153 |
|
X1 |
0.029 |
0.110 |
0.267 |
0.7953 |
|
X2 |
0.177 |
0.166 |
1.067 |
0.3136 |
Обращают
на себя внимание выделенные курсивом
-значения.
В соответствии с ними, проверка каждой
отдельной гипотезы
,
(даже при уровне значимости
)
приводит к решению о ее неотклонении.
Соответственно, при реализации каждой
из этих двух процедур проверки
соответствующий параметр
или
признается статистически незначимым.
И это выглядит противоречащим весьма
высокому значению коэффициента
детерминации.
По-существу, вопрос стоит таким образом: необходимо построить статистическую процедуру для проверки гипотезы
![]()
конкретизирующей значения не какого-то одного, а сразу двух коэффициентов.
И вообще, как проверить гипотезу
![]()
(гипотеза значимости регрессии) в рамках нормальной линейной модели множественной регрессии
![]()
Соответствующий статистический критерий основывается на так называемой F-статистике

Здесь
–
остаточная сумма квадратов, получаемая
при оценивании полной модели (с
объясняющими переменными, включая
тождественную единицу), а
–
остаточная сумма квадратов, получаемая
при оценивании модели с наложенными
гипотезой
ограничениями на параметры. Но последняя
(редуцированная)
модель имеет вид
![]()
и применение к ней метода наименьших квадратов приводит к оценке
![]()
так что
![]()
Следовательно,
![]()
В некоторых пакетах статистического анализа (например, в EXCEL) в распечатках результатов приводятся значения числителя и знаменателя этой статистики (в графе Средние квадраты – Mean Squares).
Если
нормально распределенные случайные
величины с параметрами
,
то указанная
-статистика,
рассматриваемая как случайная величина,
имеет при
гипотезе H0
(т. е. когда
действительно α1
αm
)
стандартное распределение
,
называемоеF-распределением
Фишера с m
и (n-m-1)
степенями
свободы.
Чем
больше отношение
,
тем больше есть оснований говорить о
том, что совокупность переменных
действительно помогает в объяснении
изменчивости объясняемой переменной
.
В соответствии с этим, гипотеза
![]()
отвергается
при «слишком больших» значениях F,
скорее указывающих на невыполнение
этой гипотезы. Соответствующее пороговое
значение определяется как квантиль
уровня
распределения
,
обозначаемая символом
.
Итак, гипотеза Н0 отвергается, если выполняется неравенство
![]()
При
этом вероятность ошибочного отвержения
гипотезы
равна
.
Статистические
пакеты, выполняющие регрессионный
анализ, приводят среди прочих результатов
такого анализа также значение
указанной
-статистики
и соответствующее ему P-значение
(P-value), т. е.
вероятность
![]()
В
частности, в рассмотренном выше примере
с импортом товаров и услуг во Францию
вычисленное (наблюдаемое) значение
-статистики
равно
,
в то время как критическое значение
![]()
Соответственно,
-значение
крайне мало –
в распечатке результатов приведено
значение
.
Значит, здесь нет практически никаких
оснований принимать составную гипотезу
,
хотя каждая из частных гипотез
и
,
рассматриваемая сама по себе, в отрыве от второй, не отвергается.
Подобное положение встречается не так уж и редко и связано с проблемой мультиколлинеарности данных. Далее мы уделим этой проблеме определенное внимание.
Пример. Анализ данных об уровнях безработицы среди белого и цветного населения США приводит к следующим результатам:
,
,
-значение
,
так что при выборе
гипотеза
не
отвергается, а при выборе
отвергается.
Пример. Анализ зависимости спроса на куриные яйца от цены приводит к значениям
,
,
-значение
,
так что гипотеза
отвергается, а регрессия признается
статистически значимой.
Пример. Зависимость производства электроэнергии в США от мирового рекорда по прыжкам в высоту с шестом:
,
,
-значение
,
регрессия признается статистически
значимой.
Пример. Потребление свинины в США в зависимости от оптовых цен:
,
,
-значение
,
так что гипотеза
не отвергается даже при выборе
.
Отметим,
наконец, еще одно обстоятельство. Во
всех четырех рассмотренных примерах
регрессионного анализа модели простой
(парной) линейной регрессии (m=1)
вычисленные
-значения
-статистик
совпадают с
-значениями
-статистик,
используемых для проверки гипотезы
.
Факт такого совпадения отнюдь не случаен
и может быть доказан с использованием
алгебраических преобразований.
Применение
критериев, основанных на статистиках,
имеющих при нулевой гипотезе
-распределение
Фишера (F-критерии),
отнюдь не ограничивается только что
рассмотренным анализом статистической
значимости регрессии. Такие критерии
широко применяются в процессе подбора
модели.
Пусть мы находимся в рамках множественной линейной модели регрессии
![]()
c
объясняющими переменными, и гипотеза
состоит
в том, что в модели
последние
коэффициентов равны нулю, т. е.
![]()
Тогда
при гипотезе
(т.
е. в случае, когда она верна) мы имеемредуцированную
модель
![]()
уже
с
объясняющими переменными.
Пусть
-
остаточная сумма квадратов в полной
модели
,
а
–
остаточная сумма квадратов в редуцированной
модели
.Если гипотеза
верна
и выполнены стандартные предположения
о модели (в
частности,
нормально распределенные случайные
величины с параметрами
),
то тогдаF-статистика

рассматриваемая как случайная величина, имеет при гипотезе H0 (т. е. когда действительно αm αm-1 αm-q+1 ) F-распределение Фишера F (q, n-m-1) с q и (n-m-1) степенями свободы.
F-статистика измеряет, в соответствующем масштабе, возрастание объясненной суммы квадратов вследствие включения в модель дополнительного количества объясняющих переменных.
Естественно считать, что включение дополнительных переменных существенно, если указанное возрастание объясненной суммы квадратов достаточно велико. Это приводит нас к критерию проверки гипотезы
![]()
основанному
на F-статистике
и отвергающему
гипотезу
,
когданаблюдаемое
значение
этой статистики удовлетворяет неравенству
![]()
где
–
выбранный уровень значимости критерия
(вероятность ошибки 1-го рода).
Пример. В следующей таблице приведены данные по США о следующих макроэкономических показателях:
–годовой
совокупный располагаемый личный доход;
–годовые
совокупные потребительские расходы;
–финансовые
активы населения на начало календарного
года
(все показатели указаны в млрд. долларов, в ценах 1982 г.).
|
год |
C82 |
DPI82 |
A82 |
1971 |
1540.3 |
1730.1 |
1902.8 |
|
1966 |
1300.5 |
1433.0 |
1641.6 |
1972 |
1622.3 |
1797.9 |
2011.4 |
|
1967 |
1339.4 |
1494.9 |
1675.2 |
1973 |
1687.9 |
1914.9 |
2190.6 |
|
1968 |
1405.9 |
1551.1 |
1772.6 |
1974 |
1672.4 |
1894.9 |
2301.8 |
|
1969 |
1458.3 |
1601.7 |
1854.7 |
1975 |
1710.8 |
1930.4 |
2279.6 |
|
1970 |
1491.8 |
1668.1 |
1862.2 |
1976 |
1804.0 |
2001.0 |
2308.4 |
Рассмотрим модель наблюдений
![]()
где
индексу
соответствует
год. Это модель с3 объясняющими
переменными:
![]()
символ
обозначает переменную, значения которой
запаздывают на одну единицу времени
относительно
значений переменной,
.
Оценивание этой модели дает следующие
результаты:
![]()
![]()
![]()
![]()
![]()
—статистика
критерия проверки значимости регрессии
в целом
![]()
Регрессия имеет очень высокую статистическую значимость. Вместе с тем, каждый из коэффициентов при двух последних переменных статистически незначим, так что, в частности, не следует придавать особого значения отрицательности оценок этих коэффициентов.
Используя
–
критерий, мы могли бы попробовать удалить
из модели какую-нибудь одну из двух
последних переменных, и если оставшиеся
переменные окажутся значимыми, то
остановиться на модели с 2 объясняющими
переменными; если же и в новой модели
окажутся статистически незначимые
переменные, то произвести еще одну
редукцию модели.
Рассмотрим, в этой связи, модель
![]()
с
удаленной переменной
.
Для нее получаем:
![]()
![]()
![]()
![]()
F-статистика критерия проверки значимости регрессии в этой модели
![]()
Поскольку
здесь остается статистически незначимым
коэффициент при переменной
,
можно произвести дальнейшую редукцию,
переходя к модели
![]()
Для этой модели
![]()
![]()
![]()
-статистика
критерия проверки значимости регрессии
в этой модели
![]()
и эту модель в данном контексте можно принять за окончательную.
С
другой стороны, обнаружив при анализе
модели
(посредством примененияt-критериев)
статистическую незначимость коэффициентов
при двух последних переменных, мы можем
попробовать выяснить возможность
одновременного
исключения из
этой модели указанных объясняющих
переменных, опираясь на использование
соответствующего F-критерия.
Исключение
двух последних переменных из модели
соответствует гипотезе
![]()
при
которой модель
редуцируется сразу к модели
.
Критерий проверки гипотезы
основывается на статистике

где
–
остаточная сумма квадратов в модели
,
– остаточная сумма квадратов в модели
,
– количество зануляемых параметров,
.
Для наших данных получаем значение
![]()
которое
следует сравнить с критическим значением
Поскольку
,
мы не отвергаем гипотезу
и можем сразу перейти от модели
к модели
.
Замечание. В рассмотренном примере мы действовали двумя способами:
Дважды
использовали
-критерии,
сначала приняв (не отвергнув) гипотезу
в рамках модели
,
а затем приняв гипотезу
в рамках модели
.
Однократно
использовали F-критерий,
приняв гипотезу
в рамках модели
.
Выводы
при этих двух альтернативных подходах
оказались одинаковыми. Однако, из выбора
модели
в подобной последовательной процедуре,
вообще
говоря, не следует
что такой же выбор будет обязательно
сделан и при применении
-критерия,
сравнивающего первую и последнюю модели.
