- •Линейная регрессия
- •1.2. Простая регрессия
- •6.3. Ортогональная регрессия
- •6.4. Многообразие оценок регрессии
- •6.5. Упражнения и задачи
- •Глава 7
- •Основная модель линейной регрессии
- •7.1. Различные формы уравнения регрессии
- •7.2. Основные гипотезы, свойства оценок
- •7.3. Независимые факторы: спецификация модели
- •7.4. Прогнозирование
- •7.5. Упражнения и задачи
- •Глава 8
- •Нарушение гипотез основной линейной модели
- •8.3. Автокорреляция ошибок
- •8.4. Ошибки измерения факторов
- •8.5. Метод инструментальных переменных
- •8.6. Упражнения и задачи Упражнение 1
7.5. Упражнения и задачи
Упражнение 1
По наблюдениям за объясняемой переменной X и за объясняющими переменными Z = (Z1, Z2) из таблицы 7.1:
1
Вычислите ковариационную матрицу переменных z
(M = ZˆtZˆ), вектор ковариаций переменных z с пе-
N
1
ременной x ( m =
ZˆtXˆ ), дисперсию объясняемой
N
x
q
и остаточную дисперсию s2 = s2 − s2, а также коэф-
e x q
фициент детерминации R2.
Запишите для данной модели уравнение регрессии в форме со скрытым сво- бодным членом X = Z˜a˜ + e. Рассчитайте для переменных начальные момен- ты второго порядка двумя способами:
а) M˜ = 1 ZtZ и
m˜ = 1 ZtX
N ˜ ˜ N ˜
248 Глава 7. Основная модель линейной регрессии
˜
M + z¯tz¯
z¯
z¯t
1
и m˜
m + z¯tx¯
.
x¯
Найдите оценку a˜, рассчитайте s2 = 1 XtX − x¯2 и s2 = m˜ ta˜ − x¯2 и убе-
x N q
дитесь, что результат совпадает с результатом пункта 1 упражнения 1.
Рассчитайте несмещенную оценку остаточной дисперсии
sˆ2 = N s2
e N − n − 1 e
и оцените матрицу ковариации параметров уравнения регрессии
sˆ2
Ma =
e M˜−1.
N
Используя уровень значимости θ = 0.05, вычислите доверительные интер- валы для коэффициентов уравнения регрессии и проверьте значимость фак- торов.
2
Рассчитайте статистику F c = R (N − n − 1)
(1 − R2)n
и, используя уровень значи-
мости θ = 0.05, проверьте гипотезу о том, что модель некорректна и все
факторы введены в нее ошибочно.
Рассчитайте коэффициент детерминации, скорректированный на число сте- пеней свободы R˜2.
По найденному уравнению регрессии и значениям а) z = (min Z1, min Z2);
б) z = (Z¯ , Z¯ );
1 2
в) z = (max Z1, max Z2);
вычислите предсказанное значение для x и соответствующую интервальную оценку при θ = 0.05.
Упражнение 2
Дано уравнение регрессии: X = Z˜α˜ + ε = −1.410z1 + 0.080z2 + 56.962 120 + ε, где X — вектор-столбец 20 наблюдений за объясняемой переменной (20 × 1), ε — вектор-столбец случайных ошибок (20 × 1) с нулевым средним и ковариа-
ционной матрицей σ2I20 = 21.611I20 и
Z˜ — матрица размерности (20 × 3) на-
блюдений за объясняющими переменными. Используя нормальное распределение
7.5. Упражнения и задачи 249
с независимыми наблюдениями, со средним 0 и ковариационной матрицей σ2I20 =
= 21.611I20, получите 100 выборок вектора ε (N × 1), k = 1, . . . , 100, где N =
= 20. Эти случайные векторы потом используйте вместе с известным вектором
α˜ = (−1.410, 0.080, 56.962) и матрицей
Z˜ = (Z1, Z2, 1) из таблицы 7.1. Снача-
ла получите ожидаемое значения X0 = Z˜α˜, затем, чтобы получить 100 выборок
вектора X (20 × 1), добавьте случайные ошибки: X0 + ε = X .
Используйте 10 из 100 выборок, чтобы получить выборочные оценки для α1 ,
α2, β , σ и R2.
Вычислите матрицу ковариаций параметров уравнения регрессии Ma для каж- дого элемента выборки и сравните с истинным значением ковариационной матрицы:
Zt
=
1
0.099813 −0.004112 −0.233234
−0.233234 −0.057857 39.278158
Дайте интерпретацию диагональных элементов ковариационных матриц.
Вычислите среднее и дисперсию для 10 выборок для каждого из параметров, полученных в упражнении 2.1, и сравните эти средние значения с истинными параметрами. Обратите внимание, подтвердилась ли ожидаемые теоретиче- ские результаты.
Используя уровень значимости θ = 0.05, вычислите и сравните интерваль- ные оценки для α1, α2, β и σ для 10 выборок.
Объедините 10 выборок, по 20 наблюдений каждая, в 5 выборок по 40 на- блюдений и повторите упражнения 2.1 и 2.2. Сделайте выводы о результатах увеличения объема выборки.
Повторите упражнения 2.1 и 2.5 для всех 100 и для 50 выборок и проана- лизируйте разницу в результатах.
Постройте распределения частот для оценок, полученных в упражнении 2.6, сравните и прокомментируйте результаты.
250 Глава 7. Основная модель линейной регрессии
Задачи
В регрессии X = Za + 1N b + e матрица вторых начальных моментов ре-
грессоров равна
9 2
. Найдите дисперсию объясняющей переменной.
2 1
На основании ежегодных данных за 10 лет с помощью МНК была сделана оценка параметров производственной функции типа Кобба—Дугласа. Чему равна несмещенная оценка дисперсии ошибки, если сумма квадратов остат- ков равна 32?
В регрессии X = Za + 1N b + e с факторами Zt = (1, 2, 3) сумма квадра- тов остатков равна 6. Найдите ковариационную матрицу оценок параметров регрессии.
Какие свойства МНК-оценок коэффициентов регрессии теряются, если ошибки по наблюдениям коррелированы и/или имеют разные дисперсии?
Что обеспечивает гипотеза о нормальности распределения ошибок при по- строения уравнения регрессии? Ответ обоснуйте.
Какие ограничения на параметры уравнения проверяются с помощью t-кри- терия (написать ограничения с расшифровкой обозначений)?
Четырехфакторное уравнение регрессии оценено по 20-ти наблюдениям. В каком случае отношение оценки коэффициента регрессии к ее стандарт- ной ошибке имеет распределение t-Стьюдента? Сколько степенией свободы в этом случае имеет эта статистика?
Оценки МНК в регрессии по 20-ти наблюдениям равны (2, −1), а ковариа-
9 2
ционная матрица этих оценок равна
. Найти статистики t-Стьюдента
2 1
для этих коэффициентов.
По 10 наблюдениям дана оценка 4 одному из коэффициентов двухфакторной регрессии. Дисперсия его ошибки равна 4. Построить 99%-ный доверитель- ный интервал для этого коэффициента.
МНК-оценка параметра регрессии, полученная по 16 наблюдениям, рав- на 4, оценка его стандартной ошибки равна 1. Можно ли утверждать с веро- ятностью ошибки не более 5%, что истинное значение параметра равно 5.93? Объяснить почему.
7.5. Упражнения и задачи 251
Оценка углового коэффициента регрессии равна 4, а дисперсия этой оценки равна 4. Значим ли этот коэффициент, если табличные значения:
tN −n−1, 0.95 = 2.4, tN −n−1, 0.90 = 1.9?
В результате оценивания регрессии x = zα + 1N β + ε на основе N = 30
наблюдений получены следующие результаты:
x = |
1.2z1+ |
1.0z2− |
0.5z3+ |
25.1 |
Стандартные ошибки оценок
t-статистика 95% доверительные интервалы |
( ) (0.8) (−1.88; 4.28) |
(1.3) ( ) ( ) |
(0.06) ( ) ( ) |
(2.1) ( ) ( ) |
Заполните пропуски в скобках.
На основе годовых отчетов за 1973–1992 годы о затратах на продукты пи- тания Q, располагаемом доходе Y , индексе цен на продукты питания PF и индексе цен на непродовольственные товары P N F , группа исследовате- лей получила различные регрессионные уравнения для функции спроса на продукты питания:
=
3.87 −
(1.45)
1.34
ln
PF
(−4.54)
=
0.56
=
2.83 −
(1.25)
0.92
ln
PF
(−2.70)
+
1.23
ln
Y
(2.99)
=
0.76
=
2.35 −
(1.54)
0.52
ln
PF
(−1.80)
+
0.95
ln
Y
(0.79)
+
1.54
ln
P
N
F
(2.45)
=
0.84
R2
ln Q
R2
ln Q
R2
В скобках приведены значения t-статистики.
Прокомментируйте полученные оценки коэффициентов и t-статистики, объ- ясните, почему значения могут различаться в трех уравнениях. Можете ли вы предложить решение проблемы статистической незначимости коэффициен- тов в последнем уравнении?
252 Глава 7. Основная модель линейной регрессии
Используя приведенные ниже данные, оцените параметры модели xt = β +
+ α1z1t + α2z2t + εt и, делая все необходимые предположения, проверьте статистическую значимость коэффициента α1 .
1t
2t
= 10, zˆ2
= 8, zˆ1tzˆ2t = 8, zˆ1txˆt = −10, zˆ2txˆt = −8,
t
= 20,
t = 1, . . . , 5;
1t
= 55, z2
= 28, z1tz2t = 38, z1txt = 35, z2txt = 22,
2t
Анализ годовых данных (21 наблюдение) о спросе на некоторый товар привел к следующим результатам:
Средние Стандартные
отклонения
Парные коэффициенты корреляции
z¯ = 51.843 sz = 9.205 rxz = 0.9158
x¯ = 8.313 sx = 1.780 rxt = 0.8696
t¯ = 0 st = 6.055 rzt = 0.9304
z — потребление на душу населения, x — цена с учетом дефлятора, t — время (годы).
а) Найдите коэффициент при времени в оцененной регрессии x по z и t. б) Проверьте, будет ли этот коэффициент значимо отличен от нуля.
в) Кратко объясните экономический смысл включения в регрессию вре- мени в качестве объясняющей переменной.
Какие ограничения на параметры уравнения можно проверить с помощью
F -критерия? Написать ограничения с расшифровкой обозначений.
Пяти-факторное уравнение линейной регрессии для переменной x оценено по 31 наблюдению. При этом объясненная и смещенная остаточная дис- персии соответственно равны 8 и 2. Вычислить коэффициент детерминации и расчетное значение F -статистики.
В регрессии x = z1α1 +z2α2 +β +ε по 5-ти наблюдениям смещенная оценка остаточной дисперсии равна 1, а дисперсия зависимой переменной равна 2. Значима ли эта зависимость?
По 10 наблюдениям оценено двухфакторное уравнение линейной регрессии, коэффициент детерминации составляет 90%. При каком уровне доверия это уравнение статистически значимо? Записать уравнение для нахождения этого уровня значимости.
7.5. Упражнения и задачи 253
Используя следующие данные:
X = (5, 1, −2, 5, −4)t, Z = (1, 2, 3, 4, 5)t ,
и делая все необходимые предположения
а) для X = Zα + 1N β + ε оценить 95-процентные доверительные интер- валы для параметров регрессии;
б) проверить значимость коэффициентов регрессии и оценить качество регрессии с вероятностью ошибки 5%.
21. Пусть X = α1Z1 + α2Z2 + ε, X = (4, −2, 4, 0)t , Z1 = (1, 1, 2, 2)t
и Z2 = 2Z1. Постройте систему нормальных уравнений и покажите, что
существует бесконечное множество решений для a1 и a2. Выберите любые два решения, покажите, что они дают одинаковые расчетные значения X и, таким образом, одинаковые значения суммы квадратов ошибок.
Для уравнения регрессии X = Zα + 15β + ε имеются следующие данные:
4
1.03 2.08 0.41
8
1.46 2.80 2.03
X =
, Z = (Z1 Z2 Z3) = 1.14 2.30 0.98 .
5.5
5.8
1.71 3.05 0.81
7.0
1.06 2.17 1.17
а) Являются ли факторы линейно зависимыми?
б) Найти матрицу коэффициентов корреляции факторных переменных, рассчитать определитель данной матрицы и сделать вывод о мульти- коллинеарности факторов.
в) Рассчитать определитель матрицы коэффициентов корреляции фактор- ных переменных в случае, если из уравнения выводится фактор Z2.
г) Учесть дополнительную внешнюю информацию: α1 = 1.5α2 (с помо- щью подстановки в уравнение регрессии) и найти определитель матрицы коэффициентов корреляции факторных переменных.
r
при использовании исходного уравнения;
при исключении из уравнения фактора Z2;
254 Глава 7. Основная модель линейной регрессии
– при использовании внешней информации из пункта (г).
Пусть цены сильно коррелируют с денежной массой и неплатежами. Ко- эффициент корреляции между денежной массой и неплатежами равен
0.975 .R2 = 0.95.. Имеет ли смысл строить регрессию цен на эти два (сильно
мультиколлинеарных) фактора?
Модель
x = α1z1 + α2z2 + β + ε (1)
1
преобразованной модели
x = α1z1 + α2z2 + α3z3 + β + ε (2)
2
1
не может быть больше, чем R2. При каких
2
б) Объясните последствия оценки модели (1), если верной является мо- дель (2).
В регрессии x = α1z1 + β + ε остатки равны (−2, 1, 0, 1). Оценивается регрессия x = α1z1 + α2z2 + β + ε. Привести пример переменной z2 , чтобы коэффициенты детерминации в обеих регрессиях совпадали.
В регрессию x = α1z1 + β + ε добавили переменную z2. Переменная z2 оказалась совершенно незначимой. Как изменились обычный и скорректи- рованный коэффициенты детерминации?
Коэффициент детерминации в регрессии выпуска продукции по численности занятых в производстве, оцененной по 12 наблюдениям, равен 0.8. После введения в регрессию дополнительного фактора — основного капитала — он вырос до 0.819. Имело ли смысл вводить этот дополнительный фактор? Ответ обосновать без применения статистических критериев.
Дана модель регрессии xi = α1zi + β + εi .
а) Как оценивается точечный прогноз xN +1, если известно, что β = 0?
Покажите, что дисперсия ошибок прогноза будет равна σ2
. z2 .
1+ N +1 .
N
z
i
i=1
7.5. Упражнения и задачи 255
б) Как оценивается точечный прогноз xN +1, если известно, что α = 0?
N
Почему ошибки прогнозирования по линейной регрессии увеличиваются с ростом горизонта прогноза?
Была оценена регрессия x = α1z + β + ε по 50 наблюдениям. Делается прогноз x в точке z51. При каком значении z51 доверительный интервал прогноза будет самым узким?
Вычислите предсказанное значение для x и соответствующую интервальную оценку прогноза при θ = 0.05 в точке z26 = 14, если регрессионная модель x = 3z + 220 + e построена по 25 наблюдениям, остаточная дисперсия равна 25 и средняя по z равна 14.
Рекомендуемая литература
Айвазян С.А. Основы эконометрики. Т.2. — М.: Юнити, 2001. (Гл. 2).
Демиденко Е.З. Линейная и нелинейная регрессия. — М.: «Финансы и ста- тистика», 1981. (Гл. 1, 2, 6).
Джонстон Дж. Эконометрические методы. — М.: «Статистика», 1980. (Гл. 2, 5).
Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х книгах. Кн.1 — М.: «Финансы и статистика», 1986, (Гл. 1, 2).
Кейн Э. Экономическая статистика и эконометрия. Вып. 2. — М.: «Стати- стика», 1977. (Гл. 10, 11, 14).
Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: «Дело», 2000. (Гл. 3, 4, 8).
(*) Маленво Э. Статистические методы эконометрии. Вып. 1. — М.: «Ста- тистика», 1975. (Гл. 3, 6).
Себер Дж. Линейный регрессионый анализ. — М.: Мир, 1980.
Тинтер Г. Введение в эконометрию. — М.: «Статистика», 1965. (Гл. 5).
Davidson, Russel, Mackinnon, James. Estimation and Inference in Econo- metrics, N 9, Oxford University Press, 1993. (Ch. 2).
256 Глава 7. Основная модель линейной регрессии
Greene W.H. Econometric Analysis, Prentice-Hall, 2000. (Ch. 6, 7).
Judge G.G., Hill R.C., Griffiths W.E., Luthepohl H., Lee T. Introduction to the Theory and Practice of Econometric. John Wiley & Sons, Inc., 1993. (Ch. 5, 21).
(*) William E., Griffiths R., Carter H., George G. Judge. Learning and Prac- ticing econometrics, N 9 John Wiley & Sons, Inc., 1993. (Ch. 8).