 
        
        - •Е.И. Ермолаева, е.И. Куимова Основы эконометрики: практикум
- •Предисловие
- •Лабораторная работа №1 Парная линейная регрессия
- •Лабораторная работа №2 Нелинейные модели парной регрессии
- •Лабораторная работа №3 Множественная регрессия
- •Лабораторная работа №4 Проверка адекватности модели регрессии по особенностям остаточных величин
- •Лабораторная работа №5 Анализ построенной модели регрессии на гетерокедастичность остатков
- •Лабораторная работа №6 Анализ динамики временных рядов
- •Лабораторная работа №7 Моделирование временных рядов с сезонными колебаниями
- •Лабораторная работа №8 Анализ взаимосвязи двух временных рядов
- •Уравнение линейной регрессии по уровням временных рядов
- •Уравнение регрессии по уровням временных рядов с включенным фактором времени
- •Уравнение регрессии по первым разностям
- •Лабораторная работа №9 Моделирование временных рядов с распределенным лагом
- •Лабораторная работа №10 Авторегрессионные модели временных рядов
- •Лабораторная работа №11 Модели систем одновременных уравнений и их составляющие
- •Проблема идентификации
- •Значения статистики Дарбина-Уотсона на 5%-ном уровне значимости
- •Содержание
- •Библиографический список
Лабораторная работа №5 Анализ построенной модели регрессии на гетерокедастичность остатков
Практические рекомендации по выполнению расчетов
с помощью табличного редактора MS Excel
Представлены данные о доходах по акциям x и балансовой прибыли y по 11 предприятиям одной отрасли, ден. ед.
| x | 3 | 4 | 5 | 7 | 8 | 10 | 11 | 12 | 15 | 20 | 30 | 
| y | 12 | 13 | 20 | 19 | 31 | 24 | 41 | 28 | 52 | 55 | 103 | 
Необходимо:
1. Проверить гипотезу о наличии гетерокедастичности в линейной регрессии с помощью теста ранговой корреляции Спирмена при доверительной вероятности 0,95.
2. Проверить гипотезу о гетерокедастичности с помощью теста Гольфельда-Квандта.
3. Дайте график зависимости остатков регрессии от фактора x.
4. При положительных тестах на гетерокедастичность оцените ее количественно с помощью теста Уайта.
5. Попытаться сгладить гетерокедастичность с помощью обобщенного метода наименьших квадратов.
Решение.
1) Суть проверки
заключается в том, что в случае
гетерокедастичности абсолютные остатки
 коррелированны со значениями фактора
коррелированны со значениями фактора .
Эту корреляцию можно измерить с помощьюкоэффициента
ранговой корреляции Спирмена:
.
Эту корреляцию можно измерить с помощьюкоэффициента
ранговой корреляции Спирмена:
 ,
,
где d
– абсолютная разность между рангами 
 и
и .
Статистическая значимость коэффициента
.
Статистическая значимость коэффициента оценивается по критерию Стьюдента.
Расчетное значениеt-критерия
вычисляется по формуле:
оценивается по критерию Стьюдента.
Расчетное значениеt-критерия
вычисляется по формуле:
 .
.
Данная величина
сравнивается с критической величиной
при 
 и числе степеней свободы
и числе степеней свободы .
Если
.
Если ,
то корреляция между
,
то корреляция между и
и статистически значима, т.е. имеет место
гетерокедастичность остатков. В противном
случае принимается гипотеза об отсутствии
гетерокедастичности остатков.
статистически значима, т.е. имеет место
гетерокедастичность остатков. В противном
случае принимается гипотеза об отсутствии
гетерокедастичности остатков.
Прежде всего найдем уравнение линейной регрессии.
| ВЫВОД ИТОГОВ | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| Регрессионная статистика | 
 | 
 | 
 | |
| Множественный R | 0,970082893 | 
 | 
 | 
 | 
| R-квадрат | 0,941060819 | 
 | 
 | 
 | 
| Нормированный R-квадрат | 0,934512021 | 
 | 
 | 
 | 
| Стандартная ошибка | 6,777232983 | 
 | 
 | 
 | 
| Наблюдения | 11 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| Дисперсионный анализ | 
 | 
 | 
 | |
| 
 | df | SS | MS | F | 
| Регрессия | 1 | 6600,258 | 6600,258 | 143,6998 | 
| Остаток | 9 | 413,378 | 45,93089 | 
 | 
| Итого | 10 | 7013,636 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| 
 | Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | 
| Y-пересечение | -0,525438344 | 3,681329 | -0,14273 | 0,889647 | 
| x | 3,230238574 | 0,269468 | 11,98748 | 7,77E-07 | 
Уравнение регрессии
 .
.
Чтобы рассчитать
параметр  ,составим
вспомогательную таблицу. Рангом
величин, выстроенных в упорядоченный
ряд, называется их порядковый номер по
возрастанию. Переменная x
в условиях уже упорядочена. Ранги
остатков предстоит найти либо вручную,
либо с помощью функции Ранг.
,составим
вспомогательную таблицу. Рангом
величин, выстроенных в упорядоченный
ряд, называется их порядковый номер по
возрастанию. Переменная x
в условиях уже упорядочена. Ранги
остатков предстоит найти либо вручную,
либо с помощью функции Ранг.
| 
 | x | y | 
 | Остатки
						 | 
 | Ранг x | Ранг
						 | d | d2 | 
| 
 | 3 | 12 | 9,165277 | 2,834723 | 2,834723 | 1 | 2 | 1 | 1 | 
| 
 | 4 | 13 | 12,39552 | 0,604484 | 0,604484 | 2 | 1 | 1 | 1 | 
| 
 | 5 | 20 | 15,62576 | 4,374245 | 4,374245 | 3 | 5 | 2 | 4 | 
| 
 | 7 | 19 | 22,08623 | -3,086233 | 3,086233 | 4 | 3 | 1 | 1 | 
| 
 | 8 | 31 | 25,31647 | 5,683528 | 5,683528 | 5 | 6 | 1 | 1 | 
| 
 | 10 | 24 | 31,77695 | -7,77695 | 7,77695 | 6 | 9 | 3 | 9 | 
| 
 | 11 | 41 | 35,00719 | 5,992811 | 5,992811 | 7 | 7 | 0 | 0 | 
| 
 | 12 | 28 | 38,23743 | -10,237428 | 10,237428 | 8 | 11 | 3 | 9 | 
| 
 | 15 | 52 | 47,92815 | 4,071855 | 4,071855 | 9 | 4 | 5 | 25 | 
| 
 | 20 | 55 | 64,07934 | -9,07934 | 9,07934 | 10 | 10 | 0 | 0 | 
| 
 | 30 | 103 | 96,38173 | 6,61827 | 6,61827 | 11 | 8 | 3 | 9 | 
| Среднее | 
 | 
 | 
 | -3,18182E-06 | 
 | 
 | 
 | 
 | 
 | 
| Сумма | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 60 | 
Тогда коэффициент
ранговой корреляции Спирмена равен
 .
Для оценки его статистической значимости
найдем расчетное значение критерия
Стъюдента
.
Для оценки его статистической значимости
найдем расчетное значение критерия
Стъюдента .
По функцииСТЬЮДРАСПОБР
(вероятность
0,05, степеней
свободы
.
По функцииСТЬЮДРАСПОБР
(вероятность
0,05, степеней
свободы 
 )
находим соответствующее критическое
значение Стьюдента
)
находим соответствующее критическое
значение Стьюдента .
Делаем вывод о наличии гетерокедастичности
в остатках регрессии.
.
Делаем вывод о наличии гетерокедастичности
в остатках регрессии.
2) Применим тест Гольдфельда-Квандта для подтверждения гетерокедастичности остатков.
В расчетной таблице разделим исходные данные на две примерно равные группы (верхнюю и нижнюю).
| x | y | 
 | Остатки
						 | 
| 3 | 12 | 9,165277 | 2,834723 | 
| 4 | 13 | 12,39552 | 0,604484 | 
| 5 | 20 | 15,62576 | 4,374245 | 
| 7 | 19 | 22,08623 | -3,086233 | 
| 8 | 31 | 25,31647 | 5,683528 | 
| 10 | 24 | 31,77695 | -7,77695 | 
| 11 | 41 | 35,00719 | 5,992811 | 
| 12 | 28 | 38,23743 | -10,237428 | 
| 15 | 52 | 47,92815 | 4,071855 | 
| 20 | 55 | 64,07934 | -9,07934 | 
| 30 | 103 | 96,38173 | 6,61827 | 
Построим линейную регрессию по каждой группе.
Для верхней группы
| ВЫВОД ИТОГОВ | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| Регрессионная статистика | 
 | 
 | 
 | |
| Множественный R | 0,890348 | 
 | 
 | 
 | 
| R-квадрат | 0,79272 | 
 | 
 | 
 | 
| Нормированный R-квадрат | 0,723627 | 
 | 
 | 
 | 
| Стандартная ошибка | 3,986411 | 
 | 
 | 
 | 
| Наблюдения | 5 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| Дисперсионный анализ | 
 | 
 | 
 | |
| 
 | df | SS | MS | F | 
| Регрессия | 1 | 182,3256 | 182,3256 | 11,47317 | 
| Остаток | 3 | 47,67442 | 15,89147 | 
 | 
| Итого | 4 | 230 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| 
 | Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | 
| Y-пересечение | 1,418605 | 5,488159 | 0,258485 | 0,812752 | 
| Переменная X 1 | 3,255814 | 0,961209 | 3,387207 | 0,042863 | 
 Из всего объема
данных нам необходима только остаточная
дисперсия 
 ,
которая в протоколе регрессии обозначена
как остатокSS.
,
которая в протоколе регрессии обозначена
как остатокSS.
 .
.
Для нижней группы
| ВЫВОД ИТОГОВ | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| Регрессионная статистика | 
 | 
 | 
 | 
 | |
| Множественный R | 0,964861689 | 
 | 
 | 
 | 
 | 
| R-квадрат | 0,930958079 | 
 | 
 | 
 | 
 | 
| Нормированный R-квадрат | 0,913697599 | 
 | 
 | 
 | 
 | 
| Стандартная ошибка | 8,389255527 | 
 | 
 | 
 | 
 | 
| Наблюдения | 6 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| Дисперсионный анализ | 
 | 
 | 
 | 
 | |
| 
 | df | SS | MS | F | Значимость F | 
| Регрессия | 1 | 3795,982 | 3795,982 | 53,93582 | 0,00183 | 
| Остаток | 4 | 281,5184 | 70,37961 | 
 | 
 | 
| Итого | 5 | 4077,5 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | 
| Y-пересечение | -8,661290323 | 8,753454 | -0,98947 | 0,378445 | -32,9648 | 
| Переменная X 1 | 3,622119816 | 0,493201 | 7,344101 | 0,00183 | 2,252774 | 
 .
.
Расчетное значение
теста получается как отношение большей
остаточной дисперсии к меньшей. 
 .
Критической значение теста получаем
по функции
FРАСПОБР, в
которой число степеней свободы равно
.
Критической значение теста получаем
по функции
FРАСПОБР, в
которой число степеней свободы равно
 ,
в данном случае оно равно 6,59. Поскольку
расчетное значение больше критического,
остатки признаются гетерокедастичными.
,
в данном случае оно равно 6,59. Поскольку
расчетное значение больше критического,
остатки признаются гетерокедастичными.
3) Применим тест Уайта, чтобы количественно оценить зависимость дисперсии остатков от значений фактора x.
В эконометрических исследованиях достаточно часто выдвигается гипотезы о том, что
- остатки пропорциональны значениям фактора x:  ; ;
- дисперсия остатков прямопропорциональна самим значениям x, т.е.  ; ;
- зависимость между дисперсией остатков и значениями фактора x квадратичная  . .
Параметры этих регрессии можно найти МНК. Составим расчетную таблицу.
| x | y | 
 | Остатки
						 | 
 | 
| 3 | 12 | 9,165277 | 2,834723 | 8,035654487 | 
| 4 | 13 | 12,39552 | 0,604484 | 0,365400906 | 
| 5 | 20 | 15,62576 | 4,374245 | 19,13401932 | 
| 7 | 19 | 22,08623 | -3,086233 | 9,52483413 | 
| 8 | 31 | 25,31647 | 5,683528 | 32,30249053 | 
| 10 | 24 | 31,77695 | -7,77695 | 60,4809513 | 
| 11 | 41 | 35,00719 | 5,992811 | 35,91378368 | 
| 12 | 28 | 38,23743 | -10,237428 | 104,8049321 | 
| 15 | 52 | 47,92815 | 4,071855 | 16,58000314 | 
| 20 | 55 | 64,07934 | -9,07934 | 82,43441484 | 
| 30 | 103 | 96,38173 | 6,61827 | 43,80149779 | 
Для регрессии 
 пользуемсяСервис/Анализ
данных/Регрессия/…Поставить флажок
«Константа-нуль».
пользуемсяСервис/Анализ
данных/Регрессия/…Поставить флажок
«Константа-нуль».
Получаем протокол
| ВЫВОД ИТОГОВ | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| Регрессионная статистика | 
 | 
 | 
 | 
 | |
| Множественный R | 0,304158793 | 
 | 
 | 
 | 
 | 
| R-квадрат | 0,092512571 | 
 | 
 | 
 | 
 | 
| Нормированный R-квадрат | -0,01859854 | 
 | 
 | 
 | 
 | 
| Стандартная ошибка | 6,104515756 | 
 | 
 | 
 | 
 | 
| Наблюдения | 10 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| Дисперсионный анализ | 
 | 
 | 
 | 
 | |
| 
 | df | SS | MS | F | Значимость F | 
| Регрессия | 1 | 34,19047 | 34,19047084 | 0,917493 | 0,366182 | 
| Остаток | 9 | 335,386 | 37,26511262 | 
 | 
 | 
| Итого | 10 | 369,5765 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | 
 | 
| Y-пересечение | 0 | #Н/Д | #Н/Д | #Н/Д | 
 | 
| Переменная X | -0,172201879 | 0,179778 | -0,957858421 | 0,363156 | 
 | 
Результат неудовлетворительный, коэффициент детерминации всего 0,09.
Аналогично строим
регрессию 
 ,
взяв в качестве входного интервалаY 
столбец
,
взяв в качестве входного интервалаY 
столбец 
 .
Получаем протокол
.
Получаем протокол
| ВЫВОД ИТОГОВ | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| Регрессионная статистика | 
 | 
 | 
 | 
 | |
| Множественный R | 0,864535947 | 
 | 
 | 
 | 
 | 
| R-квадрат | 0,747422404 | 
 | 
 | 
 | 
 | 
| Нормированный R-квадрат | 0,636311293 | 
 | 
 | 
 | 
 | 
| Стандартная ошибка | 26,25750385 | 
 | 
 | 
 | 
 | 
| Наблюдения | 10 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| Дисперсионный анализ | 
 | 
 | 
 | 
 | |
| 
 | df | SS | MS | F | Значимость F | 
| Регрессия | 1 | 18362,0291 | 18362,0291 | 26,632614 | 0,000862939 | 
| Остаток | 9 | 6205,108576 | 689,4565085 | 
 | 
 | 
| Итого | 10 | 24567,13768 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | 
 | 
| Y-пересечение | 0 | #Н/Д | #Н/Д | #Н/Д | 
 | 
| Переменная X 1 | 3,990668767 | 0,773283573 | 5,160679613 | 0,0005945 | 
 | 
В данном уравнении достаточная степень детерминации – 0,74, кроме того значимость по критерию Фишера не превосходит допустимые 5% ошибки в расчетах. Принимаем гипотезу о том, что дисперсия остатков прямопропорциональна самим значениям x.
Для проверки
гипотезы о квадратичной зависимости 
 решают методом определителей систему
уравнений (см. ЛРНелинейная
регрессия):
решают методом определителей систему
уравнений (см. ЛРНелинейная
регрессия):

Определяют индекс
корреляции 
 .
О наличии или отсутствии гетерокедастичности
судят по величинеF-критерия
Фишера для функции
.
О наличии или отсутствии гетерокедастичности
судят по величинеF-критерия
Фишера для функции 
 ,
, .
При выполнении условия
.
При выполнении условия имеет место гетерокедастичность остатков
и количественно она выражена значением
имеет место гетерокедастичность остатков
и количественно она выражена значением .
По данному расчету предположение о
квадратичной зависимости дисперсии
остатков от значенийx
не проверяем (поскольку принята гипотеза
.
По данному расчету предположение о
квадратичной зависимости дисперсии
остатков от значенийx
не проверяем (поскольку принята гипотеза
 ).
).
 5) Улучшим модель,
смягчив гетерокедастичность, пользуясь
обобщенным методом наименьших квадратов.
Если  
 ,
тогда сами остатки пропорциональны
,
тогда сами остатки пропорциональны .
.
Чтобы избавиться
от этого, разделим уравнение линейной
регрессии 
 на
на .
Получим преобразованное уравнение
регрессии, в котором можно сделать
замену переменной:
.
Получим преобразованное уравнение
регрессии, в котором можно сделать
замену переменной:
 .
Пусть
.
Пусть 

 ,
, ,
, .Тогда
.Тогда 

 .
.
Построим вспомогательную таблицу
| x | y | X | z | Y | 
| 3 | 12 | 1,732051 | 0,577350269 | 6,92820323 | 
| 4 | 13 | 2 | 0,5 | 6,5 | 
| 5 | 20 | 2,236068 | 0,447213595 | 8,94427191 | 
| 7 | 19 | 2,645751 | 0,377964473 | 7,181324987 | 
| 8 | 31 | 2,828427 | 0,353553391 | 10,96015511 | 
| 10 | 24 | 3,162278 | 0,316227766 | 7,589466384 | 
| 11 | 41 | 3,316625 | 0,301511345 | 12,36196513 | 
| 12 | 28 | 3,464102 | 0,288675135 | 8,082903769 | 
| 15 | 52 | 3,872983 | 0,25819889 | 13,42634227 | 
| 20 | 55 | 4,472136 | 0,223606798 | 12,29837388 | 
| 30 | 103 | 5,477226 | 0,182574186 | 18,80514114 | 
Протокол регрессионного анализа имеет вид:
| ВЫВОД ИТОГОВ | 
 | 
 | 
 | |
| 
 | 
 | 
 | 
 | 
 | 
| Регрессионная статистика | 
 | 
 | 
 | |
| Множественный R | 0,986894 | 
 | 
 | 
 | 
| R-квадрат | 0,9739597 | 
 | 
 | 
 | 
| Нормированный R-квадрат | 0,8599553 | 
 | 
 | 
 | 
| Стандартная ошибка | 1,9415488 | 
 | 
 | 
 | 
| Наблюдения | 11 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| Дисперсионный анализ | 
 | 
 | ||
| 
 | df | SS | MS | F | 
| Регрессия | 2 | 1268,921 | 634,4607182 | 168,3092927 | 
| Остаток | 9 | 33,92651 | 3,769611932 | 
 | 
| Итого | 11 | 1302,848 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
| 
 | Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | 
| Y-пересечение | 0 | #Н/Д | #Н/Д | #Н/Д | 
| X | 3,02343 | 0,296117 | 10,21024561 | 3,00843E-06 | 
| z | 1,8246585 | 2,72558 | 0,669456856 | 0,520006975 | 
Получаем уравнение
регрессии  .Или
.Или 
 .
.
Показатели статистической значимости уравнения регрессии улучшены. Увеличился коэффициент детерминации с 94% до 97%. Существенно уменьшилась остаточная дисперсия с 413 ед. до 33 ед.
Задание для самостоятельной работы
По своим данным лабораторной работы №1 выполнить анализ гетерокедастичности остатков. А именно:
1. Проверить гипотезу о наличии гетерокедастичности в линейной регрессии с помощью теста ранговой корреляции Спирмена при доверительной вероятности 0,95.
2. Проверить гипотезу о гетерокедастичности с помощью теста Гольфельда-Квандта.
3. Оцените количественно гетерокедастичность остатков, если она присутствует.
4. При наличии гетерокедастичности, применить обобщенный МНК для ее сглаживания.









