
Оценка модели на мультиколлинеарность
При проведении
расчетов необходимо сформировать
матрицу факторов
.
.
Матрица парных коэффициентов корреляции факторов для полученной модели и ее детерминант:
.
.
Можно принять мультиколлинеарность модели допустимой и не проводить корректировку.
Для удобства
дальнейших расчетов и анализа необходимо
сформируем новую матрицу исходных
данных
.
Напомним, что вектор натурных значений
целевой функции мы обычно обозначаем
.
В рассматриваемом варианте
.
В дальнейшем анализе потребуются и
расчетные значений целевой функции
.
Этот вектор также включаем в состав
матрицы
.
Средствами MathCad новая матрица исходных
данных формируется традиционно:
.
Оценка модели на гетероскедастичность
Для оценки гетероскедастичности можно использовать, например, модельное уравнение Уайта. В рассматриваемом случае эта модель не работает и для оценки наличия или отсутствия гетероскедастичности воспользуемся тестом Гольдфельда-Квандта.
Проверка проводится по каждому из факторов модели. Для этого каждый раз необходимо использовать дубликаты новой матрицы исходных данных . Дублируемые матрицы предварительно упорядочивают по возрастанию значений исследуемого фактора с перегруппировкой остальных столбцов (в соответствие с упорядоченным по возрастанию столбцом исследуемого фактора).
Для рассматриваемого
варианта 1 покажем это на примере фактора
1 (основные фонды в экономике), индекс
столбца которого в новой матрице исходных
данных
соответствует 1 (в исходной матрице
этот индекс соответствовал 4). Для
получения матрицы, упорядоченной по
возрастанию значений первого фактора,
воспользуемся встроенной функцией
MathCad,
.
При исследовании фактора 1 требуемая
упорядоченная матрица
формируется так:
Для того чтобы в процессе тренировки студенты могли убедиться в правильности полученных ими количественных результатов при практической отработке тренировочного варианта 1, ниже представлены обе матрицы: и , и .
В соответствии с
алгоритмом теста Гольдфельда-Квандта
формируется две выборки одинакового
размера. Исходными данными является
матрица
с исключением последнего столбца
расчетных значений
,
которые нам не требуются. Из полученной
таким образом матрицы формируем две
укороченные матрицы (верхнюю и нижнюю)
размером
.
Верхняя выборка – это первые восемь
строк исходной матрицы. Нижняя выборка
– это последние восемь строк исходной
матрицы.
Для каждой из
выборок определяют функции регрессии,
а затем остаточные дисперсии, соответственно
и
.
Напомним, что вывод о наличии или
отсутствии гетероскедастичности
делается на основе оценки
-
статистики. Эта функция определяется
как отношение остаточной дисперсии
нижней выборки к остаточной дисперсии
верхней выборки,
.
Полученное значение
-
статистики сравнивается с теоретическим
критерием Фишера.
В рассматриваемом
примере
.
Теоретический критерий Фишера при
принятом уровне значимости
и двух одинаковых степенях свободы
равен
.
Поскольку теоретический критерий меньше
расчетного, то нулевая статистическая
гипотеза отклоняется и делается вывод
о наличии гетероскедастичности по
фактору
.
Напомним, что фактор
- это «основные фонды в экономике».
Проверка по
оставшимся двум факторам показывает,
что фактору
гетероскедастичности нет, т.к.
,
а по фактору
имеет место незначительна
гетероскедастичность,
.
Для «смягчения» гетероскедастичности модели рекомендуется использовать обобщенный МНК. Для этого, каким либо из способов необходимо определить ковариационную матрицу. Одним из относительно универсальных способов является искусственное повышение однородности дисперсии остатков. Это можно осуществить путем группировки вектора остаточной дисперсии. Студенты здесь должны воспользоваться навыками, которые они получили на практических занятиях.
Для глубины понимания надо подчеркнуть, что такой способ задания ковариационной матрицы позволяет весьма приближенно «смягчить» гетероскедастичность и требует дополнительной теоретической и практической корректировки. Вместе с тем в рамках курсовой работы для студентов будет достаточно продемонстрировать понимание проблемы на примере «смягчения» гетероскедастичности данным способом по одному из факторов модели.
В рассматриваемом
примере «смягчение» гетероскедастичности
проведено по фактору 1. Напомним, в
используемом способе речь идет о моделях
с диагональной гетероскедастичностью.
А именно, предполагается, что ошибки
модели в разных наблюдениях не коррелируют
друг с другом, а имеет место только
различие дисперсии ошибок в разных
наблюдениях. Вектор ошибок
представляется разностью расчетных и
опытных точек наблюдения.
.
Для того чтобы не занимать много места, представляем его в виде ветора-строки, размер которого 20 элементов.
Из вектора ошибок
формируем две группы (можно было и
больше). В первую группу включено 15
элементов, во вторую – оставшиеся 5.
Определяются значения внутригрупповых
дисперсий
для первой и второй выборок. Формируется
вектор диагональных элементов
для диагональной ковариационной матрицы
размером
.
.
Ковариационную матрицу формируем с использованием встроенной функции MathCad:
.
Оценка коэффициентов
для модели со «смягченной»
гетероскедастичностью проводится с
использованием матричного уравнения,
известного из лекционного курса:
;
где:
-
единичный вектор, размером
.
Приводим конкретный вид модели со «смягченной» гетероскедастичностью.
Ошибка аппроксимации
составляет
,
коэффициент детерминации
,
Оценка модели на автокорреляцию остатков
Для обнаружения
автокорреляции используют статистику
(тест) Дарбина-Уотсона, В лекциях эту
статистику мы обозначали
.
.
Параметр
–
это коэффициент автокорреляции первого
порядка, который определяется по
упрощенной формуле:
.
В рассматриваемом
примере
.
Для уровня значимости 0.05 табличные
пороговые значения
и
статистики Дарбина-Уотсона при числе
наблюдений
и числе факторов
равны:
,
.
Поскольку значение
попадает в диапазон
,
то принимается статистическая гипотеза
об отсутствии автокорреляции остатков.
Оценка прогнозирования по регрессионной модели
Оценку прогнозирования проведем для модели:
Необходимо выбирать
прогнозируемый вектор факторов
и провести точечный и интервальный
прогноз. В данном примере прогнозируемый
вектор
.
Ему соответствует прогнозируемое
точечное значение целевой функции 516.6
тыс. чел.
Рассчитанные
границы доверительных интервалов:
- для среднего значения целевой функции
и
-
для индивидуального значения целевой
функции. Соответственно можно сделать
следующие выводы:
- Для среднего значения целевой функции.
С доверительной вероятностью 88% для регионов России с основными фондами в экономике 80000 млн. руб., среднемесячной заработной платой 1400 руб. и удельным весом убыточных предприятий 35% средняя среднегодовая численность, занятых в экономике прогнозируется от 463.4 до 569.8 тыс. чел.
- Для индивидуального значения целевой функции.
С доверительной вероятностью 88% для регионов России с основными фондами в экономике 80000 млн. руб., среднемесячной заработной платой 1400 руб. и удельным весом убыточных предприятий 35% среднегодовая численность, занятых в экономике прогнозируется от 393.4 до 639.8 тыс. чел.
Оценка индивидуального влияния факторов на целевую функцию
Оценку проведем с использованием среднего коэффициента эластичности. Воспользуемся формулой, приведенной в лекционном курсе.
.
Вектор средних
коэффициентов эластичности для трех
факторов в рассматриваемом примере:
.
Можно сделать следующие выводы.
С доверительной вероятностью 88% для регионов России при увеличении основных фондов в экономике в среднем на 1% средняя среднегодовая численность, занятых в экономике увеличится в среднем на 0.84%.
С доверительной вероятностью 88% для регионов России при увеличении среднемесячной зарплаты в среднем на 1% средняя среднегодовая численность, занятых в экономике уменьшится в среднем на 0.5%.
С доверительной вероятностью 88% для регионов России при увеличении удельного веса убыточных предприятий в среднем на 1% средняя среднегодовая численность, занятых в экономике уменьшится в среднем на 0.4%.