Крючкова паркика 12
.docxВ файле Эконометрика Практика 12-1.xls собраны данные о 100 предприятиях: зависимая переменная Y – выручка в 2023 году, тыс. руб., независимая переменная X – выручка в 2022 году, тыс. руб., качественный признак B – пол генерального директора (1 – женский, 0 – мужской).
Оценка максимального правдоподобия:
Как известно, эта оценка представляет собой относительную частоту ω, которую можно найти следующим образом: выделить переменную B – Переменная – Распределение частот…
Можно видеть, что относительная частота ω=1, результаты совпадают.
Теперь получим МП-оценки математического ожидания μ и с.к.о. σ, считая X реализациями независимых нормально распределенных с.в
Оценки максимального правдоподобия:
МП-оценка
представляет собой выборочное среднее,
поэтому результаты совпадают. МП-оценка
представляет собой смещенное выборочное
с.к.о., поэтому ее значение немного ниже
несмещенной оценки.
Наконец, получим МП-оценки коэффициентов регрессии Y=b0+b1X+ε, считая, что случайные ошибки удовлетворяют условиям теоремы Гаусса-Маркова.
Оценки максимального правдоподобия:
Как можно видеть, максимум логарифмической функции правдоподобия (-706,35) был найден верно. МП-оценки коэффициентов регрессии теоретически равны МНК-оценкам, однако при численном решении результаты получаются немного различными. МП-оценка с.к.о. случайных ошибок является смещенной и потому она ниже оценки RSS/(n-2), приведенной в отчете о регрессионном анализе.
В файле Эконометрика Практика 12-2.xls собраны данные о 200 клиентах банка: зависимая переменная Account – сумма на 1-летнем срочном вкладе, тыс. руб., независимая переменная Wage –средняя заработная плата клиента в 2023 году, тыс. руб./мес.
Как
можно видеть, модель парной линейной
регрессии неадекватна. В данном случае
следует использовать тобит-модель
цензурированной регрессии, при этом
нижней границей значений зависимой
переменной является 0, а верхняя граница
отсутствует.
Оценим параметры тобит-модели.
Оцененная тобит-модель имеет вид:
=
где ошибки εi ~ N(0, 132,6252).
Построим график наблюдаемых и расчетных значений.
Построенный график расчетных значений латентной переменной соответствует ненулевым значениям зависимой переменной.
Также при использовании ММП предполагалось, что случайные ошибки модели имеют нормальное распределение. Проверим это:
Нулевая гипотеза не отвергается, распределение ошибок можно считать нормальным.
График наблюдаемых и расчетных значений и результаты проверки нормальности ошибок свидетельствуют об адекватности тобит-модели в целом.
Проверим значимость коэффициентов модели.
Проверка значимости проводится по следующей схеме:
1) Выбирается уровень значимости α.
2) Нулевая гипотеза H0: bi=0,
Альтернативная гипотеза H1: bi≠0.
3) Рассчитывается наблюдаемое значение z-статистики. Если верна H0, то z~N(0, 1).
4) Для наблюдаемого значения определяется p-value. Если p-value<α, нулевая гипотеза отвергается, делается вывод о значимости коэффициента bi.
В нашем случае:
Фактор |
Коэффициент |
Вывод |
Const |
b0 |
Значим |
Wage |
b1 |
Значим |
Все коэффициенты модели значимы.
Теперь используем построенную модель для прогнозирования. Добавим наблюдения. После этого следует заново построим тобит-модель и используем ее для прогнозирования.
Получим прогноз для двух клиентов банка:
1)
Клиент с доходом 100 тыс. руб. в год.
Рассчитываем ожидаемое ненаблюдаемое
значение:
Тогда
ожидаемое наблюдаемое значение:
2)
Клиент с доходом 150 тыс. руб. в год.
Рассчитываем ожидаемое ненаблюдаемое
значение:
Тогда
ожидаемое наблюдаемое значение:
В файле Эконометрика Практика 12-3.xls собраны данные о 200 работниках. Переменные основной регрессии: зависимая переменная Expenses – автомобильные расходы в 2023 году, тыс. руб., независимая переменная Distance – расстояние от дома до места работы, км. Регрессия выбора: зависимая переменная Car – бинарная переменная (1 – есть личный автомобиль, 0 – нет), независимая переменная Wage – средняя заработная плата в 2023 году, тыс.руб./мес.
Как можно видеть, модель парной линейной регрессии неадекватна. В данном случае следует использовать хекит-модель цензурированной регрессии.
Оценим параметры хекит-модели.
Уравнения для латентных переменных имеют вид:
(основная регрессия)
(регрессия выбора)
Стандартная ошибка основной регрессии 7,3, стандартная ошибка регрессии выбора равна 1 (по умолчанию), случайные ошибки регрессий связаны, выборочный коэффициент корреляции 0,788.
При этом наблюдаемые переменные:
Построим график наблюдаемых и расчетных значений.
Построенный график расчетных значений латентной переменной соответствует ненулевым значениям зависимой переменной и свидетельствует об адекватности хекит-модели в целом.
Проверим значимость коэффициентов модели.
Проверка значимости проводится по следующей схеме:
1) Выбирается уровень значимости α.
2) Нулевая гипотеза H0: bi=0,
Альтернативная гипотеза H1: bi≠0.
3) Рассчитывается наблюдаемое значение z-статистики. Если верна H0, то z~N(0, 1).
4) Для наблюдаемого значения определяется p-value. Если p-value<α, нулевая гипотеза отвергается, делается вывод о значимости коэффициента bi.
В нашем случае:
Основная регрессия
Фактор |
Коэффициент |
Вывод |
Const |
b10 |
Значим |
Distance |
b11 |
Значим |
Регрессия выбора
Фактор |
Коэффициент |
Вывод |
Const |
b20 |
Значим |
Wage |
b21 |
Значим |
Все
коэффициенты обеих регрессий значимы.
При
этом коэффициент при
также является значимым, т.е. ошибки
основной регрессии и регрессии выбора
являются зависимыми, оба уравнения
следовало оценивать совместно.
Прогнозирование в EXCEL.
В нашем случае были получены следующие прогнозы:
1) Если 1-й работник проезжает 150 км до работы, имеет среднюю ЗП 50 тыс.руб/месяц, имеет личный автомобиль, то точечный прогноз его затрат 961,30107 тыс. руб.
2) Если 2-й работник проезжает 200 км до работы, имеет среднюю ЗП 100 тыс.руб/месяц, имеет личный автомобиль, то точечный прогноз его затрат 1227,7639 тыс. руб.
