
- •Эконометрика
- •Тема 1: Модели панельных данных
- •1. Введение в теорию панельных данных;
- •1.1 Панельные данные по сравнению с независимыми наблюдениями за однотипными объектами.
- •1.2 Взятие разности
- •1.3 Обобщение более чем на 2 периода
- •Тема 2: Характеристики панельных данных, основные обозначения и терминология
- •1.1 Реальные данные
- •2.2 Микровыборки и общие макроопросы
- •2.3 Описательный анализ
- •2.4 Основные обозначения и терминология
- •Тема 3: Обзор линейных моделей
- •3.1 Обычная регрессия
- •3.2 Несвязанные регрессии
- •3.4 Фиктивные переменные
- •3.5 Компоненты ошибки
- •3.6 Случайные коэффициенты
- •Тема 4: Фиксированные эффекты
- •4.2 Проверка на наличие фиксированных эффектов
- •4.3 Оценки с учётом корреляции для моделей наблюдения и взаимосвязь регрессии
- •4.4 Недостатки оценок регрессии с фиксированными эффектами
- •Тема 5: Случайные эффекты
- •5.1 Оценка модели
- •5.2 Взаимосвязь с другими оценками
- •5.3 Проверка на наличие случайных эффектов
- •Тема 6: Выявление характера эффектов: фиксированных или случайных, тесты на спецификацию моделей
- •Тема 7: Инструментальные переменные
- •Тема 8: Обобщение основных моделей
2.3 Описательный анализ
Первым шагом в анализе любых реальных данных является описательный анализ данных. Наиболее очевидной целью этого анализа является проверка данных на несоответствие, пропущенные значения, ошибки форматирования и так далее. Примеры некоторых возможных источников ошибки:
1) Предположения, что данные представлены в первоначальном виде, в то время, как они прологорифмированы;
2) Пропущенные данные – закодированные отрицательные числа;
3) Порядок численных значений переменных различается множеством данных.
На первом этапе анализа проводится ознакомление с данными, т.е. необходимо найти амплитуду разброса данных, изучить данные на наличие возможных выбросов либо кластеров, выполнить проверку на коллинеарность и т.д. Кроме того, необходимо графически представить панельные данные, и здесь важное значение имеет построение в одной координатной плоскости графиков временных рядов, из которых состоят панельные данные.
2.4 Основные обозначения и терминология
Рассматривается матрица Z (в тетради на третьей странице).
Здесь быстрый индекс – время, медленный – объекты наблюдения.
Тема 3: Обзор линейных моделей
Множество панельных данных Z может быть использовано для выбора между различными линейными моделями. В качестве исходной точки рассмотрим линейную модель:
Yit = Mit + X’ttBit + Uit = Mit + ∑ Xj,itBj,it + Uit (12)
Yit и Xit – наблюдаемые величины.
M и B – параметры, которые необходимо оценить.
Uit - ненаблюдаемые остатки.
Часто подобная модель записывается таким образом:
* на странице 4.
Как мы и предполагали, панельные данные представляют случайную выборку с большой генеральной совокупностью. Тогда предпочтительнее сформулировать модель условных математических ожиданий.
E[Yit/Xit] = Mit + X’itBit (13)
Uit = Yit – Mit – X’itBit
Уравнение (13) является расширением уравнения (12). Отличие заключается в том, что регрессоры Xit предполагаются стохастические.
Теперь, если Xit – это вектор случайных величин, соответственно мы можем задать и проиллюстрировать важный вопрос о корреляции Uit с регрессом.
Все линейные модели имеют 2 вида параметра: константа и параметр наклона. В случае панельных данных константу называют параметром местоположения, а наклон называют параметром влияния. Они относятся к интерпретации соответствующих параметров. Параметр Bj,it – описывает частное линейное влияние переменной Xj,it на Yj,it при условии неизменности основных переменных.
Параметры Mit являются аддитивными константами, которые суммируют эффекты, характерные для конкретного объекта наблюдения i периода времени t. Т.о. они определяют среднее местоположение Yit, если все регрессоры зафиксированы на уровне Xit = 0.
В эконометрике панельных данных принято называть параметры местоположения – ненаблюдаемыми эффектами.
Для того, чтобы сделать модель оцениваемой и связывающей между собой различные наблюдения на параметры модели и на распределение случайных величин должны быть наложены дополнительные ограничения.
Ограничения на параметры – (P),
Ограничения на распределение – (D).
Zi = (Yi, Xi)
Yi = (Yi1, … , Yit)
Xi = (Xi1, … , Xit)