
- •Эконометрика
- •Тема 1: Модели панельных данных
- •1. Введение в теорию панельных данных;
- •1.1 Панельные данные по сравнению с независимыми наблюдениями за однотипными объектами.
- •1.2 Взятие разности
- •1.3 Обобщение более чем на 2 периода
- •Тема 2: Характеристики панельных данных, основные обозначения и терминология
- •1.1 Реальные данные
- •2.2 Микровыборки и общие макроопросы
- •2.3 Описательный анализ
- •2.4 Основные обозначения и терминология
- •Тема 3: Обзор линейных моделей
- •3.1 Обычная регрессия
- •3.2 Несвязанные регрессии
- •3.4 Фиктивные переменные
- •3.5 Компоненты ошибки
- •3.6 Случайные коэффициенты
- •Тема 4: Фиксированные эффекты
- •4.2 Проверка на наличие фиксированных эффектов
- •4.3 Оценки с учётом корреляции для моделей наблюдения и взаимосвязь регрессии
- •4.4 Недостатки оценок регрессии с фиксированными эффектами
- •Тема 5: Случайные эффекты
- •5.1 Оценка модели
- •5.2 Взаимосвязь с другими оценками
- •5.3 Проверка на наличие случайных эффектов
- •Тема 6: Выявление характера эффектов: фиксированных или случайных, тесты на спецификацию моделей
- •Тема 7: Инструментальные переменные
- •Тема 8: Обобщение основных моделей
Эконометрика
(Преподаватель – Смурская Татьяна Владимировна)
Лекция 1
Тема 1: Модели панельных данных
Введение в теорию панельных данных;
Анализ двухпериодных панельных данных.
1. Введение в теорию панельных данных;
Множество данных, состоящих из наблюдений за однотипными статистическими объектами, в течение нескольких временных периодов называются панельными или пространственными временными данными.
В случае, когда периодов наблюдения больше числа наблюдаемых объектов, панельные данные называют объединено-временным рядом.
Однако обычно множество панельных данных состоит из наблюдений в течение небольшого числа периодов. В этой ситуации более важным является моделирование различий между наблюдаемыми объектами, а не анализ временных объектов.
Несмотря на то, что временные эффекты в явном виде не моделируются, панельные данные содержат информацию относительно развития однотипных объектов во времени.
n
T = 2 : t1 = 1; t2 = 2
Yit
p : Xit1, Xit2, Xitp.
i = 1….n
t = 1; 2
? № 1:
Наличие различий между рассматриваемыми двумя периодами.
1.1 Панельные данные по сравнению с независимыми наблюдениями за однотипными объектами.
Существенное различие между панельными данными и независимыми наблюдениями за однотипными объектами состоит в том, что в случае панельных данных у нас имеются наблюдения за одними и теми же объектами во все периоды времени. Следовательно, эти данные содержат больше информации, чем наблюдения за объектами в один момент времени. Однако необходимо отметить, предположение относительно функции распределения должны выделяться с большей тщательностью.
p = 1.
Yit = B0 + B1Xit +Uit (1)
i = 1,…, n
t = 1, 2
2n
Если бы были 2 независимых множества наблюдений за однотипными объектами, тогда бы мы могли анализировать данные двумя способами:
1) Если не предполагается никаких изменений во времени, кроме того ошибки Uit – независимые и одинаково распределённые, то для всех i и для обоих t, можно было бы оценить B0 и B1, используя все 2 наблюдения.
2) Если необходимо изучать изменения во времени, и мы предполагаем независимые одинаково распределённые ошибки Uit – для всех i период t = 1, также независимые одинаково распределённые ошибки, но уже с другим распределением для периода t = 2, => можем произвести 2 независимых оценивания и сравнить результаты, полученные по 2-м независимым выборкам.
3) Если у нас есть панельные данные (то есть выборка по n объектам периода времени), тогда мы уже не можем принимать те же предпосылки, что происходило в случае независимыми множественными наблюдениями.
Если мы предположим отсутствие изменений во времени, мы всё равно не сможем предполагать, что ошибки Ui1 и Ui2 независимы, так как они относятся к одному и тому же объекту наблюдения.
Если мы предполагаем наличие изменений во времени и разобьём данные в соответствии с двумя периодами, тогда мы можем предполагать, что ошибки у нас независимые и одинаково распределённые для каждого периода. Однако в этом случае мы не сможем трактовать полученные 2 множества оцениваемых параметра как независимые, так как они получены из одной и той же выборки.
Пример №1:
Проанализируем соотношения времени, которое студенты потратили на изучение университетских курсов, и полученные по этим курсам баллы.
Данные о времени потраченные за обучения были собраны за 2 периода (семестра). Максимальное количество баллов = 100. Xi – среднее время, в течение недели, которое студент I потратил на изучение курса в период t. Данные представлены в таблице 1.
Таблица 1
Ст. |
Семестр 1 |
Семестр 2 |
||
Время |
Баллы |
Время |
Баллы |
|
1 |
60 |
81 |
60 |
84 |
2 |
100 |
75 |
120 |
87 |
3 |
30 |
60 |
60 |
79 |
4 |
45 |
82 |
30 |
78 |
5 |
120 |
78 |
150 |
87 |
6 |
180 |
95 |
150 |
92 |
7 |
100 |
79 |
100 |
84 |
8 |
60 |
92 |
80 |
97 |
9 |
90 |
78 |
90 |
75 |
10 |
90 |
67 |
60 |
66 |
По этим данным можно построить 5 осмысленных регрессий:
1 - Отдельно по первому семестру;
2 - Отдельно по второму семестру;
3 - По объединению первого и второго семестра;
4 - По разности первого и второго семестра с константой;
5 - По разности первого и второго семестра без константы.
Выполнять через Анализ данных: Офис –> параметры Эксель –> надстройки (слева) –> анализ данных поставить.
Далее следуют расчёты в Excel.
Результаты оценки регрессии занесены в таблицу 2:
Таблица 2
Модель |
B0 |
B1 |
R2 |
Сем. 1 |
68,570 |
0,116 |
0,231 |
Сем. 2 |
72,605 |
0,114 |
0,271 |
Объединение 1 и 2 |
70,444 |
0,117 |
0,242 |
Раз. с коэф. |
3,512 |
0,275 |
0,685 |
Раз. без коэф. |
- |
0,294 |
0,588 |