- •Эконометрика Практическое занятие 7. Дисперсионный анализ. Модели с фиктивными переменными
- •Информация по вариантам
- •Выполнение в Excel
- •1. Однофакторный дисперсионный анализ (anova).
- •2. Регрессия с фиктивными переменными
- •Выполнение в Gretl
- •3. Однофакторный дисперсионный анализ (anova)
- •4. Регрессия с фиктивными переменными
2. Регрессия с фиктивными переменными
2.1. Необходимо добавить 2 фиктивные переменные (Education принимает 3 значения, поэтому достаточно ввести 3-1=2 фиктивные переменные). Введем, например, такие переменные:
и
Для этого используем логическую функцию =ЕСЛИ():
=ЕСЛИ(C2=1; 1; 0) – для d_maloe
=ЕСЛИ(C2=2; 1; 0) – для d_srednee
Соответствие между Size и введенными переменными:
Size |
d_maloe |
d_srednee |
1 - малое |
1 |
0 |
2 - среднее |
0 |
1 |
3 - крупное |
0 |
0 |
2.2. Данные – Анализ данных – Регрессия.
Проверка значимости регрессии в целом проводится с помощью F-теста. Проверка значимости отдельных коэффициентов проводится с помощью t-тестов.
Построенная модель имеет вид:
Регрессия в целом значима (обратите внимание на то, что значение Fнабл = 72,441совпадает с Fнабл, найденным при проведении дисперсионного анализа). Коэффициенты модели значимы.
Интерпретация коэффициентов:
Средняя рентабельность продаж у больших предприятий: 20 %. Если предприятие малое, то это дает прибавку 10,27%. Если предприятие среднее – 9,07%
Как нам известно из п.1.3, средние рентабельности малых и средних предприятий можно считать равными. Объединим фиктивные переменные, сложив их:
d_nebolshie = d_maloe + d_srednee
Теперь оценим параметры новой модели:
Построенная модель имеет вид:
Регрессия в целом значима. Коэффициенты модели значимы.
Интерпретация коэффициентов:
Средняя рентабельность больших предприятий: 20%. Если предприятие небольшое, то рентабельность имеет прибавку 9,5%.
2.3. На рентабельность продаж может оказывать влияние не только размер предприятия, но и расходы на обучение каждого сотрудника.
При этом адекватно описать зависимость одним уравнением без фиктивных переменных невозможно.
Включим в модель количественный признак Expenses и фиктивную переменную d_nebolshoe. Получим итоговую модель регрессии с фиктивными переменными:
Построенная модель имеет вид:
Регрессия в целом значима. Коэффициенты модели значимы. R2-adjusted новой модели (0,69) выше, чем у старой модели (0,58).
Интерпретация коэффициентов:
Средняя рентабельность большого предприятия без расходов на обучение каждого сотрудника 15,3%. При ежегодных тратах на обучение каждого сотрудника появляется надбавка к рентабельности 0,2%. Рентабельность небольших предприятий имеет надбавку 9,56% независимо от ежегодного обучения сотрудников.
Выполнение в Gretl
Напоминание: используется исходный файл безо всяких расчетов. Желательно предварительно удалить лишние листы, оставив только свой вариант.
3. Однофакторный дисперсионный анализ (anova)
Для наглядности построим график зависимости заработной платы от уровня образования. Для этого: Вид – График – Factorized boxplot – Выбираем переменную (Wage) и фактор (Education):
(Коробчатая диаграмма / «ящик с усами»: нижняя граница коробки – 1-й квартиль, верхняя граница – 3-й квартиль; средняя черта – медиана; верхний ус и нижний ус – max и min).
Видим, что малые и средние предприятия имеют выше рентабельность, чем крупные и находятся примерно на одном уровне.
3.1. Для проведения дисперсионного анализа: Модель – Другие линейные модели – ANOVA – Задаем переменную отклика (исследуемый количественный признак Wage) и переменную воздействия (качественный признак Education):
Проводим дисперсионный анализ:
Нулевая гипотеза H0 отвергается, качественный фактор ROS оказывает влияние на Size.
3.2. Проверим гипотезу о равенстве математических ожиданий рентабельности малых и средних предприятий. Для этого: Инструменты – Проверка гипотез – Равенство средних – Записываем данные.
Проводим тест:
1,02469
Нулевая гипотеза H0 не отвергается. Средние значения рентабельности у малых и средних предприятий можно считать равными
Проверим гипотезу о равенстве дисперсий рентабельности малых и средних предприятий. Для этого: Инструменты – Проверка гипотез – Равенство дисперсий – Записываем данные.
1) α=0,05.
2) H0: D(ROS(1))=D(ROS (2)), H1: D(ROS(1))≠D(ROS(2))..
3) Fнабл= 1,38295.
4) p-value > α (0,1947> 0,05).
Нулевая гипотеза H0 не отвергается. Дисперсии рентабельности средних и малых предприятий можно счтать одинаковыми.
