Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка Построение линейной регрессионной модели .pdf
Скачиваний:
58
Добавлен:
20.05.2014
Размер:
2.86 Mб
Скачать

ДОМАШНЯЯ РАБОТА «УСОВЕРШЕНСТВОВАНИЕ ЛИНЕЙНОЙ РЕГРЕССИОННОЙ МОДЕЛИ. ОРГАНИЗАЦИЯ ПРОГНОЗИРОВАНИЯ»

В рамках этой домашней работы студенты должны продемонстрировать навыки владения приемами усовершенствования линейных регрессионных моделей и организации прогнозирования – обнаружения «выбросов», использования фиктивных переменных, проверки однородности выборки, построения доверительных интервалов для прогнозирования.

Использование фиктивных переменных Теоретические основы

Фиктивными (dummy) переменными называют синтетические переменные принимающие значения 0 или 1. Как правило, их создают для выделения в общей выборке подвыборок, соответствующих двум качественно различным условиям. Обычно с помощью фиктивной переменной кодируют значения некоторой номинальной переменной, которая имеет два уровня, например, «пол», для введения ее в регрессионную модель. Если номинальная переменная имеет “n” – уровней, то при наличии в модели константы следует ввести “n-1” фиктивную переменную, каждая из которых равна «1» только для одного из уровней. Если ввести “n” подобных переменных, то они будут линейно зависимы с константой. Значение коэффициента регрессии для каждой из них определяет модификацию константы модели для каждого из уровней. Сама константа ассоциируется с уровнем, для которого не была введена фиктивная переменная. Для определения влияния качественно различных ситуаций на значения параметров линейной регрессии интервальных (относительных) регрессоров следует ввести переменные взаимодействия фиктивной переменной с ними и проанализировать значимость оценок соответствующих параметров регрессии ( a ). Если фиктивных переменных несколько следует проделать эту операцию с каждой. При наличии нескольких фиктивных переменных можно также рассматривать взаимодействия между ними, как новые фиктивные переменные. В этом случае они будут отображать различные сочетания уровней номинальных переменных. Например, при учете пола и образования (есть/нет) возникают четыре очевидные ситуации ({муж., есть}; и т.д.). Не следует увлекаться большим количеством фиктивных переменных, т.к. их использование существенно увеличивает размерность регрессии. Они должны отображать наиболее существенные для целей построения модели признаки.

Критерий Чоу

Одним из основных вопросов, возникающих при использовании фиктивной переменной, является вопрос об однородности выборки относительно построенной модели при учете наличия двух качественно различных ситуаций. Фактически нас интересует, влияет ли учтенное условие на модель, т.е. будут ли неизменными коэффициенты модели для двух качественно разных ситуаций, зафиксированных в фиктивной переменной. С учетом изложенной выше техники следует проверить гипотезу о равенстве нулю всех коэффициентов линейной регрессии при переменных взаимодействия.