- •Курсовая работа по эконометрике для специализации «Бизнес- информатика»
- •Курсовая работа по эконометрике для специализации «Прикладная информатика»
- •Глава 1. Обзор научной литературы по теме.
- •Глава 2.
- •2.2. Изучение исходных данных
- •Глава 3. Методология исследования
- •3.5. Анализ относительной важности независимых переменных.
Глава 1. Обзор научной литературы по теме.
Глава 2.
2.1. Сбор материала, его описание, структурирование и анализ (возможно, окажется необходимым проведение полевых исследований, опросов, экспериментов). Именно теперь у Вас появляется возможность поработать с «живым» материалом, будь то политические или экономические тексты, современная публицистика, фильмы, материалы глянцевой или желтой прессы, рекламная продукция.
Описание исходных данных: количество наблюдений (N), количество переменных (k).
ТАБЛИЦА 1. Описание исходных данных
Код переменной |
Описание переменной |
Тип переменной |
Единицы измерения |
Комментарий |
OL |
Возраст |
Количественная |
лет |
|
UN |
Статус безработного |
Качественная |
лет |
4 уровня градации: 0 — < 1 года 1 — < 4 лет 2 — < 7 лет 3 — 7 лет |
… |
|
|
|
|
2.2. Изучение исходных данных
Найдите значения описательных статистик по каждой переменной и объясните их. Нормально ли распределены данные?
Диагностические диаграммы: диаграммы рассеяния, ящик к с усами, плотность распределения.
Исследуйте парные взаимосвязи между переменными: 1) с помощью корреляционной матрицы и 2) матрицы диаграмм рассеяния; 3) показателя VIF. Сделайте предположение о наличии/отсутствии проблемы мультиколлинеарности между переменными.
Глава 3. Методология исследования
3.1. Построение и инференция о модели регрессии
Оцените модель линейной регрессии. Сделайте выводы о качестве построенной модели. Объясните полученное значение коэффициента детерминации R2. Оцените статистическую значимость коэффициентов регрессии. Оцените статистическую значимость регрессии в целом.
3.2. Проверка данных на наличие необычных наблюдений
Выбросов (по значениям остатков, с помощью диаграммы Q-Q-plot, с помощью статистического теста на выбросы)
Влиятельных наблюдений (с помощью расстояния Кука и диаграммы добавленных переменных)
Точек высокой напряженности
Сведите информацию о выбросах, точках с высокой напряженностью и влиятельных наблюдений на одну диаграмму.
3.3. Дагностика регрессионных моделей на выполнение стандартных условий на остатки (условий Гаусса-Маркова):
Гомоскедастичности (тест Уайта, Гольдфельдта-Квандта)
Автокорреляции (тест Дарбина-Уотсона и Бройша-Годфри LM test)
Нормальности распределения остатков (с помощью диаграммы Q-Q-plot и с помощью ядерной оценки плотности вероятности)
3.4. Выбор «лучшей» регрессионной модели
Проверьте нелинейную связь между зависимой и независимыми переменными с помощью диаграммы частных остатков. Проведите тест на правильность функциональной формы (RESET тест Рамсея, J-тест Дэвидсона и МакКиннона, PE-тест МакКинона, Метод Зарембки, Тест Кокса-Бокса).
Оцените альтернативную спецификацию модели, перейдя, если требуется, к оценке нелинейной модели (логарифмической) или включив эффекты «второго порядка».
Сравните модели (если модели вложенные, то на основе ANOVA, а если нет — на основе информационного критерия Шварца или Акаике).
Сформируйте окончательный набор независимых переменных на основе 1) пошагового метода и 2) регрессии по всем подмножествам (используйте в качестве критерия «лучшей» модели визуализацию скорректированного коэффициента детерминации и статистики Мэллоуса).
Проведите тест на устойчивость параметров модели (тест Чоу).
