- •Содержание
- •Введение
- •1. Парная корреляция и регрессия
- •1.1. Спецификация модели
- •1.2. Линейная корреляция и регрессия
- •1.3. Нелинейная регрессия
- •1.4. Проверка значимости линейного уравнения регрессии
- •1.5. Корреляция для нелинейной регрессии
- •1.6. Предпосылки метода наименьших квадратов
- •1.7. Обобщенный метод наименьших квадратов
- •2. Множественная корреляция и регрессия
- •2.1. Множественный корреляционный анализ
- •2.2. Спецификация модели
- •2.3. Частные уравнения регрессии
- •2.4. Выбор формы уравнения множественной регрессии
- •Оценка параметров уравнения множественной регрессии
- •2.6. Многошаговый регрессионный анализ
- •3.1.2. Способы выявления структурной неоднородности
- •3.2. Методы последовательного разбиения
- •3.3. Методы многомерной классификации
- •3.3.1. Мера сходства
- •3.3.2. Модели кластерного анализа
- •4.2. Числовые характеристики экономического развития
- •4.3. Состав динамического ряда
- •4.4. Моделирование одномерных динамических рядов
- •4.4.1. Типы экономического развития и их трендовые модели
- •4.4.2. Построение трендовых моделей
- •4.4.3. Сглаживание временных рядов
- •4.4.4. Моделирование тенденции временного ряда при наличии структурных изменений
- •4.4.5. Влияние автокорреляции на структуру временного ряда
- •4.5. Многомерные временные ряды
- •4.5.1. Сущность и особенности многомерных динамических рядов
- •4.5.2. Способы построения множественной регрессионной модели по временным рядам
- •5.1.2. Связь однородности статистической совокупности с типом моделей
- •5.2. Динамическое моделирование взаимосвязей в структурно-однородных совокупностях
- •5.2.1. Методы построения пространственно-динамических
- •Моделей
- •5.2.2. Выбор вида пространственно-динамической модели
- •5.2.3. Динамизация параметров связи
- •5.3.2. Построение динамических моделей на основе временных выборок
- •6. Системы эконометрических уравнений
- •6.1.Общие понятия и способы представления систем эконометрических уравнений
- •6.2. Структурная и приведенная формы модели
- •6.3. Проблемы идентификации структурной модели
- •6.4. Оценка параметров структурной модели
- •6.5. Двухшаговый метод наименьших квадратов
- •7. Динамические эконометрические модели
- •7.1. Общая характеристика моделей с распределенным лагом и моделей авторегрессии
- •7.2. Оценка параметров авторегрессионных моделей
- •7.3. Интерпретация параметров модели с распределенным лагом
- •7.4. Интерпретация параметров модели авторегрессии
- •7.5. Изучение структуры лага и выбор вида модели с распределенным лагом
- •7.6. Лаги Алмон
- •8. Статистическое прогнозирование динамических рядов
- •8.1. Сущность и виды статистических прогнозов
- •8.2. Методы статистического прогнозирования
- •8.2.1. Экстраполяция динамических рядов
- •8.2.2. Прогнозирование на основе экспоненциального сглаживания
- •8.2.3. Прогнозирование на основе регрессионных и авторегрессионных моделей
- •Список литературы
1.5. Корреляция для нелинейной регрессии
Степень нелинейной зависимости оценивается индексом корреляции R, величина которого может быть определена по следующей формуле
, (1.14)
где – общая дисперсия результативного показателя:
;
– остаточная дисперсия
.
Оценка полученных значений основана на следующих свойствах данного коэффициента.
1. .
2. Если , то корреляционной зависимости между Y и фактором, положенным в основу группировки X, нет.
Если , то все точки корреляционного поля располагаются на кривой.
4. Чем ближе значение к 1, тем корреляционная зависимость сильнее.
5. .
6. .
Если нелинейное относительно объясняемой переменной уравнение регрессии при линеаризации принимает форму линейной регрессии, то для оценки тесноты связи может быть использован линейный коэффициент корреляции, величина которого совпадает с индексом корреляции, т.е. , где z – преобразованная (линеаризованная) величина. Если линеаризация связана с преобразованием не только фактора X, но и результата Y, то .
Значимость индекса корреляции проверяется также как и оценка надежности коэффициента корреляции (п.1.2) . Для проверки значимости нелинейной регрессии используется индекс детерминации и критерий Фишера, расчетное значение которого может быть определено по следующей формуле:
, (1.15)
где – объем выборки;
– число параметров при переменных .
Расчетное значение критерия сравнивается с табличным, определяемым по таблицам соответствующего распределения в зависимости от уровня значимости и двух степеней свободы и .
1.6. Предпосылки метода наименьших квадратов
Напомним, что в общем виде уравнение регрессии имеет следующий вид:
,
где ненаблюдаемая случайная величина, оценки которой можно получить как .
При изменении спецификации, т.е. вида модели, и добавлении в нее новых переменных могут изменяться.
Одна из основных задач регрессионного анализа – исследование остатков путем проверки свойств оценок параметров регрессии, которые должны быть:
несмещенными, т.е. должны представлять собой средние значения из возможно большого количества оценок: при , т.е. остатки не должны накапливаться;
эффективными: оценки должны характеризоваться наименьшей дисперсией, что обеспечивает возможность перехода от точечной оценки к интервальной;
состоятельными, т.е. должна повышаться точность оценок по мере увеличения объема выборки.
Условия, необходимые для обеспечения этих свойств, называются предпосылками МНК, соблюдение которых желательно для получения достоверных оценок параметров регрессии. Предпосылки можно сформулировать следующим образом.
1. Случайный характер остатков, который можно выявить на основе графика зависимости случайных остатков от теоретических значений Y [2].
2. – остатки не зависят от значений факторов x.
3. Гомоскедастичность остатков – (противоположное свойство интерпретируется как гетероскедастичность).
4. Отсутствие автокорреляции остатков, т.е. отсутствие корреляции между текущими и предыдущими или последующими значениями. Доказывается путем расчета и проверки значимости коэффициента автокорреляции по следующей формуле:
(1.16)
Причины автокорреляции в отклонениях от регрессионной модели указаны далее в п. 4.5.1, в отклонениях от трендовых моделей – в п. 4.4.5.
5. Подчинение остатков нормальному (Гаусса) закону распределения [2, 5, 7];
Кроме того, необходимо соблюдение требований, предъявляемых к переменным, таких как:
отсутствие мультиколлинеарных факторов (п. 2.2);
– объем выборки больше количества факторов в 6-8 раз.