
- •Глава I. Основные аспекты эконометрического моделирования
- •Глава II. Корреляционный анализ
- •Глава III. Множественный регрессионный анализ
- •Глава IV. Временные ряды
- •Глава V. Некоторые вопросы практического построения регрессионных моделей
- •Введение Определение эконометрики
- •Значение эконометрики в экономике
- •Задачи эконометрики
- •Глава I. Основные аспекты эконометрического
- •1.1. Понятие о модели, системе
- •1.2. Адекватность модели
- •1.3. Модель типа черного ящика
- •1.4. Основная предпосылка эконометрического анализа
- •1.5. Построение параметрической регрессионной модели
- •1.6. Классификация эконометрических моделн.
- •1.6.1. По структуре уравнений регрессии
- •1.6.2. По способу учета динамики:
- •1.6.3. По виду связи между
- •1.6.4. По алгоритму оценки параметров модели
- •1.7. Типы данных
- •1.7.1. Данные пространственного типа
- •1.7.2. Временной (динамический) ряд
- •1.8. Этапы построения эконометрической модели
- •Глава II. Корреляционный анализ
- •2.1. Цель корреляционного анализа
- •2.2. Числовые меры корреляционной связи
- •2.2.1. Ковариация
- •2.2.2. Выборочная оценка коэффициента линейной парной корреляции
- •2.2.3. Математический смысл коэффициента линейной парной корреляции
- •2.2.4. Статистический смысл коэффициента линейной парной корреляции
- •2.2.5. Геометрическая интерпретация коэффициента корреляции
- •2.3. Проверка статистической значимости коэффициента корреляции
- •2.4. Множественный корреляционный анализ
- •2.4.1. Корреляционная матрица
- •2.4.2. Выборочный линейный коэффициент множественной корреляции
- •2.4.3. Частный коэффициент корреляции
- •2.4.4. Коэффициент детерминации
- •2.4.5. Оценка значимости множественного коэффициента детерминации
- •2.4.6. Индекс корреляции при нелинейной связи двух случайных величин
- •2.4.7. Индекс множественной корреляции
- •2.5. Коэффициент ранговой корреляции
- •Глава III. Множественный регрессионный анализ
- •3.1. Постановка задачи
- •3.2. Метод наименьших квадратов (мнк) в скалярной форме
- •3.3. Матричная форма метода наименьших квадратов.
- •3.3.1.Уравнение наблюдений в матричной форме
- •3.3.2.Нормальные уравнения регрессии и формула для параметров уравнения
- •3.4. Предпосылки метода наименьших квадратов
- •3.5. Свойства оценок, получаемых по методу наименьших квадратов
- •3.6. Оценка адекватности уравнения регрессии (проверка гипотез о предпосылках метода наименьших квадратов)
- •3.6.1.Гипотеза о близости к нулю математического ожидания остатков
- •3.6.2. Гипотеза о статистической значимости коэффициентов регрессии bj
- •3.6.3. Гипотеза о статистической значимости всего уравнения регрессии в целом
- •3.6.4. Оценка качества уравнения регрессии
- •3.6.5. Скорректированный коэффициент детерминации
- •3.6.6. Проверка гипотезы о чисто случайном характере остатков
- •3.6.7. Проверка гипотезы о нормальном законе распределения остатков
- •3.7. Точечный прогноз и оценка доверительных интервалов прогноза
- •3.8. Оценка погрешностей расчета по уравнению регрессии
- •3.9. Коэффициент эластичности, бета-коэффициент и дельта-коэффициент для линейного уравнения регрессии
- •Глава IV. Временные ряды
- •4.1. Понятие о временных рядах, их классификация
- •4.2. Компонентный анализ временных рядов
- •4.3. Понятие случайного процесса
- •4.4. Понятие о коэффициенте корреляции во временном ряде. Автокорреляционная функция (акф)
- •4.5. Выборочная оценка коэффициента автокорреляции для числа степеней свободы
- •4.6. Частный коэффициент автокорреляции
- •4.7. Предварительный анализ временных рядов
- •4.8. Авторегрессионные модели.
- •Ar(p) – порядка p
- •4.9. Авторегрессионная модель скользящей средней
- •4.10. Разностные уравнения с лаговыми пременными
- •4.11. Оценка коэффициентов авторегрессионных моделей.
- •4.12. Прогнозирование по разностной авторегрессионной модели
- •Глава V. Некоторые вопросы практического построения регрессионных моделей
- •5.1.Проблема спецификации переменных. Мультиколлинеарность
- •5.2.Способы устранения мультиколлинеарности
- •5.3. Метод пошаговой регрессии (конструктивный метод)
- •5.4. Деструктивный подход (“расщепления”) мультиколлинеарных пар
- •5.5.Случай нелинейных координатных функций
- •5.5.1.Формальная замена переменных
- •5.5.2. Специальное преобразование
- •5.6. Линейные уравнения регрессии с переменной структурой. Фиктивные переменные
- •5.7. Способ устранения коррелированности регрессоров с остатками с помощью инструментальных переменных
- •5.8. Двухшаговый метод наименьших квадратов
- •Литература
3.6.3. Гипотеза о статистической значимости всего уравнения регрессии в целом
Используется критерий Фишера- Снедекора F и проверяется нуль-гипотеза:
(3.22)
QR
– сумма квадратов отклонений расчетных
значений
от среднего
,
обусловленная вариацией факторов; Qe
- сумма
квадратов отклонений расчетных значений
от фактически наблюдаемых, обусловленная
влиянием случайных возмущений Ei
(включая влияние неучтенных в модели
факторов).
Выводы:
1. Если гипотеза Н0 выполнена, то уравнение регрессии в целом статистически незначимо и можно сразу делать вывод о неадекватности модели.
2. Если нуль-гипотеза Н0 не выполнена, т.е. F>Fтаб, то уравнение регрессии в целом значимо и можно переходить к проверке других гипотез.
3.6.4. Оценка качества уравнения регрессии
Для комплексной оценки качества уравнения регрессии используется коэффициент детерминации R2
Коэффициент детерминации R2 как мера качества уравнения регрессии характеризует долю вариации зависимой переменной, обусловленную регрессией (влиянием факторов), в общей вариацией результативной переменной Yi ; чем ближе коэффициент детерминации R2 к единице, тем лучше уравнение регрессии аппроксимирует экспериментальные данные, тем ближе эмпирические точки располагаются к линии регрессии, тем больше прогностическая сила модели.
Замечание: Коэффициент множественной детерминации, определяется по результатам линейного корреляционного анализа, не следует смешивать с рассматриваемым коэффициентом детерминации R2, справедливого и для моделей, нелинейных по регрессорам (в этом случае его следует называть «индексом множественной детерминации»). Другими словами,
R2¹[Rj.12…m]2.
Это разные коэффициенты: первый из них связан с регрессионным анализом, т.е. привязан к конкретной параметрической модели , а второй связан корреляционным анализом линейно-связанных случайных величин, т.е. с корреляционной матрицей K. Сходство только в термине «детерминация», а расчетные формулы – разные:
(3.23)
(3.24)
Последняя формула справедлива только для линейных корреляционных связей.
Приемы улучшения качества модели:
1). Сделать предварительное сглаживание временного ряда (одномерного или многомерного) по методу простой скользящей средней или экспоненциального сглаживания. Данный прием применяют только при наличии упорядочения наблюдений во времени, т.е. для использования данных пространственного типа он не применяется.
2). Использовать нормирование всех переменных и зависимых и независимых:
(3.25)
3). Выявить и выбросить из процедуры метода наименьших квадратов аномальные точки.
Выводы:
1. Приемлемость получаемого значения R2 определяется целями моделирования: если допустимы грубые (прикидочные) оценки, то можно принять R2 ~ 0,8, для более точных оценок R2 > 0,9.
2. Если база данных (БД) сильно зашумлена (или даже сознательно искажена, что имеет место в задачах налогового и финансового контроля), то может оказаться, что никакие «ухищрения» (о них речь позже) не позволяют получить R2>0,9. Что делать тогда?
Рекомендации:
Повысить информативность базы данных за счет различных алгоритмов предпроцессорной обработки (сглаживание, если база данных упорядочена по времени; кластеризации данных; компрессия данных (факторный анализ); расширения бахзы данных как парирование ее зашумленности; накнец – переход к другим моделям:
нейросетевым [2,3,12,14]
нечетким [14,15];
фрактальным [4,6,9].