- •Раздел I Анализ невременных данных
- •Характеристики случайной величины
- •Математическое ожидание с.В. X.
- •Дисперсия
- •Корреляция.
- •Медиана
- •Модель парной линейной регрессии
- •Теорема Гаусса-Маркова
- •Ковариационная матрица
- •Дисперсионный анализ
- •Модель множественной регрессии
- •Спецификация модели
- •Включение в модель несущественных параметров.
- •Dummy – переменные, фиктивные переменные
- •Интерпретация коэффициентов:
- •Прогнозирование
- •Выбор параметров линейной регрессии (процедура пошагового отбора)
- •Работа с процедурными значениями
- •Общая методика построения регрессионного уравнения
- •Раздел II
- •Коэффициент взаимной сопряженности Чупрова
- •Биссериальный коэффициент корреляции
- •Ранговые коэффициенты корреляции
- •Коэффициент корреляции Спирмена
- •Общая схема проверки гипотез
- •Структура международных маркетинговых исследований
- •Временные ряды
- •Временной или динамический ряд
- •Классификация временных рядов
- •Анализ трендовой составляющей
- •Метод, основанный на медиане или медианный критерий
- •Корреляция во времени
- •Анализ сезонности во временных рядах
- •Анализ автокорреляции
- •Выбросы и структурные изменения
- •Дискретные зависимые переменные
- •Решение проблемы
Ковариационная матрица
Симметричная
диагональная матрица, на диагонали у
которой стоят дисперсии;
- выборки объема Т.
Также можно построить корреляционную матрицу, на диагонали которой 1 – диагональная симметричная матрица, у которой остальные элементы – это соответствующие коэффициенты корреляции, характеризующие силу связи и изменяющиеся от [-1;1]
Замечание: Таким образом, используя корреляционную матрицу для построения регрессии, мы выбираем тот Х, коррелированность с Y которого по модулю наибольшая, т.е. мы выбираем тот параметр Х для получения наилучших результатов, сила связи которого с Y наибольшая, т.е. коэффициент по модулю наибольший.
Дисперсионный анализ
Попробуем разложить дисперсию изменчивости явления на две составляющие – объясненную регрессией и необъясненную.
I
II III
ESS – дисперсия, необъясненная уравнением, та, которая осталась неизвестной в остатке.
RSS – та часть дисперсии, которая объяснена регрессионным уравнением.
На основании этого
вводится
–
коэффициент детерминации,
характеризующий долю объясненной
дисперсии с помощью данного регрессионного
уравнения в общей дисперсии.
Этот коэффициент используется для выбора наилучшей модели из множества построенных.
Если
,
то мы ничего не объяснили с помощью
построенной регрессии
Если
,
то мы учли всю изменчивость признака.
Из двух моделей выбирается та, у которой:
все коэффициенты значимы
максимально простая (т.е. как можно меньше параметров)
как можно больше
экономическая интерпретируемость коэффициентов (объясняемость)
как можно более точный прогноз (при работе с выборкой отсекаются 5-10 значений, на которые и строится прогноз)
Модель множественной регрессии
Обобщением двумерной или парной линейной регрессии служит многомерная линейная регрессия
-уравнение
многомерной линейной регрессии,
где
Основные гипотезы:
1)
спецификация модели - вид, линейный по параметрам
-
не зависит от t- независимые параметры; y – зависимый
Запишем это уравнение в матричной форме
Построить такое уравнение регрессии означает найти оценку параметра, т.е. оценку вектора а.
По теореме Маркова-Гаусса если выполняются основные гипотезы 1,2,3,4, то можно применить метод наименьших квадратов, с помощью которого получится следующее уравнение:
,
где
-
икс транспонированный
Т.к. мы находим оценки коэффициентов, а не их истинное значение, то нам хотелось бы оценить точность оценивания.
Она связана с вариацией оценки, т.е. с дисперсией: чем больше дисперсия, тем меньше точность и больше вариация. Тогда:
(**)
Используя правила
перемножения матриц, получаем:
Замечание: из формулы (**) видно, что чем больше параметров, тем больше дисперсия. Поэтому мы выбираем максимально простую модель.
Оценивание качества многомерной линейной регрессии осуществляется так же, как и двумерной, но следует помнить, что растет с увеличением параметров, поэтому с помощью можно сравнивать только модели с одинаковым количеством зависимых параметров.
