- •Эконометрика
- •Введение
- •1. Модели статистической взаимосвязи
- •1.1. Типы взаимосвязи между явлениями
- •1.2. Типы данных
- •1.3. Типы моделей
- •Контрольные вопросы
- •2. Двухмерная модель линейной регрессии
- •2.1. Определение параметров млр. Метод наименьших квадратов
- •2.2. Матричная форма записи при определении параметров млр
- •2.3. Корреляционный анализ млр
- •2.4. Оценка ошибок моделирования
- •2.4.1. Основные условия (гипотезы) анализа ошибок
- •2.4.2. Ошибки оценок параметров модели
- •2.4.3. Оптимальность оценок мнк Теорема Гаусса-Маркова.
- •2.4.4. Оценка прогноза показателя и ошибок прогнозирования
- •2.5. Установление существенности связи на основе теории статистической проверки гипотез
- •2.5.1. Распределения случайных величин Нормальное распределение (Гаусса)
- •Распределение Пирсона (2-распределение)
- •Распределение Фишера
- •Распределение Стьюдента (t-распределение)
- •Статистическая проверка гипотез
- •Контрольные вопросы
- •3. Многомерная модель линейной регрессии
- •3.1. Определение параметров модели методом наименьших квадратов
- •3.2. Определение оценок параметров млр через отклонения (уменьшение числа уравнений системы до k – 1)
- •3.3. Статистические свойства оценок параметров млр
- •3.3.1. Условия анализа
- •3.3.2. Среднеквадратичные ошибки оценок параметров млр
- •3.3.3. Ошибки прогнозирования
- •3.4. Коэффициент детерминации многомерной млр
- •3.5. Определение существенности статистической связи между факторами и показателем
- •Контрольные вопросы
- •4. Мультиколлинеарность
- •4.1. Выражение для оценки параметров млр в стандартизованной форме
- •4.2. Тестирование на мультиколлинеарность методом Феррара-Глобера
- •4.2.1. Проверка на общую мультиколлинеарность
- •4.2.2. Проверка мультиколлинеарности между парами факторов
- •Контрольные вопросы
- •5. Автокорреляция
- •5.1. Обобщенный метод наименьших квадратов
- •5.2. Авторегрессионый процесс первого порядка
- •5.3. Тест Дарбина-Уотсона на автокорреляцию
- •Контрольные вопросы
- •6. Двухмерная модель нелинейной регрессии
- •6.1. Трехпараметрическая парабола
- •6.2. Двухпараметрическая парабола
- •6.3. Обзор двухпараметрических нелинейных моделей парной регрессии
- •Экспоненциальная модель
- •Логарифмическая модель
- •Гиперболическая модель
- •Контрольные вопросы
- •Литература
- •Приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
- •Приложение 5
2.2. Матричная форма записи при определении параметров млр
Сначала дадим векторную интерпретацию при решении системы уравнений для параметров a и b , полученных с помощью МНК. Введем обозначения для n-мерных вектор-строк:
X1 = (1, 1, 1,……, 1),
Х2 = (х1, х2, х3,…, хn),
E = (e1, e2, e3,…, en).
Обозначая штрихом Х транспонирование строки (или матрицы) Х (при котором строки преобразуются в столбцы и наоборот), система уравнений (2.4), (2.5) в векторной форме примет вид
, (2.13)
. (2.14)
Равенство нулю векторного произведения двух векторов определяется как свойство ортогональности этих векторов. Отсюда следует, что вектор остатков регрессии Е минимальной длины ( ) ортогонален векторам Х1 (с единичными проекциями) и Х2 (с проекциями хi). Включая строки Х1 и Х2 в матрицу Х размерности 2 n
,
систему уравнений (2.13), (2.14) можно заменить одним матричным уравнением
. (2.15)
Здесь 0 – двухмерный вектор-строка с нулевыми проекциями. Вектор остатков регрессии теперь запишем в виде
, (2.16)
где Y = (y1, y2, y3,…, yn),
Y* = (a + bx1, a + bx2, a + bx3,…, a + bxn ) = ВХ,
В = (a, b).
Вектор В является двухмерным вектором оценок параметров двухмерной МЛР.
С учетом (2.16) и последних соотношений уравнение (2.15) примет вид
.
Отсюда решение для вектора В оценок параметров модели имеет вид
. (2.17)
Здесь []–1 обозначена обратная матрица. Можно показать, что это решение тождественно решениям (2.9), (2.10) системы двух уравнений для оценок параметров двухмерной МЛР. Отметим, что в (2.17) В и – векторы-строки размерности 2, а – квадратная матрица размерности [22].
Решение (2.17) существует, если матрица невырождена, т.е. её определитель не равен 0 (условие существования обратной матрицы). Так как
,
то определитель этой матрицы равен 0 тогда и только тогда, когда все элементы выборки – одинаковые константы: xi = c. Это вырожденный случай, так как область значений фактора вырождается в точку и регрессия отсутствует. Выборочная дисперсия (2.10) фактора в этом случае равна 0, и в формуле (2.12) появляется неопределенность 0/0 (Кху = 0, так как ). В практических задачах моделирования регрессий или трендов такие ситуации нереальны или не представляют интереса.
Матричная форма записи (2.17) для вектора В оценок параметров линейной модели парной регрессии полезна при обобщении двухмерной модели в модель множественной регрессии (см. главу 3, формула (3.9)).
2.3. Корреляционный анализ млр
Корреляционный анализ имеет целью установление существенности (статистической значимости) корреляционной связи между фактором и результатом (показателем). Основным и достаточно удобным параметром для этого является коэффициент детерминации.
Пользуясь обозначениями п.2.1, разложим выборочную дисперсию показателя на две некоррелированные составляющие:
.
Из (2.4), (2.5) следует, что последняя сумма в этом разложении равна 0, и, следовательно, случайные величины ei и некоррелированы. Поэтому
, (2.18)
где , (2.19)
. (2.20)
Таким образом, общая дисперсия (2.18) показателя (TSS – total sum of squares – общая сумма квадратов) складывается из двух составляющих, характеризующих разные свойства корреляционного поля данных. Составляющая (2.20) (ESS – error sum of squares – сумма квадратов ошибок) характеризует степень разброса точек уi относительно теоретической прямой и, следовательно, выражает свойство случайности выборочной совокупности. Составляющая (2.19) (RSS – regression sum of squares – сумма квадратов отклонений регрессии), напротив, пропорциональна квадрату разности между линией регрессии и постоянной средней, т.е. характеризует свойство закономерности связи. её доля в общей дисперсии, определяемая как коэффициент детерминации
, (2.21)
является параметром, определяющим значимость линейной статистической связи между фактором и показателем. Из (2.18) – (2.20) следует, что
. (2.22)
Эта формула удобна при расчетах, если по результатам моделирования вычислены остатки регрессии ei и их квадраты.
Коэффициент детерминации можно также выразить через коэффициент регрессии b, если учесть, что возведение в квадрат (2.7) и усреднение дает
.
Тогда
, (2.23)
или, учитывая (2.12),
. (2.24)
Таким образом, коэффициент детерминации равен квадрату коэффициента корреляции
. (2.25)
Согласно (2.23) коэффициент корреляции можно выразить через коэффициент регрессии как
.
Таким образом, знак коэффициента корреляции совпадает со знаком коэффициента регрессии b. Последний, однако, отличается тем, что может иметь размерность [y/x], тогда как коэффициент корреляции rxy – величина безразмерная.
Коэффициент корреляции характеризует степень линейной статистической связи. Он принимает значения в интервале
– 1 rxy 1. (2.26)
В крайних точках rxy = 1 статистическая связь становится линейной функциональной, положительной (rxy = 1) или отрицательной (rxy = – 1). В области rxy (0, 1] регрессия положительна (b 0), а в области rxy [– 1, 0) – отрицательна (b 0). При rxy = 0 говорят, что величины X и Y некоррелированы. В теории вероятности доказано, что независимые случайные величины всегда некоррелированы (обратное утверждение верно лишь в частных случаях, например, для нормальных случайных величин X и Y). Обычно полагают, что при |rxy| < 0,3 корреляционная связь слабая, при |rxy| = (0,30,7) – средняя, а при |rxy| > 0,7 – сильная.
Коэффициент корреляции является более информативным параметром по сравнению с коэффициентом детерминации, так как его знак позволяет судить о положительной или отрицательной корреляции (и, тем самым, регрессии). В соответствии с (2.22) или (2.26) область значений коэффициента детерминации
0 R2 1.
Важным свойством коэффициентов корреляции и детерминации является их независимость от изменения размерности величин Х и (или) Y, а также от их пропорционального изменения. Скажем, мы изучаем зависимость товарооборота Y торгового предприятия от торговой площади X [м2]. Коэффициент регрессии b при этом измеряется в ден.ед./м2, например, грн./м2 или евро/м2. Переход от одной единицы к другой сопровождается пропорциональным изменением коэффициента регрессии b (а также и постоянной составляющей а, если изменяется показатель Y). Вместе с тем, на коэффициенты R2 и rxy такие пересчеты не влияют, они являются безразмерными относительными показателями (коэффициент R2 можно, например, выразить в %). Как следует из формул (2.24), (2.25), изменение всех значений xi в k1 раз и (или) yi в k2 раза оставляет неизменными коэффициенты корреляции и детерминации.
Коэффициент детерминации (или связанный с ним F-критерий Фишера) является определяющим показателем при установлении существенности (статистической значимости) связи между фактором и показателем (см.п.2.5).