
- •Эконометрика
- •Введение
- •1. Модели статистической взаимосвязи
- •1.1. Типы взаимосвязи между явлениями
- •1.2. Типы данных
- •1.3. Типы моделей
- •Контрольные вопросы
- •2. Двухмерная модель линейной регрессии
- •2.1. Определение параметров млр. Метод наименьших квадратов
- •2.2. Матричная форма записи при определении параметров млр
- •2.3. Корреляционный анализ млр
- •2.4. Оценка ошибок моделирования
- •2.4.1. Основные условия (гипотезы) анализа ошибок
- •2.4.2. Ошибки оценок параметров модели
- •2.4.3. Оптимальность оценок мнк Теорема Гаусса-Маркова.
- •2.4.4. Оценка прогноза показателя и ошибок прогнозирования
- •2.5. Установление существенности связи на основе теории статистической проверки гипотез
- •2.5.1. Распределения случайных величин Нормальное распределение (Гаусса)
- •Распределение Пирсона (2-распределение)
- •Распределение Фишера
- •Распределение Стьюдента (t-распределение)
- •Статистическая проверка гипотез
- •Контрольные вопросы
- •3. Многомерная модель линейной регрессии
- •3.1. Определение параметров модели методом наименьших квадратов
- •3.2. Определение оценок параметров млр через отклонения (уменьшение числа уравнений системы до k – 1)
- •3.3. Статистические свойства оценок параметров млр
- •3.3.1. Условия анализа
- •3.3.2. Среднеквадратичные ошибки оценок параметров млр
- •3.3.3. Ошибки прогнозирования
- •3.4. Коэффициент детерминации многомерной млр
- •3.5. Определение существенности статистической связи между факторами и показателем
- •Контрольные вопросы
- •4. Мультиколлинеарность
- •4.1. Выражение для оценки параметров млр в стандартизованной форме
- •4.2. Тестирование на мультиколлинеарность методом Феррара-Глобера
- •4.2.1. Проверка на общую мультиколлинеарность
- •4.2.2. Проверка мультиколлинеарности между парами факторов
- •Контрольные вопросы
- •5. Автокорреляция
- •5.1. Обобщенный метод наименьших квадратов
- •5.2. Авторегрессионый процесс первого порядка
- •5.3. Тест Дарбина-Уотсона на автокорреляцию
- •Контрольные вопросы
- •6. Двухмерная модель нелинейной регрессии
- •6.1. Трехпараметрическая парабола
- •6.2. Двухпараметрическая парабола
- •6.3. Обзор двухпараметрических нелинейных моделей парной регрессии
- •Экспоненциальная модель
- •Логарифмическая модель
- •Гиперболическая модель
- •Контрольные вопросы
- •Литература
- •Приложение 1
- •Приложение 2
- •Приложение 3
- •Приложение 4
- •Приложение 5
3.3. Статистические свойства оценок параметров млр
3.3.1. Условия анализа
По аналогии с моделью парной регрессии при статистическом анализе ошибок моделирования будем полагать, что априори выполняются следующие условия:
в спецификации модели (3.2) факторы Х – известные величины, а показатель Y и ошибки – случайные величины.
Вектор параметров необходимо определить, минимизируя ошибки моделирования, принимая при этом во внимание:
статистические свойства ошибок:
M[i] = 0; D[i] = M[i2] = 2 = const (гомоскедастичность);
некоррелированность ошибок:
М[ik] = 0 (i k);
добавочное условие (не является обязательным): i N(0, 2) (нормальность ошибок и, соответственно, модели).
3.3.2. Среднеквадратичные ошибки оценок параметров млр
Покажем сначала, что оценка параметров В является несмещенной. Действительно, согласно (3.2) и условия 2 (М[] = 0)
M[Y] = M[X + ] = X.
Тогда математическое ожидание оценки (3.9)
.
По определению это означает несмещенность оценки МНК параметров модели.
Определим далее дисперсию оценки В. Обозначим детерминированный множитель этой оценки Х (ХХ)-1= А, тогда с учетом D[Y] = D[] = 2
(3.18)
Это равенство определяет матрицу корреляционных моментов размерности [k k]. Действительно,
В частности, для двухмерной модели (k = 2)
Отсюда
Как видим, дисперсии (диагональные элементы матрицы (3.18)) совпадают с выражениями (2.30), (2.34). Кроме того, параметры a и b модели имеют отрицательную взаимную корреляцию Kab (недиагональные элементы матрицы (3.18)). Это легко объяснимо, так как с ростом коэффициента регрессии (или угла наклона прямой) постоянная составляющая а уменьшается (см. рис.2.3, б).
Без вывода приведем выражение для оценки дисперсии ошибок k-мерной МЛР
(3.19)
Эта оценка используется вместо истинного значения 2 при определении оценок дисперсий параметров МЛР (информация о 2 содержится в генеральной совокупности). При k = 2 она совпадает с (2.35).
На практике вместо (3.18) рассчитывается оценочное значение корреляционной матрицы
(3.20)
с подстановкой (3.19) взамен 2.
Для k-мерной модели СКО оценок параметров В определяются как корни квадратные из диагональных элементов матрицы (3.20).
Если МЛР – нормальная и, следовательно, еi/ N(0, 1) – независимые стандартные нормальные случайные величины, то нормированное значение s2 имеет 2-распределение с (n – k) степенями свободы
. (3.21)
Математическое ожидание и дисперсия этой нормированной величины одинаковы и равны 1 (см. п.2.5.1 – распределение Пирсона).
3.3.3. Ошибки прогнозирования
В отличие от двухмерной модели прогнозируемое значение фактора в многомерной модели является k-мерным вектором Хр = (1, х2р, х3р,…, хкр) с (k – 1) задаваемыми значениями различных факторов.
С учетом случайных ошибок прогнозируемое значение показателя рассматривается как случайная величина
yp = BXp + εp, (3.22)
где штрихом обозначен вектор-столбец, причем входящие в правую часть (3.21) случайные величины некоррелированны. Прогнозируемое среднее значение показателя в точке прогноза определяется моделью
. (3.23)
Для оценки точности прогноза определим дисперсию показателя (3.22) как сумму дисперсий (это справедливо для некоррелированных величин BXp и εp)
Подставляя сюда значение (3.18) дисперсии параметров модели (матрицу моментов корреляции), получим
Как обычно, вместо неизвестной дисперсии 2 для расчетов используется её оценка (3.19), при этом с учетом (3.20) получим оценку дисперсии прогноза показателя
(3.24)
Корень квадратный из этой дисперсии определяет СКО прогноза. Интервальную ошибку прогноза для нормальной модели можно найти с учетом граничной ошибки
(3.25)
с параметром t = 1 при доверительной вероятности = 0,68, t = 2 при = 0,954 и t = 3 при = 0,997. Доверительный интервал [yp – yp, yp + yp] определяет область возможных (с вероятностью ) значений прогноза показателя.
Задача определения ошибок оценок параметров модели (корреляционная матрица (3.20)) и прогноза (формула (3.24)) оказывается более трудоемкой, чем построение модели (определение параметров В). Например, для построения 3-мерной модели параметры, выраженные через отклонения, определяются матрицей [22], тогда как для определения ошибок с помощью (3.20), (3.24) приходится обращать матрицу [33].
Пример 3.2. Для данных примера 3.1 и построенной в нем модели определим корреляционную матрицу оценок параметров (3.20) и доверительный интервал прогноза зарплаты работника предприятия с уровнем доходов 10 баллов и 4-м тарифным разрядом (х2р = 10, х3р= 4) с доверительной вероятностью 0,68.
Точка прогноза, таким образом, определяется вектором
Хр = (1, 10, 4).
Среднее значение прогноза показателя определяем согласно (3.23), используя найденные в примере 3.1 параметры
.
Обратная матрица произведения ХХ определена в примере 3.1 и равна
.
Правый сомножитель в (3.24) равен
1+ [1 10 4]
=1+
[1,894 0,366 –0,785]
=
= 3,414.
Второй (левый) сомножитель в (3.24) определим с помощью расчетов в примере 3.2
Тогда согласно (3.24) и (3.25)
В итоге доверительный интервал прогноза зарплаты работника с 4-м тарифным разрядом предприятия с уровнем доходов 10 баллов с доверительной вероятностью 0,68 лежит в пределах
yp [3,804 – 2,255, 3,804 + 2,255] = [1,549, 6,059] у.е.
Как видим, граничная ошибка прогноза довольно велика (Δур/ yp* = 0,6), что объясняется малым объемом выборки и, следовательно, недостаточной статистикой.
Корреляционная матрица оценок параметров (3.20) (точнее, её оценочное значение) равна
Оценим ошибки в
определении коэффициентов регрессии
b2
и b3.
Дисперсии их оценок определяются
диагональными элементами матрицы
,
а среднеквадратичные ошибки
Оценки этих параметров найдены в примере 3.1 и равны b2 = – 0,152, b3 = 1,587. Как видим, относительные значения СКО оценок параметров весьма велики и составляют соответственно 204% и 45%. Одной из очевидных причин этого является малая выборка (n = 5). Доверительные интервалы значений параметров можно определить после нахождения граничной ошибки (3.25) при заданной доверительной вероятности.