
- •Институт экономики переходного периода
- •В.П. Носко
- •Эконометрика для начинающих
- •Основные понятия, элементарные методы, границы применимости, интерпретация результатов
- •Оглавление
- •Часть 1. Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов 7
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений 85
- •Часть 3. Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках 180
- •Предисловие
- •Часть 1. Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов
- •1.1. Эконометрика и ее связь с экономической теорией
- •1.2. Две переменные: меры изменчивости и связи
- •1.3. Метод наименьших квадратов. Прямолинейный характер связи между двумя экономическими факторами
- •1.4. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
- •1.5. «Обратная» модель прямолинейной связи
- •1.6. Пропорциональная связь между переменными
- •1.7. Примеры подбора линейных моделей связи между двумя факторами. Фиктивная линейная связь
- •1.8. Очистка переменных. Частный коэффициент корреляции
- •1.9. Процентное изменение факторов в линейной модели связи
- •1.10. Нелинейная связь между переменными
- •1.11. Пример подбора моделей нелинейной связи, сводящихся к линейной модели.
- •1.12. Линейные модели с несколькими объясняющими переменными
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений
- •2.1. Вероятностное моделирование ошибок
- •2.2. Гауссовское (нормальное) распределение ошибок в линейной модели наблюдений
- •2.3. Числовые характеристики случайных величин и их свойства
- •2.4. Нормальные линейные модели с несколькими объясняющими переменными
- •2.5. Нормальная множественная регрессия: доверительные интервалы для коэффициентов
- •2.6. Доверительные интервалы для коэффициентов: реальные статистические данные
- •2.7. Проверка статистических гипотез о значениях коэффициентов
- •2.8. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
- •2.9. Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерии
- •2.10. Проверка гипотез о значениях коэффициентов: односторонние критерии
- •2.11. Некоторые проблемы, связанные с проверкой гипотез о значениях коэффициентов
- •2.12. Использование оцененной модели для прогнозирования
- •Часть 3. Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках
- •3.1. Проверка адекватности подобранной модели имеющимся статистическим данным: графические методы
- •3.2. Проверка адекватности подобранной модели имеющимся статистическим данным: формальные статистические процедуры
- •3.3. Неадекватность подобранной модели: примеры и последствия
- •3.4. Коррекция статистических выводов при наличии гетероскедастичности (неоднородности дисперсий ошибок)
- •3.5. Коррекция статистических выводов при автокоррелированности ошибок
- •3.6. Коррекция статистических выводов при наличии сезонности. Фиктивные переменные
- •Заключение
- •Список литературы
1.4. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
Вернемся теперь к определению выборочной ковариации и отметим некоторые ее свойства.
Пусть
— некоторая постоянная, а
—
переменные, принимающие в
-
м наблюдении значения
,
(n — количество наблюдений). Тогда
можно рассматривать как переменную,
значения которой в
-
м наблюдении
равно
,
и
так что
Далее, очевидно, что
и что
Кроме того,
так что
Наконец,
так что
На основе этих свойств, в частности, находим, что
(постоянная не обладает изменчивостью),
(при изменений единицы измерения переменной в раз, во столько же раз изменяется и величина стандартного отклонения этой переменной),
(сдвиг начала отсчета не влияет на изменчивость переменной).
Наконец,
т. е.
(дисперсия суммы двух переменных отличается от суммы дисперсий этих переменных на величину, равную удвоенному значению ковариации между этими переменными).
Что касается
выборочного коэффициента корреляции
,
то если изменяются начало отсчета
и единица измерения, скажем, переменной
,
так что вместо значений
мы получаем значения
переменной
,
то тогда
Иными словами,
выборочный коэффициент корреляции
,
инвариантен относительно
выбора единиц измерения и начала отсчета
переменных
и
.
В
то же время, этого нельзя сказать об
оценке
коэффициента
в модели
наблюдений
.
Действительно, если, скажем, мы
переходим к новой единице измерения
переменной
,
так что вместо значений
наблюдаются значения переменной
,
то тогда оценка
коэффициента
в модели наблюдений
равна
Таким образом, изменяя единицу измерения переменной (или переменной ), мы можем получать существенно различные значения , от сколь угодно малых до сколь угодно больших. (Желательно выбирать единицы измерения таким образом, чтобы сравниваемые переменные имели одинаковый порядок.) Близость значений к нулю всегда должна интерпретироваться с оглядкой на используемые единицы измерения переменных и .
Отметим, в этой связи, полезное представление в виде
Действительно,
откуда и вытекает
указанное представление. Из этого
представления получаем, в частности,
что при Var (x) = Var (y) имеет
место равенство
,
и тогда выраженность линейной
связи между
и
непосредственно отражается в близости
значения
к
или
.
Рассмотрим теперь
коэффициент корреляции
между переменными
и
,
где
,
а
и
— оценки наименьших квадратов параметров
и
гипотетической линейной связи между
переменными
и
.
Замечая, что
(т.к.
по определению), находим:
Но ранее мы уже
получили (при выводе разложения для
)
соотношение
которое, с учетом
соотношения
,
приводит к равенству
левая часть которого есть не что иное как
Следовательно,
так что
Последнее соотношение
показывает, что коэффициент детерминации
равен квадрату коэффициента корреляции
между переменными
и
,
так что при достаточно сильно выраженной
линейной связи между переменными
и
,
что соответствует значению
,
близкому к
,
оказывается близким к
и коэффициент корреляции между переменными
и
.
По причинам, которые будут ясны из дальнейшего рассмотрения, называют множественным коэффициентом корреляции (multiple-R, множественный-R).
Отметим также, что переменная измеряется в тех же единицах, что и переменная , и при изменении масштаба измерения переменной значение не изменяется. Отсюда вытекает, что коэффициент детерминации R2 инвариантен относительно изменения масштаба и начала отсчета переменных и .
Заметим, наконец, что
(здесь sign(z)=-1 для z<0, sign(z)=0 для z=0, sign(z)=1 для z>0)
Поскольку же
то
и
так что
и мы можем установить значение R2 еще до построения модели линейной связи.
Замечание
Если
,
то
и
;
если
,
то
и
,
так что всегда