- •В.П. Носко
- •Оглавление
- •Часть 1.Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов7
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений85
- •Часть 3.Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках180
- •Предисловие
- •Часть 1. Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов
- •1.1. Эконометрика и ее связь с экономической теорией
- •1.2. Две переменные: меры изменчивости и связи
- •1.3. Метод наименьших квадратов. Прямолинейный характер связи между двумя экономическими факторами
- •1.4. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
- •1.5. «Обратная» модель прямолинейной связи
- •1.6. Пропорциональная связь между переменными
- •1.7. Примеры подбора линейных моделей связи между двумя факторами. Фиктивная линейная связь
- •1.8. Очистка переменных. Частный коэффициент корреляции
- •1.9. Процентное изменение факторов в линейной модели связи
- •1.10. Нелинейная связь между переменными
- •1.11. Пример подбора моделей нелинейной связи, сводящихся к линейной модели.
- •1.12. Линейные модели с несколькими объясняющими переменными
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений
- •2.1. Вероятностное моделирование ошибок
- •2.2. Гауссовское (нормальное) распределение ошибок в линейной модели наблюдений
- •2.3. Числовые характеристики случайных величин и их свойства
- •2.4. Нормальные линейные модели с несколькими объясняющими переменными
- •2.5. Нормальная множественная регрессия: доверительные интервалы для коэффициентов
- •2.6. Доверительные интервалы для коэффициентов: реальные статистические данные
- •2.7. Проверка статистических гипотез о значениях коэффициентов
- •2.8. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
- •2.9. Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерии
- •2.10. Проверка гипотез о значениях коэффициентов: односторонние критерии
- •2.11. Некоторые проблемы, связанные с проверкой гипотез о значениях коэффициентов
- •2.12. Использование оцененной модели для прогнозирования
- •Часть 3. Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках
- •3.1. Проверка адекватности подобранной модели имеющимся статистическим данным: графические методы
- •3.2. Проверка адекватности подобранной модели имеющимся статистическим данным: формальные статистические процедуры
- •3.3. Неадекватность подобранной модели: примеры и последствия
- •3.4. Коррекция статистических выводов при наличии гетероскедастичности (неоднородности дисперсий ошибок)
- •3.5. Коррекция статистических выводов при автокоррелированности ошибок
- •3.6. Коррекция статистических выводов при наличии сезонности. Фиктивные переменные
- •Заключение
- •Список литературы
1.4. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
Вернемся теперь к определению выборочной ковариации и отметим некоторые ее свойства.
Пусть — некоторая постоянная, а— переменные, принимающие в- м наблюдении значения, (n — количество наблюдений). Тогда можно рассматривать как переменную, значения которой в-м наблюденииравно, и
так что
Далее, очевидно, что
и что
Кроме того,
так что
Наконец,
так что
На основе этих свойств, в частности, находим, что
(постоянная не обладает изменчивостью),
(при изменений единицы измерения переменной в раз, во столько же раз изменяется и величина стандартного отклонения этой переменной),
(сдвиг начала отсчета не влияет на изменчивость переменной).
Наконец,
т. е.
(дисперсия суммы двух переменных отличается от суммы дисперсий этих переменных на величину, равную удвоенному значению ковариации между этими переменными).
Что касается выборочного коэффициента корреляции , то еслиизменяются начало отсчета и единица измерения, скажем, переменной, так что вместо значениймы получаем значения
переменной , то тогда
Иными словами, выборочный коэффициент корреляции , инвариантен относительно выбора единиц измерения и начала отсчета переменных и.
В то же время, этого нельзя сказать об оценке коэффициента в модели наблюдений. Действительно, если, скажем, мы переходим к новой единице измерения переменной, так что вместо значенийнаблюдаются значения переменной, то тогда оценкакоэффициента в модели наблюденийравна
Таким образом, изменяя единицу измерения переменной (или переменной), мы можем получать существенно различные значения, от сколь угодно малых до сколь угодно больших. (Желательно выбирать единицы измерения таким образом, чтобы сравниваемые переменные имели одинаковый порядок.) Близость значенийк нулю всегда должна интерпретироваться с оглядкой на используемые единицы измерения переменных и.
Отметим, в этой связи, полезное представление в виде
Действительно,
откуда и вытекает указанное представление. Из этого представления получаем, в частности, что при Var (x) =Var (y) имеет место равенство, и тогда выраженность линейной связи междуи непосредственно отражается в близости значениякили.
Рассмотрим теперь коэффициент корреляции между переменными и, где, аи— оценки наименьших квадратов параметров и гипотетической линейной связи между переменнымии. Замечая, что (т.к.по определению), находим:
Но ранее мы уже получили (при выводе разложения для ) соотношение
которое, с учетом соотношения , приводит к равенству
левая часть которого есть не что иное как
Следовательно,
так что
Последнее соотношение показывает, что коэффициент детерминации равен квадрату коэффициента корреляции между переменными и, так что при достаточно сильно выраженной линейной связи между переменнымии, что соответствует значению, близкому к, оказывается близким ки коэффициент корреляции между переменными и.
По причинам, которые будут ясны из дальнейшего рассмотрения, называютмножественным коэффициентом корреляции (multiple-R, множественный-R).
Отметим также, что переменная измеряетсяв тех же единицах, что и переменная, и при изменении масштаба измерения переменнойзначениене изменяется. Отсюда вытекает, что коэффициент детерминацииR2 инвариантен относительно изменения масштаба и начала отсчета переменныхи.
Заметим, наконец, что
(здесь sign(z)=-1 дляz<0, sign(z)=0 для z=0, sign(z)=1 дляz>0)
Поскольку же
то и
так что
и мы можем установить значение R2 ещедо построения модели линейной связи.
Замечание
Если , тои; если, тои, так чтовсегда