- •В.П. Носко
- •Оглавление
- •Часть 1.Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов7
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений85
- •Часть 3.Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках180
- •Предисловие
- •Часть 1. Оценивание и подбор моделей связи между переменными без привлечения вероятностно-статистических методов
- •1.1. Эконометрика и ее связь с экономической теорией
- •1.2. Две переменные: меры изменчивости и связи
- •1.3. Метод наименьших квадратов. Прямолинейный характер связи между двумя экономическими факторами
- •1.4. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
- •1.5. «Обратная» модель прямолинейной связи
- •1.6. Пропорциональная связь между переменными
- •1.7. Примеры подбора линейных моделей связи между двумя факторами. Фиктивная линейная связь
- •1.8. Очистка переменных. Частный коэффициент корреляции
- •1.9. Процентное изменение факторов в линейной модели связи
- •1.10. Нелинейная связь между переменными
- •1.11. Пример подбора моделей нелинейной связи, сводящихся к линейной модели.
- •1.12. Линейные модели с несколькими объясняющими переменными
- •Часть 2. Статистические выводы при стандартных предположениях о вероятностной структуре ошибок в линейной модели наблюдений
- •2.1. Вероятностное моделирование ошибок
- •2.2. Гауссовское (нормальное) распределение ошибок в линейной модели наблюдений
- •2.3. Числовые характеристики случайных величин и их свойства
- •2.4. Нормальные линейные модели с несколькими объясняющими переменными
- •2.5. Нормальная множественная регрессия: доверительные интервалы для коэффициентов
- •2.6. Доверительные интервалы для коэффициентов: реальные статистические данные
- •2.7. Проверка статистических гипотез о значениях коэффициентов
- •2.8. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
- •2.9. Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерии
- •2.10. Проверка гипотез о значениях коэффициентов: односторонние критерии
- •2.11. Некоторые проблемы, связанные с проверкой гипотез о значениях коэффициентов
- •2.12. Использование оцененной модели для прогнозирования
- •Часть 3. Проверка выполнения стандартных предположений об ошибках в линейной модели наблюдений. Коррекция статистических выводов при нарушении стандартных предположений об ошибках
- •3.1. Проверка адекватности подобранной модели имеющимся статистическим данным: графические методы
- •3.2. Проверка адекватности подобранной модели имеющимся статистическим данным: формальные статистические процедуры
- •3.3. Неадекватность подобранной модели: примеры и последствия
- •3.4. Коррекция статистических выводов при наличии гетероскедастичности (неоднородности дисперсий ошибок)
- •3.5. Коррекция статистических выводов при автокоррелированности ошибок
- •3.6. Коррекция статистических выводов при наличии сезонности. Фиктивные переменные
- •Заключение
- •Список литературы
1.4. Свойства выборочной ковариации, выборочной дисперсии и выборочного коэффициента корреляции
Вернемся теперь к определению выборочной ковариации и отметим некоторые ее свойства.
Пусть
— некоторая постоянная, а
—
переменные, принимающие в
-
м наблюдении значения
,
(n — количество наблюдений). Тогда
можно рассматривать как переменную,
значения которой в
-м наблюдении
равно
,
и
![]()
так что
![]()
Далее, очевидно, что
![]()
и что
![]()
Кроме того,
![]()
так что
![]()
Наконец,

так что
![]()
На основе этих свойств, в частности, находим, что
![]()
(постоянная не обладает изменчивостью),
![]()
(при изменений
единицы измерения переменной в
раз, во столько же раз изменяется и
величина стандартного отклонения этой
переменной),
![]()
(сдвиг начала отсчета не влияет на изменчивость переменной).
Наконец,
![]()
т. е.
![]()
(дисперсия суммы двух переменных отличается от суммы дисперсий этих переменных на величину, равную удвоенному значению ковариации между этими переменными).
Что касается
выборочного коэффициента корреляции
,
то еслиизменяются начало отсчета
и единица измерения, скажем, переменной
,
так что вместо значений
мы получаем значения
![]()
переменной
,
то тогда

Иными словами,
выборочный коэффициент корреляции
,
инвариантен относительно
выбора единиц измерения и начала отсчета
переменных
и
.
В
то же время, этого нельзя сказать об
оценке
коэффициента
в модели
наблюдений
.
Действительно, если, скажем, мы
переходим к новой единице измерения
переменной
,
так что вместо значений
наблюдаются значения переменной
,
то тогда оценка
коэффициента
в модели наблюдений
равна
![]()
Таким образом,
изменяя единицу измерения переменной
(или переменной
),
мы можем получать существенно различные
значения
,
от сколь угодно малых до сколь угодно
больших. (Желательно выбирать единицы
измерения таким образом, чтобы сравниваемые
переменные имели одинаковый порядок.)
Близость значений
к нулю всегда должна интерпретироваться
с оглядкой на используемые единицы
измерения переменных
и
.
Отметим, в этой
связи, полезное представление
в виде
![]()
Действительно,
![]()
откуда и вытекает
указанное представление. Из этого
представления получаем, в частности,
что при Var (x) =Var (y) имеет
место равенство
,
и тогда выраженность линейной
связи между
и
непосредственно отражается в близости
значения
к
или
.
Рассмотрим теперь
коэффициент корреляции
между переменными
и
,
где
,
а
и
— оценки наименьших квадратов параметров
и
гипотетической линейной связи между
переменными
и
.
Замечая, что
(т.к.
по определению), находим:

Но ранее мы уже
получили (при выводе разложения для
)
соотношение
![]()
которое, с учетом
соотношения
,
приводит к равенству
![]()
![]()
левая часть которого есть не что иное как
![]()
Следовательно,
![]()
так что
![]()
Последнее соотношение
показывает, что коэффициент детерминации
равен квадрату коэффициента корреляции
между переменными
и
,
так что при достаточно сильно выраженной
линейной связи между переменными
и
,
что соответствует значению
,
близкому к
,
оказывается близким к
и коэффициент корреляции между переменными
и
.
По причинам, которые
будут ясны из дальнейшего рассмотрения,
называютмножественным коэффициентом
корреляции (multiple-R,
множественный-R).
Отметим также, что
переменная
измеряетсяв тех же единицах, что и
переменная
,
и при изменении масштаба измерения
переменной
значение
не изменяется. Отсюда вытекает, что
коэффициент детерминацииR2 инвариантен
относительно изменения масштаба и
начала отсчета переменных
и
.
Заметим, наконец, что

(здесь sign(z)=-1 дляz<0, sign(z)=0 для z=0, sign(z)=1 дляz>0)
Поскольку же
![]()
то
и
![]()
так что
![]()
и мы можем установить значение R2 ещедо построения модели линейной связи.
Замечание
Если
,
то
и
;
если
,
то
и
,
так чтовсегда ![]()
