
- •42 «Эконометрика» Глава 3. Анализ статистической зависимости
- •3.1. Анализ линейной статистической связи экономических данных. Корреляция
- •3.1.1. Коэффициент корреляции для выборки и для генеральной совокупности
- •Лабораторная работа № 3.1. Вычисление коэффициентов корреляции в Excel 2000
- •3.2. Проверка гипотез о корреляции случайных переменных
- •Пример 3.2
- •3.3.Парная линейная регрессия
- •3.3.1 Метод наименьших квадратов
- •3.3.2 Свойства оценок мнк
- •3.4. Анализ статистической значимости коэффициентов линейной регрессии
- •Пример 3.2
- •Пример 3.3
- •3.4.1. Функция линейн()
- •3.4.2. Сравнение истинных и оцененных зависимостей
- •3. Вопросы
3.2. Проверка гипотез о корреляции случайных переменных
Далее, в анализе коэффициента корреляции возникает следующий вопрос. Если он равен нулю для генеральной совокупности, это вовсе не значит, что он в точности будет равен нулю для выборки. Наоборот, он обязательно будет отклоняться от истинного значения, но чем больше такое отклонение, тем менее оно вероятно при данном объеме выборки. Таким образом, при каждом конкретном значении коэффициента корреляции величин Х и Y для генеральной совокупности выборочный коэффициент корреляции является случайной величиной. Следовательно, случайной величиной является также любая его функция, и требуется указать такую функцию, которая имела бы одно из известных распределений, удобное для табличного анализа. Для выборочного коэффициента корреляции rтакой функцией являетсяt-статистика, рассчитываемая по формуле
(3.
0)
и имеющая распределение Стьюдента с (n-2) степенями свободы. Число степеней свободы меньше числа наблюдений на 2, поскольку в формулу выборочного коэффициента корреляции входят средние выборочные значенияХиY,для расчета которых используются две линейные формулы их зависимости от наблюдений случайных величин. Сразу уточним, что для коэффициента корреляции будет проверяться нулевая гипотеза, то есть гипотеза о равенстве его нулю в генеральной совокупности. Эта гипотеза отвергается, если выборочный коэффициент корреляции слишком далеко отклонился от нулевого значения, то есть произошло событие, которое было бы маловероятным в случаеXY=0.
Здесь, конечно, очень важно понять, что конкретно значат слова "слишком далеко" и "маловероятное событие". В последнем случае нужно задать вероятность такого события, которая называется в статистике "уровень значимости". Чаще всего задается уровень значимости 1% или 5%. Если для некоторого показателя проверяется гипотеза о том, что его истинное значение равно нулю, то данная гипотеза отвергается в том случае, если оценка показателя по данным выборки такова, что вероятность получения такого или большего (по модулю) ее значения меньше, чем 1% или 5% соответственно.
На рис. 3.3. дана иллюстрация проверки нулевой гипотезы для коэффициента корреляции, которая может быть использована для рассмотрения общей схемы проверки статистических гипотез. Здесь H0- гипотеза о том, что истинное значение коэффициента корреляции равно нулю, альтернативная ей гипотезаH1, - что оно не равно нулю.
Рис. 3.3. Проверка нулевой гипотезы для коэффициента корреляции
Функция fZ - функция плотности вероятности распределения Стьюдента в случае, если нулевая гипотеза верна (она максимальна приZ =0,гдеZ-случайная величина выборочного коэффициента корреляции). Заштрихованная область - это область больших по абсолютной величине (маловероятных при выполнении гипотезыН0) значений выборочного коэффициента корреляции. Если последнее все-таки попало в эту область, тоН0отвергается. Площадь заштрихованной области, равная, -уровень значимости, или вероятность того, что туда попадет величинаZпри выполненииН0.
Пример 3.2
Рассмотрим процедуру и примеры проверки нулевой гипотезы для коэффициента корреляции на конкретном примере. Этот пример поможет показать логику и процедуру проверки статистических гипотез вообще. Взяты 10 наблюдений показателей инфляции и безработицы в США за 1931-1940 годы, для них рассчитан выборочный коэффициент корреляции, составивший -0,227. Связь отрицательная, что соответствует теории (кривая Филлипса), но значима ли она? Проверим гипотезу Н0:=0 о равенстве нулю истинного значения коэффициента корреляции. Для проверки гипотезыН0как уже говорилось, следует использоватьt-статистику сп-2 степенями свободы (1).
Сравнивая определенное по выборочным данным значение статистики tс критическими точками, определяемыми по таблицам распределения Стьюдента, мы можем принять или отвергнуть нулевую гипотезу. В нашем примереt-статистика составляет -0,66. Зададим уровень значимости=0,05, то есть 5%. Критическая (заштрихованная) область состоит из двух одинаковых "хвостов", площадь каждого из которых составляет 0,025. Рассмотрим таблицы вероятности того, что величинаt-статистики превысит уровеньz, то есть попадет в правый "хвост" распределения. Вероятность попасть только в правый "хвост", то есть в одностороннюю критическую область, равна/2, в нашем случае 0,025. Из таблицы найдем, что критическое значение zсоставляет 2,306. Это означает, что мы отвергли бы нулевую гипотезу только если |t|>2,306, а в нашем случае |t|=0,б6. Итак, в нашем случае не исключается, что истинное значение коэффициента корреляции равно нулю, то есть на основе данной выборки не удалось сделать вывод о наличии статистически значимой линейной связи показателей инфляции и безработицы в США. Нельзя, впрочем, здесь сделать вывода и об отсутствии такой связи.