Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава 8.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
1.35 Mб
Скачать

Глава 8. Оценка спроса: множественный регрессионный анализ

н е может равняться нулю. Следовательно, мы должны провести проверку нулевой гипотезы на равенство нулю параметра при переменной (т.е. #0: р. = 0). Если можно отбросить это предположение, то мы можем быть уверены, что независимая перемен­ная никак не влияет на зависимую переменную. Мы можем проверить это предполо­жение с помощью /-соотношения и соответствующего /-распределения.

t-распределение. Это распределение малых групп значений из неизвестного набо­ра. Подобно нормальному распределению, /-распределение симметрично относитель­но нуля, а площадь под его кривой равна единичной вероятности. Точный размер кривой зависит от числа степеней свободы, рассчитанного как п - к 1, где & -количество независимых переменных, а и — количество наблюдений в выборке. По мере увеличения объема выборки /-распределение приближается к нормальному, и при бесконечно большом числе степеней свободы эти два распределения совпадают. При­ближение к этому пределу происходит довольно быстро. Существует довольно широко применяемое правило, говорящее о том, что нормальное распределение применимо при и > 30.

Как правило, /-статистика и /-распределение применяются для проверки гипотез при уровне статистической значимости а, где а — вероятность ошибки типа 1, обычно принимаемая за 0,05 или 0,01. Для проведения проверки разделим соответствующее t-распределение на три части (рис. 8.4). Точно в середине (что соответствует математи­ческому ожиданию) «вырежем» отрезок, равный (1 — а) от полной вероятности, огра­ниченный слева величиной —/а/2, а справа — величиной +/н/2. Иначе говоря, в каждом «хвосте» остается вероятность ос/2. Вместо этого (что не показано на рисунке) всю величину можно поместить в один «хвост», правый или левый, ограниченный величиной плюс или минус /.

Вероятность = сс/2

Вероятность = ос/2

-t

та/2

та/2

Рис. 8.4. Типичное распределение с Г-критерием по двум «хвостам»

t-тестирование по одному и по двум «хвостам», /-тестирование проводится для про­верки нулевой гипотезы о равенстве нулю коэффициента р.. Если эта гипотеза может быть отвергнута на уровне значимости а, то можно заключить, что переменная X. ста­тистически значима на уровне а.

В основном /-тестирование может проводиться по одному или по двум «хвостам» рас­пределения. В первом случае необходимо выявлять отклонения от нуля только в одном направлении. Например, предположим, что производитель игрушек хочет проверить ут­верждение продавца своей продукции, что среднее время работы батареек в его игрушках составляет 10 ч непрерывной работы. В данном случае продавца не волнует, если среднее время работы будет больше чем 10 ч, но он вернет товар, если случайно в каком-либо образце среднее время работы составит менее 10 ч. Нулевая гипотеза имеет следующий вид: Но: [i= 10. Альтернативная гипотеза есть Н1; ц < 10. Полная площадь несостоятель­ности нулевой гипотезы — левый «хвост» /-распределения. Для множественной регрес­сии тестирование по двум «хвостам» используется для проверки нулевой гипотезы о ра­венстве нулю истинного коэффициента регрессии: HQ: р. = 0. Если можно отвергнуть эту гипотезу, то справедливо утверждение, что независимая переменная не имеет никакого

246

Тестирование и оценка результатов

в лияния на зависимую переменную. Мы можем отвергнуть эту гипотезу, если /"-соотно-| шение падает в любом из «хвостов» /-распределения.

Значение / показывает количество средних квадратичных отклонений от среднего, /-значения, равные +. / _ (см. рис. 8.4), называются критическими значениями t для [проверки по двум «хвостам», /-значения, равные +. /о (не показаны на рисунке), назы­ваются критическими значениями / для тестирования по одному «хвосту». Критиче­ские значения /содержатся в табл. /в Приложении в конце книги. Табл. f представ­ляет собой матрицу, в строках которой расположены степени свободы, а в столбцах — [значения а. Каждая ячейка матрицы содержит критическое значение /, соответствую­щее определенному уровню значимости (заданному числу степеней свободы), которое [определяет /-распределение.

Заголовки столбцов имеют два индекса: верхний, а/2, и нижний, а. Следует отме-|тить, что /-критерий статистической значимости коэффициентов регрессии требует олько сравнения /-соотношения с критическим значением / для выбранного уровня Значимости при соответствующем числе степеней свободы: Если /-соотношение боль-|ше, то мы отвергаем гипотезу, что Р; = 0, и приходим к выводу, что переменная X. Статистически значима на уровне а.

В примере, представленном в табл. 8.2, дано /-соотношение для А^ = 81,942 и |J2 = 9,504. Предположим, мы хотим проверить значимость на уровне 0,01. В табл. F шаходим критическое значение /для а/2 = 0,005 и df = 12. Это значение равно 3,055. пак как оба этих отношения во много раз больше критического значения, мы прихо-|дим к выводу, что обе переменные статистически значимы на уровне 0,01.

Доверительные интервалы для коэффициентов регрессии. Если /-критерий показы­вает, что истинный параметр не равен нулю, все же с некоторым уровнем уверенности ротелось бы знать интервал, в котором лежит истинный параметр. Этот интервал легко |найти, зная коэффициент регрессии, Ь., среднюю квадратичную ошибку коэффициен­та регрессии, Sb! (которая в данном примере рассчитана на компьютере), и соответст-руюшее значение / из табл. F.

Выбрав а (вероятность ошибки типа 1) и определив желаемый уровень доверия 1—а |(вероятность несовершения ошибки типа 1), получаем доверительный интервал для Ь'.

*,±'о/А. (16>

[где Ь. — /-й коэффициент регрессии;

/ — критическое значение для /-статистики по двум «хвостам»; Sbi средняя квадратичная ошибка /-го коэффициента регрессии.

Предположим, что мы хотим получить 95%-ный доверительный интервал для рег­рессионных коэффициентов, представленных в табл. 8.2. Коэффициенты bt и Ь2 содер-атся в компьютерной распечатке. Распечатка также содержит Sbl и Sb2. Так как требу­емый уровень доверия составляет 1 — а, то а = 0,05. Из табл. /получаем /-статистику пя а/2 = 0,025 и df= 12. Это 2,179. Следовательно, для Ь. = 0,496, 95%-ный довери-рельный интервал составляет

0,496 ± (2,179)(0,00605316) = 0,496 ± 0,013189835. Для Ъг = 0,0091989, 95%-ный доверительный интервал составляет

0,0091989 ± (2,179X0,000967909) = 0,0091989 ± 0,002109073.

Произведенные расчеты говорят о следующем: мы можем быть на 95% уверены в ом, что истинное значение pj лежит между 0,483 и 0,509, а истинное значение Р2 ежит между 0,007 и 0,011.

247

г

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]