Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
05_Стат_выводы_по_мн_модели.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
253.95 Кб
Скачать

Какие переменные являются значимыми: t-тест для каждого коэффициента

Если F-тест является значимым, то вам известно, что одна или несколько X- переменных могут быть полезны в прогнозировании Y и, следовательно, можно продолжать анализ с помощью t-тестов для отдельных коэффициентов регрессии с целью выяснять, какие именно из Х- переменных действительно полезны. Эти t-тесты определяют, оказывает ли значимое влияние на Y та или иная X- переменная, если все другие Х- переменные остаются при этом неизменными. Следует помнить, что, приняв нулевую гипотезу, вы сделали слабое заключение и, по сути, тем самым не доказали бесполезность Х- переменной, а просто у вас не хватило убедительных доказательств наличия взаимосвязи. Таким образом, взаимосвязь может существовать, но вследствие действия фактора случайности или из-за небольшого размера выборки вы не в состоянии обнаружить ее с по­мощью тех данных, которые имеются в вашем распоряжении.

Если же F-тест не является значимым, то использовать t-тесты для отдель­ных коэффициентов регрессии нельзя. В редких случаях эти t-тесты могут быть значимыми даже тогда, когда F-тест не является значимым. При этом F-тест считается более важным и необходимо делать вывод о том, что все коэффициен­ты являются незначимыми.

t-тест для каждого коэффициента основан на оценке коэффициента регрессии и его стандартной ошибке и использует критическое значение из t-таблицы для «п – k – степеней свободы (где k – количество исследуемых факторов-аргументов). Доверительный интервал для какого-либо конкрет­ного коэффициента регрессии в генеральной совокупности (например, j-го – βj) определяется обычным способом:

от bjtSbj до bj + tSbj ,

где t берется из t-таблицы для «п – k – степеней свободы.

t-тест является значимым, если заданное значение «0» (указывающее на отсут­ствие влияния) не попадает в этот доверительный интервал. Здесь нет ничего но­вого: это обычная процедура для двустороннего тестирования.

Как альтернативный вариант можно сравнить t-статистику bj/Sb со значени­ем из t-таблицы и сделать вывод о значимости, если абсолютное значение этой t-статистики оказывается больше. Если посмотреть на последние значения в каждом из столбцов t-таблицы, можно увидеть достаточно простой, приблизитель­ный способ определения значимости коэффициентов: значимыми будут те коэф­фициенты регрессии, для которых t-статистика по абсолютному значению равна или больше 2, поскольку для достаточно больших п и уровня значимости 5% значение из t-таблицы приблизительно равно 2. Как всегда, оба метода, и на ис­пользовании t-статистики, и на использовании доверительного интервала, долж­ны в любом случае обеспечивать одинаковый результат (значимость или не зна­чимость) для каждого теста.

Что же именно в данном случае тестируется? В результате t-теста для βj; мы должны принять решение, оказывает ли Xj значимое влияние на Y в исследуе­мой генеральной совокупности, когда все другие Х- переменные остаются неиз­менными. В этом случае речь не идет о корреляции между Xj и У, которая игно­рирует все остальные Х- переменные. Скорее, это проверка влияния Xj на Y по­сле внесения поправки на все остальные факторы. Например, в исследованиях уровня заработной платы, цель которых заключается в выявлении возможных фактов дискриминации по признаку пола, обычно делают поправку на уровень образования и стаж работы. Несмотря на то что мужчины в компании могут (в среднем) получать более высокую заработную плату, чем женщины, очень важно понять, не объясняются ли эти различия какими-либо другими факторами, по­мимо пола. В результате включения всех этих факторов в множественную рег­рессию (регрессия Y = заработная плата на X1 = пол, X2 = образование и X3 = стаж работы) коэффициент регрессии для пола будет отражать влияние по­ла на уровень заработной платы с учетом поправок на уровень образования и стаж работы.

Ниже приведены формулы для гипотез, касающихся проверки значимости j-го коэффициента регрессии.

Гипотезы для t-теста j -го коэффициента регрессии

H0 : βj = 0;

H0 : βj 0;

Если вернуться к нашему примеру с тарифами на размещение рекламных объявлений в журналах («Пример. Реклама в журналах»), то соответствующий t-тест будет иметь п – k – 1 = 55 3 1 = 51 степеней свободы. Двустороннее критическое значение из t-таблицы равно 1,960 (или, точнее, 2,008). В табл. 4 приведена соответствующая информация из компьютерной распечатки.

Таблица 8. Результат множественной регрессионного анализа тарифов на размещение рекламы в журналах

ВЫВОД ИТОГОВ

Регрессионная статистика

Множествен. R

0,887

R-квадрат

0,787

Нормированный

R-квадрат

0,775

Стандартная ошибка

21577,870

Наблюдения

55

Коэффициенты

Стандартная ошибка

t-статистика

P-значение

Нижние 95%

Верхние 95%

Y-пересечение

4042,799

16884,039

0,239

0,812

-29853,298

37938,895

Переменная X 1

3,788

0,281

13,484

0,000

3,224

4,352

Переменная X 2

-123,634

137,849

-0,897

0,374

-400,377

153,108

Переменная X 3

0,903

0,370

2,442

0,018

0,161

1,645

Две из трех Х- переменных являются значимыми, поскольку для них р-значения оказываются меньше 0,05. Еще один (эквивалентный) способ проверки значимости заключается в том, чтобы выяснить, какие t-статистики (в компью­терной распечатке соответствующий столбец обозначен просто t) оказываются большими, чем 2,008. И еще один (тоже эквивалентный) способ проверки зна­чимости состоит в том, чтобы выяснить, какие из 95% доверительных интерва­лов для коэффициентов регрессии не включают «0». Как мы и предполагали ранее, величина читательской аудитории оказывает огромное влияние на рекламные тарифы в журналах. Столь высокое значение t (13,48) означает, что влияние ве­личины читательской аудитории на рекламные тарифы является очень высоко значимым (при условии, что процент читателей-мужчин и средний доход оста­ются постоянными). Влияние среднего дохода на рекламные тарифы в журналах также является значимым (при условии, что процент читателей-мужчин и вели­чина читательской аудитории остаются постоянными).

Очевидно, что процент читателей-мужчин не оказывает на тарифы значи­тельного влияния (при условии, что величина читательской аудитории и средний доход остаются постоянными), поскольку соответствующий t-тест не является значимым. Не исключено, что этот процент оказывает на тарифы определенное влияние только через доход (средний доход у мужчин может быть выше, чем у женщин). Таким образом, после внесения поправки на средний доход можно ожидать, что переменная, соответствующая проценту мужчин, уже не будет не­сти дополнительной информации для прогнозирования тарифов. Несмотря на то что оцениваемое влияние процента читателей-мужчин составляет $123,6, его отклонение от 0 носит лишь случайный характер. Строго говоря, этот коэффи­циент, $123,6, не подлежит интерпретации; поскольку он не является значи­мым, вы "не имеете права" объяснять его. Иными словами, его значение ($123,6) — лишь видимость, и, по сути, ничем не отличается от $0,00; более то­го, в действительности вы не можете даже сказать, положительное это число или отрицательное!

Константа, а = $4 043, не является значимой. Она не отличается существенно от нуля. Нельзя сказать ничего определенного и о знаке соответствующего пара­метра генеральной совокупности, а, поскольку его вполне можно считать рав­ным нулю.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]