Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
05_Стат_выводы_по_мн_модели.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
253.95 Кб
Скачать

Статистические выводы по многофакторной модели.

11

Тема: «Статистические выводы по многофакторной модели»

Насколько хороши наши прогнозы? Этот раздел следует рассматривать в основном как обзор, поскольку стан­дартное отклонение оценки, Se , и коэффициент детерминации, R2, имеют для множественной регрессии, вообще говоря, ту же интерпретацию, что и для про­стой регрессии. Единственное отличие заключается в том, что ваши прогнозы теперь базируются на нескольких X- переменных. Но все остается очень похоже, поскольку вы по-прежнему прогно­зируете только одну переменную Y.

Типичная ошибка прогнозирования: стандартная ошибка предсказания.

Как и в случае простой регрессии, когда мы имеем дело лишь с одной X-переменной, стандартная ошибка оценки (предсказания) указывает приблизительную величину ошибок прогнозирования.

Возвращаясь к нашему примеру с тарифами на раз­мещение рекламы в журналах, Se = $21578. Это говорит о том, что фактиче­ские тарифы на размещение рекламы в этих журналах, как правило, отклоня­ются от прогнозируемых тарифов не более чем на $21578 (речь идет о стандарт­ном отклонении). Иными словами, если распределение ошибок является нормальным, то можно ожидать, что примерно 2/3 фактических тарифов будут находиться в пределах Se от прогнозируемых тарифов; примерно 95% — в пре­делах 2Se и т.д.

Эта стандартная ошибка оценки, Se = $21578, указывает остаток вариации та­рифов после того, как вы использовали Х- переменные (величина читательской ау­дитории, процент мужчин и медиана дохода) в уравнении регрессии для прогнози­рования тарифов каждого журнала. Сравните этот показатель с обычным стан­дартным отклонением одной переменной для тарифов, SY = $45446, вычисленным без использования других переменных. Это стандартное отклонение, SY, указывает остаток вариации тарифов после того, как вы использовали для прогнозирования тарифов каждого журнала только значение У. Заметьте, что Se = $21578 мень­ше, чем SY = $45446; ошибки, как правило, оказываются меньше, если для про­гнозирования тарифов использовать уравнение регрессии, а не просто . Как ви­дите, Х- переменные полезны для объяснения размеров тарифов.

Это можно представить себе следующим образом. Если вам ничего неизвестно об Х- переменных, вы будете использовать в качестве оптимальной приблизи­тельной оценки среднее значение тарифа ( = $83534) и будете ошибаться при­близительно на SY = $45446. Но если вам известны такие характеристики, как величина читательской аудитории, процент мужчин и средний доход, то для прогнозирования тарифов можно воспользоваться уравнением регрессии; в этом случае вы ошибетесь примерно на Se = $21578. Такое сокращение ошибки про­гнозирования (с $45446 до $21578) и является одним из преимуществ исполь­зования регрессионного анализа.

Объясненный процент вариации: r2

Коэффициент детерминации (часто также используют термин «квадрат множественной корреляции»), R2,указывает, какой процент вариации Y объясняется влиянием всех Х- переменных.

Если вернуться к нашему примеру с тарифами на размещение рекламы в журналах, то коэффициент детерминации, R2 = 0,787, или 78,7%, указывает на то, что независимые переменные (Х- переменные величины читательской аудито­рии, процент мужчин и средний доход) объясняют 78,7% вариации тарифов. При этом 21,3% остаются необъясненными и связываются с влиянием других факторов. 78,7% — довольно большое значение R2; во многих исследованиях приходится работать со значительно меньшими величинами, которые, тем не менее, обеспечивают достаточно качественные прогнозы. Желательно, чтобы значение R2 было как можно большим (большие значения R2 свидетельствуют о том, что исследуемая взаимосвязь является достаточно сильной). В идеальном случае R2 = 100%; это возможно лишь в том случае, когда все ошибки прогно­зирования равны 0 (что, как правило, свидетельствует о наличии ошибок в дру­гом месте!).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]