Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Маркетинговые исследования / Часть 6 / Приложения главы 19

.doc
Скачиваний:
34
Добавлен:
01.05.2014
Размер:
202.75 Кб
Скачать

Рассмотрим последний пример, когда полагается верным =0,25. В данном случае нулевая гипотеза =0,2 оказывается «совсем не той», и мы должны ожидать, что шанс не отвергнуть ее будет очень небольшим, следовательно, почти невозможна и ошибка второго рода. Вероятность ошибки определяется величиной 0,0856, и ожидание, о котором говорилось выше, подтверждается.

В таблице 19а.3 показана мощность проверки для других выборочных состояний генеральной совокупности.

и она подтверждает, что чем дальше верное значение я находится от значения, определяемого гипотезами в направлении, указываемом альтернативной гипотезой, тем выше мощность. Следует заметить, что мощность не определяется для гипотетического значения, поскольку, если верное значение действительно равно определяемому гипотезой, совершить ошибку невозможно.

Заметим, что поскольку мощность является функцией, а не единственным значением, исследователю, пытающемуся сбалансировать ошибки первого и второго рода, логично задаваться вопросом, какой должна быть вероятность того, что нулевая гипотеза неверна, и он должен соответствующим образом устанавливать правило принятия решения.

Таблица 19а.3

Ошибка и мощность для различных предполагаемых верными значений я и гипотез и

Значение

Вероятность ошибки второго рода или

Мощность проверки: 1-

0,20

(0,950)= 1-

(0,05)=

0,21

0,8413

0,1587

0,22

0,6480

0,3520

0,23

0,4133

0,5867

0,24

0,2133

0,7867

0,25

0,0856

0,9144

0,26

0,0273

0.9727

0,27

0,0069

0,9931

0,28

0,0014

0,9986

0,29

0,0005

0,9995

0,30

0,0000

1,0000

Способ контроля обеих ошибок в заранее предсказываемых границах для заданного эффективного объема выборки позволяет варьировать этот объем. Необходимость специфицировать сразу все три составляющие — ошибку а (или степень доверия), ошибку (или мощность) и эффективность, которую требуется определить, — вероятнее всего и объясняет, почему так много исследователей ограничивается спецификацией ошибки первого рода или ошибки , и позволяют ошибке оказываться такой, как получится.

Неумение хотя бы побеспокоиться о далеко не явно принимаемой в расчет мощности представляет собой одну из фундаментальных проблем классической статистики в части применения проверки гипотез в том виде, как она обычно практикуется в маркетинговых исследованиях. Кроме того, ошибки второго рода зачастую сопряжены с более существенными издержками, чем ошибки первого рода. Другая общая проблема состоит в широко распространенной тенденции неправильной интерпретации «статистически значимого результата». Имеет место несколько неверных интерпретаций, общих для многих. Одна из наиболее частых неверных интерпретаций представляет собой рассмотрение некоторого значения р как вероятности того, что результаты являются следствием ошибки в определении выборки. Так, обычно используемое р =0,05 принимается в качестве обозначения того, что с вероятностью только 0,05 результаты оказываются случайными, следовательно, должна существовать какая-то приведшая к ним фундаментальная причина. На самом деле, значение р, равное 0,05, означает, что если — и это очень большое «если» — нулевая гипотеза верна, то разногласия составляют всего 1 на 20 выборочных результатов для той величины, которая наблюдалась. К сожалению, в классической проверке статистической значимости нет способа, позволяющего установить, верна ли нулевая гипотеза.

Значение , получаемое классическими методами, не является какой-то сводной характеристикой данных. Не говорит значение р, привязываемое к какому-то результату, и о том, насколько силен или зависим этот конкретный результат... И писателям, и читателям слишком уж нравится читать 0,05, как (H/E), «вероятность того, что Hypothesis (гипотеза) верна при заданной Evidence (доверительности)». Учебники по статистике не устают твердить, но, по-видимому, тщетно, что это (Е/Н), т.е. вероятность того, что данная доверительность будет иметь место, если (нулевая) гипотеза верна.

Другая распространенная неправильная интерпретация состоит в том, что ставится знак равенства между статистической и практической значимостями. Многие не в состоянии осознать, что какое-то различие может быть практически важным, но статистически недостаточно значимым, если слаба мощность проверки. И наоборот, когда объем выборки очень велик, результат может не иметь практического значения, даже если его статистическая значимость высока.

Третья очень часто встречающаяся неправильная интерпретация характеризуется тем, что выбранный уровень а или р считается каким-то образом связанным с вероятностью того, что исследовательская гипотеза, обычно трактуемая как альтернативная, верна. Самый типовой случай представляет собой принятие этой вероятности в качестве дополнения уровня а. Так, значение р, равное 0,05, интерпретируется, как означающее, что его дополнение 1—0,05=0,95 является вероятностью того, что исследовательская гипотеза верна. «Из этой неправильной интерпретации возникает практика представления р как меры для степени обоснованности результатов исследования, т. е. такое значение, как р<0,0001, является "высоко статистически значимым" или "высоко значимым", а поэтому и более обоснованным, чем значение р, равное, скажем, 0,05». Обе эти родственные одна другой интерпретации неверны.

Единственное логическое заключение, которое может быть выведено, когда нулевая гипотеза отвергается при каком-то заранее определенном уровне р, состоит в том, что ошибка определения выборки вряд ли является объяснением результатов, если данная нулевая гипотеза верна. Многие варианты подходов говорят не так уж много, поскольку, как мы только что согласились, нулевая гипотеза является чем-то вроде соломенного пугала; она устанавливается таким образом, чтобы оказаться неверной. Нуль, как обычно заявляется, удерживается таким образом, чтобы не было никакой взаимосвязи между, скажем, двумя переменными, или чтобы группы были равны в отношении какой-то конкретной переменной. И все же мы в действительности в это не верим. Скорее, мы исследуем взаимосвязь между переменными, поскольку уверены, что какая-нибудь связь между ними есть, и мы противопоставляем группы, поскольку уверены, что они отличаются одна от другой в отношении переменной. Более того, мы можем контролировать свою способность отвергать нулевую гипотезу просто по мощности, на которую настраиваем статистическую проверку, главным образом за счет объема используемой для проверки выборки. «При заданной значимо высокой статистической мощности можно, в сущности, всегда ожидать точного заключения о том, что нулевая гипотеза неверна».

Коль это так, маркетинговым исследователям необходимо быть осторожными при интерпретации результатов своих процедур проверки гипотез, чтобы не дезориентировать себя и других. Они постоянно должны иметь в виду оба рода ошибок, которые можно допустить. Кроме того, они должны обеспечивать уверенность в том, что не дают неверную интерпретацию того, что обнаруживает проверка значимости. Она представляет собой не более чем проверку нулевой гипотезы. Один полезный способ, позволяющий избегать неправильной интерпретации, состоит в том, чтобы рассчитывать, когда это возможно, доверительные интервалы, так как это дает лицам, принимающим решения, много лучшее ощущение того, в какой мере они могут полагаться на результаты.

Проверка значимости во многом является делом получения ответа «да» или «нет»: выборочный результат либо статистически значим, либо нет. С другой стороны, «доверительный интервал не только дает ответ "да" или "нет", но также, благодаря определению его ширины, предоставляет некоторую определенность в том, стоит ли оглашать этот ответ во весь голос или предпочесть озвучить его шепотом». Тогда как не каждая проверка значимости может быть представлена в форме оценки доверительного интервала, многие из них предоставляют такую возможность, поэтому настоятельно рекомендуется использовать их именно в этой форме при любой благоприятной возможности.

Соседние файлы в папке Часть 6