Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Маркетинговые исследования / Часть 6 / Приложения главы 19

.doc
Скачиваний:
34
Добавлен:
01.05.2014
Размер:
202.75 Кб
Скачать

ПРИЛОЖЕНИЯ

Приложение 19а

Проверка гипотез

В главе 19 мы обсудили этапы предварительного анализа данных, а именно: редактирование, кодирование и табулирование. В этой главе продемонстрированы важность и потенциальная значимость этих предварительных процедур, которые общеприняты почти для всех исследований. Некоторые исследования останавливаются на табуляции и перекрестной табуляции. Однако во многих других предпринимается дальнейший анализ, в частности, формальная проверка статистической гипотезы или установление доверительного интервала. Данное приложение представляет собой обзор соответствующих процедур.

Когда рыночники готовятся к проведению исследования, они, как правило, начинают с моделирования ситуации или предположения, касающегося какого-то явления в окружающей их обстановке. «Держу пари, — может сказать менеджер по рекламе директору по маркетингу, — если бы мы наняли какого-нибудь знаменитого гения для продвижения нашего шампуня, объем продаж мог бы возрасти». Или менеджер по торговле может сказать руководителю службы финансов:

«Если бы мое подразделение имело больше денег, которые можно потратить на обучение, наши люди работали бы более продуктивно».

В маркетинге, как и других научных областях, такие ничем не доказанные предположения называются гипотезами. Пользуясь статистическими приемами, мы очень часто можем установить, существует ли эмпирическое доказательство, подтверждающее такие гипотезы. Многие обсуждаемые в следующих нескольких главах процедуры используются именно для проверки специфических гипотез. По этой причине полезно дать обзор некоторых» понятий, которые составляют основу проверки гипотез в классической теории статистики, таких как формирование нулевой гипотезы, установление риска ошибки принятия неправильного решения и общие этапы выполнения проверки гипотез.

НУЛЕВАЯ ГИПОТЕЗА

Маркетинговые исследования не могут доказать результаты. В лучшем случае на базе наблюденных результатов они в состоянии указать, какая из двух взаимоисключающих гипотез с большей вероятностью соответствует истине. Общая форма этих двух гипотез

и соответствующая им символика выглядят следующим образом:

Н0 это гипотеза, суть которой состоит в тон, что наши результаты не показывают никакого значимого различия между группами генеральной совокупности вне зависимости от измеряемых факторов.

Наальтернативная гипотеза, в соответствии с которой предполагается, что различия, показываемые нашими результатами, отражают действительные различия между группами генеральной совокупности.

Первая из этих гипотез, Н0, называется нулевой гипотезой. В основе статистической проверки гипотезы лежит одно простое обстоятельство: гипотеза может быть отвергнута, но никогда не должна приниматься иначе, как пробная, поскольку дополнительные данные могут доказать ее несостоятельность. Другими словами, отвергнуть или не отвергать гипотезу можно только на базе имеющихся под рукой данных. Однако неправильным является и заключение, что коль скоро гипотеза не отвергнута, ее необходимо принимать как обоснованную.

Эту ситуацию можно проиллюстрировать на очень простом качественном примере. Пусть мы решили проверить гипотезу, беден ли Джон До. Мы видим, что До обедает в дешевых ресторанах, живет в районе городских трущоб в разваливающемся доме, одет в поношенную, драную одежду и т. д. Хотя его поведение явно соответствует стилю жизни бедного человека, мы не можем принять гипотезу о его бедности. Не исключено, что До в действительности богат, но чрезмерно скареден. Мы можем продолжить сбор информации об этом человеке, но на данный момент должны принять решение не отвергать гипотезу. Например, одно-единственное наблюдение, которое указывает на принадлежность ему шестизначного счета в банке или владение 100000 акций AT&T, потребует немедленно отвергнуть эту гипотезу и признать, что Джон До богат.

Итак, исследователям необходимо осознавать, что в условиях отсутствия безупречной информации (в случае исследования выборок это вполне естественно) лучшее, что они могут себе позволить, — сформулировать гипотезы или предположения о том, что можно считать истиной. В дальнейшем их заключения в отношении этих предположений могут оказаться неверными, поэтому всегда есть некоторая вероятность ошибки принятия любой гипотезы. На языке статистики исследователи совершают ошибку первого рода, когда они отвергают верную нулевую гипотезу и, следовательно, принимают альтернативную; они совершают ошибку второго рода, когда не отвергают ложную нулевую гипотезу, которую должны бы были признать неверной. Для целей проверки нулевая гипотеза предполагается верной. Такое предположение позволяет выяснить, каким образом могут варьировать различные оценки выборки, которые получаются в рамках плана определения самих выборок. При этом исследователям необходимо отдавать себе отчет в том, что ошибки первого рода можно ограничивать какой-то специально назначаемой величиной (например, J0,05), тогда как ошибки второго рода оказываются в таком случае их некоторыми функциями.

Краткое резюме этого обсуждения сводится к тому, что исследователю необходимо сформулировать нулевую гипотезу так, чтобы отказ от нее приводил к желательному заключению, т. е. к какому-то утверждению или условию, справедливость либо возможность существования которого он или она желает верифицировать. Предположим, например, что какая-то фирма рассматривает введение новой продукции, на которое считает возможным пойти, если это позволит обезопасить более 10% рынка. Правильная формулировка гипотез должна выглядеть следующим образом:

Если данные приводят к отказу от гипотезы Н0, то исследователь будет в состоянии «принять» альтернативную гипотезу, заключающуюся в том, что благодаря этой продукции можно ожидать укрепления 10% рынка, и она должна быть введена, поскольку такой результат был бы невозможен, окажись нулевая гипотеза в самом деле верной. Если Н0 отвергнута быть не может, то продукцию вводить не следует, пока не будут получены дополнительные доказательства противного. Например, приведенная выше формулировка означает использование однонаправленной статистической проверки в том смысле, что альтернативная гипотеза выражена направленно, т. е. требует, чтобы величина оценки была больше 0,10. В маркетинговых исследованиях, как правило, используется именно однонаправленная проверка, хотя существует немало проблем, для решения которых вполне оправдана двунаправленная проверка; например, рыночная доля, достигаемая продукцией Х нового поколения не должна отличаться от доли, приходившейся на ту же продукцию прежнего поколения, которая составляла 10%. Двунаправленная проверка будет выражаться как:

Здесь нет направления, оговариваемого альтернативной гипотезой; доля устанавливается просто заданием неравенства 0,10.

Использование в маркетинговых исследованиях однонаправленной проверки имеет более широкое применение, чем двунаправленной, по двум причинам. Во-первых, в этих исследованиях обычно подчеркивается какое-то предпочтительное направление на результат, например более солидную долю рынка, более высокое качество продукции или сокращение издержек, причем, чем ниже — тем лучше. Двунаправленная альтернативная гипотеза находит применение в тех случаях, когда предпочтения в направлении нет или когда исследованием ставится цель продемонстрировать существование какого-то различия, а не его направления. Во-вторых, однонаправленная проверка, когда она приемлема, оказывается более мощной, чем двунаправленная альтернатива.

ДВА РОДА ОШИБОК

Поскольку результат статистической проверки нулевой гипотезы состоит в том, чтобы отвергнуть ее либо не отвергать, возможны два рода ошибок. Во-первых, нулевая гипотеза может быть отвергнута, когда она верна. Во-вторых, она может быть принята, когда является неверной. Эти две ошибки называются соответственно ошибкой первого рода и ошибкой второго рода, или ошибкой α и ошибкой β, так как буквами α и β обозначаются вероятности, ассоциируемые с появлением этих ошибок. Ошибки двух родов не являются дополняющими друг друга (т. е. ).

Для иллюстрации ошибки каждого рода и демонстрации того, что их вероятности не являются дополнениями одна другой, рассмотрим одну юридическую аналогию. Поскольку, согласно уголовному праву США, любое лицо является невиновным, пока вина не доказана, судья и присяжные всегда проверяют гипотезу о невиновности. Фактически подсудимый может быть либо виновным, либо невиновным, но, базируясь на свидетельствах, суд может прийти к вынесению любого вердикта вне зависимости от истинной ситуации. Возможности представлены в таблице 19а.1. Если подсудимый невиновен и присяжные находят его невиновным, либо если он виновен и присяжные находят его виновным, они принимают правильное решение. Если, однако, подсудимый действительно невиновен, а присяжные признают его виновным, то они совершают ошибку, как и в случае, если подсудимый виновен, но признается невиновным. Присяжные вынуждены пойти по тому или другому пути, и поэтому вероятности их решений должны давать в сумме 1 по вертикали таблицы. Таким образом, если мы обозначаем через вероятность неправильного определения лица виновным, когда это лицо невиновно, то разность 1- должна быть вероятностью правильного определения его виновным. Точно так же, и 1- представляют вероятности признания невиновности и виновности, когда подсудимый виновен. Интуитивно очевидно, что сумма + не равна 1, хотя дальнейшее обсуждение покажет, что? должна возрастать при уменьшении , когда все прочее остается тем же самым. Поскольку наше общество в основном придерживается мнения, что признание невиновного лица виновным является более серьезной ошибкой, чем признание виновного невиновным, в системе юриспруденции ошибку стремятся уменьшить как можно больше, что реализуется в требовании доказательства вины «без каких бы то ни было обоснованных сомнений».

В таблице 19а.2 представлен общий подход к исследованию соответствующей ситуации. Так же как присяжным неизвестен истинный статус обвиняемого, исследователь тоже не знает истинную ситуацию в отношении принятой им нулевой гипотезы. Параллели дилеммы исследователя в смысле ситуации, в которой оказываются присяжные, состоят в том, что он тоже ограничен информацией, имеющейся в его распоряжении. Предположим, что нулевая гипотеза верна. Если исследователь приходит к заключению, что она неверна, им допускается ошибка первого рода (ошибка ). Уровень значимости, ассоциируемый со статистической проверкой, указывает вероятность, с которой может быть допущена эта ошибка. Поскольку выборочная информация всегда в каком-то отношении неполна, будет оставаться место и для какой-то ошибки . Единственный способ избежать ее состоит в том, чтобы никогда не отвергать нулевую гипотезу (никогда не признавать никого виновным, если вернуться к юридической аналогии). Уровень доверия статистической проверки представляется разностью 1-, и чем большего доверия статистическому результату мы желаем добиться, тем ниже должны устанавливать величину ошибки . Мощность, ассоциируемая со статистической проверкой, — это вероятность правильного непризнания неверной нулевой гипотезы. Однонаправленные проверки характеризуются большей мощностью, чем двунаправленные, поскольку при одной и той же ошибке к они просто с большей вероятностью приводят к отказу от неверной нулевой гипотезы. Ошибка представляет собой вероятность того, что неверная нулевая гипотеза не будет отвергнута. Не существует какого-то единственного в своем роде значения, которое ассоциируется с ошибкой .

Таблица 19а.1

Юридическая аналогия, иллюстрирующая ошибку решения

Вердикт

Истинная ситуация: Обвиняемый

Невиновен

Виновен

Невиновен

Верное решение: вероятность = 1-

Ошибка: Вероятность =

Виновен

Ошибка: вероятность =

Верное решение:

Вероятность = 1–

Таблица 19а.2

Роды ошибок при проверке гипотез

Заключение исследователя

Истинная ситуация: Нулевая гипотеза

Верна

Неверна

не отвергается

Верное решение Уровень доверия Вероятность =1-

Ошибка: Второго рода Вероятность =

отвергается

Ошибка: Первого рода Уровень значимости Вероятность =

Верное решение Мощность проверки Вероятность =1-

ПРОЦЕДУРА

Взаимосвязь между двумя родами ошибок лучше всего проиллюстрировать примером, и этот пример окажется особенно продуктивным, если разработать следующую общую форму проверки гипотез. В исследовательском окне 19а.1 показана характерная последовательность этапов, которых придерживаются исследователи при проверке гипотез. Допустим, что проблема в самом деле одна из тех, в которых изучаются потенциальные возможности новой продукции, а само исследование сосредоточено на проверке предпочтений покупателей. Предположим, что по соображениям менеджмента эта продукция не должна вводиться, если нельзя ожидать, что по крайней мере 20% населения отдадут ей предпочтение и что исследованием предусматривается обращение с вопросом о предпочтении к 625 респондентам.

ЭТАП 1. Нулевой и альтернативной гипотезами должны быть:

Эти гипотезы сформулированы таким образом, что если нулевая гипотеза отвергается, то продукцию необходимо вводить.

ЭТАП 2. Подходящей выборочной статистикой является выборочная доля, а распределение всех возможных выборочных долей, соответствующих плану определения выборки, базируется на предположении, что нулевая гипотеза верна. Хотя распределение выборочных долей теоретически подчиняется биноминальному закону, большой объем выборки позволяет использовать нормальную аппроксимацию. Следовательно, приемлема z-проверка. Статистика z в этом случае равна:

где p выборочная доля предпочтения продукции, — стандартная ошибка доли или стандартное отклонение распределения выборочных p. В свою очередь, равно:

где n объем выборки. Заметим эту характерную особенность долей. Как только мы приняли какую-то гипотезу в отношении значения их оценки для генеральной совокупности, необходимо что-то сказать и о стандартной ошибке этой оценки. Доля является наиболее четко очерченным примером «известного разброса», поскольку разброс специфицируется автоматически предполагаемым значением. Исследователь, таким образом, знает все величины, необходимые для расчета z, за исключением p, еще до того, как займется выборкой, а в дальнейшем априори знает распределение, к которому будет относиться рассчитываемая статистика. В общем, это верно, поэтому, прежде чем браться за выборку, исследователь должен четко представлять себе, что существуют именно эти условия.

ЭТАП 3. Исследователь выбирает уровень значимости (), исходя из следующих соображений. В данной ситуации ошибка а есть вероятность отказа от гипотезы принятия , когда в действительности . Такое заключение будет приводить компанию к решению о выходе на рынок с новой продукцией. Однако поскольку этот шаг окажется прибыльным, только если , неправильное решение о выходе на рынок не даст финансовой прибыли и, вероятно, обернется бедствием. По этой причине вероятность ошибки первого рода должна быть минимизирована, насколько это возможно. Хотя исследователь отдает себе отчет в том, что вероятность ошибки второго рода с уменьшением а возрастает, все остальное продолжает оставаться равнозначным. В данном случае ошибка второго рода заставляет заключить, что , тогда как фактически , из чего, в свою очередь, следует, что компания должна выложить на стол решение о введении продукции, поскольку это выглядит прибыльным. Возможность потерь в результате такой ошибки может оказаться весьма серьезной. Хотя, как будет пояснено позднее, исследователь не знает, каким будет значение , ему или ей известно, что и взаимосвязаны и что чрезмерно низкое значение , скажем, 0,01 или 0,001, будет приводить к недопустимым ошибкам . Поэтому, в качестве компромисса, исследователь решает останавливаться на уровне порядка 0,05.

Исследовательское окно 19а.1

Типовая процедура проверки гипотез

ЭТАП 4. Поскольку на этапе 4 выполняется расчет статистики проверки, к нему можно приступать только после определения выборки и сбора информации. Предположим, что из 625 респондентов выборки 140 отдали предпочтение рассматриваемой продукции. Следовательно, выборочная доля p = 140/625 = 0,224. Основной вопрос, требующий ответа, концептуально касается самой выборки: не слишком ли велико это значение p с точки зрения шанса его получения на генеральной совокупности в предположении, что я должно быть равно 0,2? Или, другими словами, какова вероятность получения p = 0,224 при = 0,2? Статистика проверки z равна:

ЭТАП 5. Вероятность получения значения г. равным 1,500 может быть найдена по стандартным табулированным значениям площадей, очерчиваемых кривой нормального распределения (см. таблицу 1 в конце книги).

ЭТАП 6. Так как рассчитанная вероятность возникновения рассматриваемой ситуации выше специфицированного уровня значимости =0,05, нулевая гипотеза не отвергается. Продукция не должна выводиться на рынок, поскольку, хотя данные дают обоснование в правильном направлении, этого недостаточно для вывода «без какого бы то ни было сомнения», что >0,2. Если тот, кто принимает решение, в состоянии допустить 10% риск ошибки первого рода, то нулевая гипотеза была бы отвергнута и продукция пошла бы на рынок, так как вероятность получения выборочного р=0,224 при верной =0,2 составляет, как мы видели, 0,0668.

МОЩНОСТЬ

Этот пример иллюстрирует важность правильного назначения риска ошибки. Если бы был допустим 10% риск ошибки и, а исследователь специфицировал =0,05, потенциальная возможность получения прибыли осталась бы нерассмотренной. Выбор правильного уровня значимости влечет за собой необходимость взвешивания затрат, ассоциируемых с двумя родами ошибок, что, к сожалению, игнорируется большинством исследователей, которые останавливают выбор на =0,10 или 0,05 просто по привычке. Вероятно, это упущение связано с трудностью спецификации ошибки или ошибки второго рода.

Трудности объясняются непостоянством ошибки . Не следует забывать, что это есть вероятность не отвергнуть неверную нулевую гипотезу. Следовательно, вероятность совершения ошибки второго рода зависит от величины разности между верным, но неизвестным значением для генеральной совокупности, и значением, которое предполагается верным согласно нулевой гипотезе. Все остальное продолжает оставаться равнозначным, поэтому мы должны отдавать предпочтение проверке, которая минимизирует эти ошибки. Возможен и альтернативный подход. Поскольку мощность проверки равна 1-, мы должны предпочитать проверку, обладающую наибольшей мощностью, т. е. мы будем иметь наилучший шанс отвергнуть неверную нулевую гипотезу. Итак, совершенно очевидно, что наша способность поступить надлежащим образом зависит от того, «насколько действительно неверна H0».Если она может быть «чуть-чуть неверной» или «совсем не той», то вероятность неправильного включения будет определенно более высокой в первом случае. Разность между предполагаемым значением в рамках нулевой гипотезы и верным, но неизвестным значением носит название эффективного объема выборки. Интуитивно можно допустить, что большие эффективности распознаются проще, чем малые.

Еще раз рассмотрим гипотезы:

где, как и прежде, =0,0160 и =0,05. Любое расчетное значение z, большее, чем 1,645, вынудит нас отвергнуть эту гипотезу, поскольку это как раз такое значение z, которое отсекает 5% площади кривой нормального распределения. Значение z, которое может быть равно критической выборочной доле, определяется формулой:

или р=0,2263. Итак, любая выборочная доля, большая, чем р=0,2263, будет приводить к отказу от гипотезы, в соответствии с которой <0,2. Это означает, что если 142 или более [0,2263(625) =141,4] выборочных респондентов предпочитают новую продукцию, то нулевая гипотеза будет отвергнута, и продукция должна быть выведена на рынок, тогда как, если ее предпочитают 141 или менее выборочных респондентов, нулевая гипотеза отвергнута быть не может, и вводить новую продукцию не следует.

Вероятность выборочной доли р=0,2263 много выше для некоторых определенных значений р, чем для всех остальных. Предположим, например, что верное, но неизвестное значение =0,22. Распределение выборочной доли опять таки нормально, но теперь кривая центрируется около значения 0,22.Вероятность получения критической выборочной доли р=0,2263 и для этого условия определяется по таблице кривой нормального распределения, однако теперь.

Заштрихованная площадь между и z=0,380 задается в таблице 1, которую можно найти в конце книги, и равняется 0,6480, а площадь справа от z=0,380 равна 1,000-0,6480=0,3520. Это также есть мощность проверки того, что если р в действительности равно 0,22, то нулевая гипотеза неверна, а 0,3520 — это вероятность того, что нулевая гипотеза будет отвергнута. И наоборот, вероятность того, что р<0,2263, равна 1-0,3520=0,6480 и представляет собой вероятность ошибки . Нулевая гипотеза неверна, и все же неверная нулевая гипотеза не отвергается при любой выборке, для которой р<0,2263.

Предположим, что верное состояние генеральной совокупности определяется значением =0,21, тогда как нулевая гипотеза остается прежней . Поскольку в этом втором случае нулевая гипотеза «менее верна», мы можем ожидать того, что мощность уменьшится, а риск ошибки возрастет, поскольку менее вероятен отказ от нулевой гипотезы. Посмотрим, так ли это. Значение z, соответствующее критической доле р=0,2263, равно 1,000. Мощность задается площадью справа от z. = 1,000 и составляет 0,1587 (ошибка равна 0,8413), т. е. мы имеем именно тот результат, которого ожидали.

Соседние файлы в папке Часть 6