Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
маркетинг / МИ_Книга2006.doc
Скачиваний:
45
Добавлен:
23.05.2015
Размер:
4.47 Mб
Скачать

Тест Колмогорова-Смирнова

Этот тест использует порядковую природу данных.

Пусть компания выпускает четыре вида лака для дерева: очень светлый, светлый, средний и темный. Вопрос заключается в том, есть ли покупательские предпочтения одного из крайних оттенков. Если так, то будет производиться только этот оттенок. В противном случае будет развернуто производство всех оттенков.

Пусть из ста покупателей 48приобрели очень светлый оттенок,32– светлый,16– средний и4– темный.

Нуль гипотеза заключается в отсутствии предпочтений, то есть в том, что все оттенки будут покупаться одинаково. Значит, ожидается по 25покупок каждого оттенка.

Для проверки гипотезы строится так называемая кумулятаслучаев покупки. Это фактически – нарастающий итог (табл. 5.13).

Параметр Колмогорова-Смирнова определяется как

где Dmax– максимальное значение модуля разности кумулят;n– количество элементов в выборке.

Для данного примера =1,5.

Таблица 5.13

Фактические и ожидаемые кумуляты

Оттенок

Фактически куплено

Фактическая кумулята покупок

Ожида­емые покупки

Ожидаемая кумулята покупок

Модуль разности кумулят

Очень светлый

35

36

25

25

10

Светлый

30

65

25

50

15

Средний

20

85

25

75

10

Темный

15

100

25

100

0

Соответствие значений  и вероятностей справедливости гипотезы о равенстве двух распределений (в данном случае – о равенстве эмпирического распределения и предполагаемого равномерного) находится из таблиц, публикуемых практически во всех задачниках по статистике, например, [28].

По этим таблицам видно, что для примера эта вероятность составляет 0,02.Таким образом, нуль-гипотеза об отсутствии предпочтения оттенков отвергается. Видно значительное предпочтение более светлых оттенков148.

Хотя для данного случая можно было использовать и тест 2, тест Колмогорова-Смирнова часто предпочтительнее, так как его легче вычислить. Кроме того, он хорошо работает с редкими событиями, вероятность которых низка.

Гипотезы об одном среднем

В маркетинговых исследованиях часто возникает задача оценить среднее значение некоторого параметра генеральной совокупности по выборке. В разделе «Оценка доверительного интервала простой случайной выборки» говорилось, что результатом таких исследований могут стать, например, данные:

средний доход жителей города равен 4500±100 руб. с достоверностью 95%.

Пусть исследуется посещаемость продовольственного магазина. Если количество покупателей составляет более 100человек в день, то магазин расположен в удачном месте и его реклама эффективна. Если же покупателей меньше, то имеется проблема, которую необходимо исследовать подробнее.

Вначале будет рассмотрен случай, когда исследования количества покупателей проводятся в течение 50дней149.

Пусть известна дисперсия генеральной совокупности – количества посетителей в день. Как уже отмечалось, ее можно взять из прошлых исследований.

Пусть получены следующие данные: количество измерений n=30; среднее значение в выборке=108; среднеквадратическое отклонение генеральной совокупности =14,1.

Известно (см. раздел «Простая случайная выборка»), что выборочные средние имеют среднеквадратическое отклонение, равное =. Для данного примера оно равно2,00150. Воспользовавшись результатами, полученными в разделе «Оценка доверительного интервала простой случайной выборки», можно сказать, что разница между ожидаемым значением, равным100, и полученным, равным106, составляет(106-100)/2,00=3. Теперь разница измерена в. В общем случае она составляетz, где z – фактическое нормированное отклонение.

Из таблиц интегральной функции нормального распределения можно узнать, что вероятность того, что будет отстоять от не более, чем на эту величину, составляет 0,9973.Соответственно, вероятность того, что расстояние между и будет больше3,будет равна0,0027.

Иными словами, 0,0027– вероятность того, что будет меньше100или больше112. Поскольку в данном примере требуется анализировать только нижнюю границу, а нормальное распределение симметрично, вероятность того, чтобудет меньше100, составляет0,0027/2=0,0014.Это очень низкая вероятность. Значит, вряд ли среднее количество посетителей меньше100.

На примере видна разница между двусторонним и односторонним критериями. Если проверяется гипотеза о том, что значение среднего генеральной совокупности больше (меньше) некоторого числа, то используется односторонний критерий. Если проверяется неравенство среднего генеральной совокупности конкретному значению, то используется двусторонний критерий. Первый случай чаще встречается в маркетинговых исследованиях151.

Существуют специальные таблицы критических значений для стандартизированного нормального распределения, по которым можно определить критические значения Z для заданной вероятности ошибки P(zZ) (односторонний критерий) и P(|z|Z) (двусторонний критерий) [28]. Здесь Z – критическое значение нормированного отклонения, z – измеренное значение нормированного отклонения. По ним можно определить критическое значение Z по заданной вероятности ошибки или найти минимальную вероятность ошибки для случая Z=z.

Нуль гипотеза в данном случае: 100, альтернативная –>100.Если допустимый уровень ошибки0,05, то критическое значение для одностороннегоz-критерия (на каком расстоянии, измеренном вможет отстоять полученное среднее от ожидаемого) равно1,65. Фактическое значение равно3. Значит, по результатам измерений нуль-гипотеза отвергается, так как измеренное значение слишком далеко от ожидаемого.

Таким образом, при значениях n30пользуются допущением о нормальном распределении выборочных средних в соответствии с центральной предельной теоремой.

Большой интерес представляют также случаи, когда nмало. Может быть, не нужно было проводить исследования в магазине в течение пятидесяти дней? Полученная достоверность1-0,0014=0,9986 слишком высока. Обычно хватает достоверности0,95.Это свидетельствует о том, что была проделана лишняя работа.

Порядок выбора метода проверки гипотезы об одном среднем приведен на рис.Рис. 22.

Рис. 22. Порядок выбора метода проверки гипотез об одном среднем

На этом рисунке использованы следующие обозначения: z– статистика, нормально распределенная с математическим ожиданием0и дисперсией, равной1;t– статистика, имеющая распределение Стьюдента с числом степеней свободы=n-1;n– количество измерений; – выборочное среднее;– среднее для генеральной совокупности (это значение берется из гипотезы, например, для рассмотренного примера берется значение100).

Для zиt-статистик составлены таблицы.

Если дисперсия генеральной совокупности неизвестна, то используется ее оценка по выборке (квадратный корень в знаменателе).

Для случая малых nи симметричного распределения измеряемой переменной в генеральной совокупности152процедура в принципе аналогична другим случаям, но используетсяt-критерий Стьюдента. Это объясняется тем, что при малыхnраспределение выборочных средних уже нельзя считать нормальным. Отличия от нормального распределения обусловлены тем, что при малых выборках, когда не выполняется требование нормальности распределения, надо увеличивать критическое значение критерия проверки гипотезы. Ширина доверительного интервала для этого случая составляет уже не2×z×, а2×t×.

Пусть исследования количества посетителей проводились только в течение n=10дней, и дали следующие результаты. Количество посетителей по дням:94, 100, 105, 106, 106, 106, 106, 107, 112, 118; среднее значение в выборке=106; Расчет по приведенной на рис.Рис. 22 формуле дляtдает значение3. Критическое значениеtдля одностороннего критерия (в данном случае проверяется гипотезао превышении значения 100,так что следует использовать односторонний критерий), выбранного=0,05и9степеней свободы равно1,833. Значениеtпревышает это порог, что соответствует неслучайному превышению найденного среднего значения, равного106,над ожидаемым, равным100. Принимается, что среднее число продаж действительно больше100.

Другой вариант расчета – найти такое значение, при котором еще можно утверждать, что нуль-гипотеза отвергается. Это легче всего сделать с помощьюMSExcel153.