Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
маркетинг / МИ_Книга2006.doc
Скачиваний:
43
Добавлен:
23.05.2015
Размер:
4.47 Mб
Скачать

Гипотезы о двух средних в независимых выборках

Пусть, например, исследуется среднемесячный объем потребления безалкогольных напитков на душу населения среди женщин и мужчин. Из опыта исследований видно, что дисперсия изменяется значительно медленнее, чем среднее значение. Поэтому можно использовать дисперсию, полученную в предыдущих исследованиях. Пусть известно, что для женщин =20бутылок,=10и для мужчин=25бутылок,=14. Нуль-гипотеза заключается в том, что разницы между женщинами и мужчинами в вопросах потребления безалкагольных напитков нет (то есть). Альтернативная – разница есть. Уровень значимости=0,05.

Выборочные средние распределены нормально, если размер выборок велик или если переменная в генеральной совокупности распределена нормально. В этих случаях используется статистика

где

Здесь nЖ, nМ– количество опрошенных женщин и мужчин соответственно; – стандартная ошибка оценки разности средних значений.

Для примера z=-2,91, то есть разница между средними значениями двух выборок составляет2,91×.Критическое значение для двустороннего критерияZкр() равно1,96, поэтому нуль-гипотеза отвергается. Вряд ли такое большое различие обусловлено ошибками выборок. Гипотезу можно отвергнуть и с вероятностью ошибки0,01.

Доверительный интервал для разницы между средними составляет

Если дисперсия неизвестна, то используется ее оценка по выборке согласно вышеприведенным формулам. Можно также принять допущение о равенстве дисперсий. Тогда оценку дисперсии можно проводить по данным из двух выборок совместно.

При малых размерах выборки и допущении о симметричности распределения величин в генеральных совокупностях можно воспользоваться функцией ТТЕСТвMSExcel(см. выше, сноску Error: Reference source not found).

***

Существуют также тесты для гипотез о зависимых выборках, о пропорциях. Отдельная группа методов имеет дело с анализом вариаций. Их рассмотрение выходит за рамки данной книги.

Многомерный анализ

Анализ называется многомерным, если каждое из nнаблюдений несет значениеpпеременных.

Если среди измеряемых переменных можно выделить одну или несколько причинных (независимых) переменных и следствие (зависимую переменную), то такая модель называется зависимостью. Если же имеется взаимное влияние переменных друг на друга и причинно-следственную цепочку выделить нельзя, то говорят о взаимозависимости.

Методы анализа классифицируются по роли переменных в модели, а также по типу шкал измерения переменных.

Порядок выбора метода анализа представлен на рис.Рис. 21).

Коэффициент контингенции154

Пусть требуется исследовать зависимость размера покупаемой стиральной машины от размера семьи. Зависимость может иметь различный вид. Может оказаться, что чем больше размер семьи, тем большую стиральную машину они покупают. Но возможно, что холостяки любят устраивать большие стирки и именно им требуются самые большие машины.

Независимая (причинная) переменная – размер семьи. Возможные значения: В1– семья из1…2чел;В2– из3…4чел;В3– из5и более чел.

Зависимая переменная (следствие) – размер приобретаемой стиральной машины. Возможные значения: А1– обрабатывает менее2,5кг белья ;А2– от2,5до4кг;А3– от4кг и выше. Собранные данные сведены в табл. 5.14.

Нуль-гипотеза Н0: переменные независимы.

Альтернативная гипотеза НА: переменные зависимы.

Требуемая достоверность решения  =0,05.

Таблица 5.14

Данные о приобретении стиральных машин

В1

В2

В3

Всего

А1

20

40

30

90

А2

30

60

50

140

А3

20

20

60

100

Всего

70

120

140

330

На основе собранных данных о количестве опрошенных, попавших в каждую категорию, определим вероятности попадания в категории:

Р(А1)=n(A1)/n=90/330; P(A2)=140/330; P(A3)=100/330; P(B1)=n(B1)/n=70/330; P(B2)=120/330; P(B3)=140/330,

где n – общее количество семей; n(x) – количество семей в категории x.

Если зависимости A(B)нет, то ожидаемое количествоOij в каждой клетке таблицы (i– номер строки,j– номер столбца) будет определяться лишь этими вероятностями:

O11=nP(A1)P(B1)=330(90/330)( 70/330 ) =19,1; O12=nP(A1)P(B2)=330(90/330)(120/330) =32,7; … O33=nP(A3)P(B3)=330(100/330)(140/330) =42,4.

Статистика

где k– количество строк;l– количество столбцов;Eij – фактические значения, взятые из таблицы, распределена как2с количеством степеней свободы, равным(k‑1)×(l-1).

Для примера значение формулы равно 21,2, а значение соответствующего2равно9,5. Таким образом, гипотезаН0отвергается в пользуНAи объем покупаемой стиральной машины принимается зависящим от размера семьи155.

Используя функцию ХИ2ТЕСТ(фактический интервал; ожидаемый интервал)можно получить вероятность ошибки данного заключения. Она составляет0,0003, то есть 0,03% 156.

Коэффициент контингенциипоказывает силу влияния одной переменной на другую. Он вычисляется по формуле:

Здесь n– объем выборки. Для данного примера он равен0,25. Если зависимость отсутствует, тоС=0. Максимально возможное значение (для сильной связи) определяется для равного числа строк и столбцовrкак

что составляет 0,82. Значит, можно сделать вывод о несильном влиянии размера семьи на приобретение большой стиральной машины.