Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
36
Добавлен:
01.05.2014
Размер:
625.15 Кб
Скачать

Возвращение к примеру

«Я знаю, что вы не хотите ждать письменного отчета, — сказала Энджи Карлин, удобно устраиваясь в кресле напротив Чака Зелмера в его офисе, — поэтому, хотя я только что закончила анализ данных, буду рада заранее удовлетворить ваше нетерпение нашими открытиями. «Действительно любопытно, — откликнулся Зелмер. — Что же вам удалось установить?» «Ну, как вы знаете, мы разослали наши анкеты 225 случайным образом выбранным адресатам из ведомости почтовых отправлений, которую нам предоставил Сид Грин. Чтобы поощрить ответы, мы предложили этим людям пятидолларовые купоны для их следующей покупки по каталогу. Мы получили 124 пригодные для анализа анкеты, т. е. добились 55% ответной реакции. Чтобы выполнить анализ, мы использовали программу, именуемую SPSS, которая представляет собой укороченный вариант...» «Статистический Пакет для Социальных Наук. Не сомневайтесь, я знаком с этим пакетом, — перебил Зелмер. «Взгляните сюда, — сказала Карлин, протягивая Зелмеру сводку данных. — Это таблица двух переменных: желание индивидов из почтового списка Omni покупать по каталогу и подтверждение того, что они делали приобретения по каталогу в прошлом. Желание покупать по каталогу Omni зависимая переменная, которую интересно пояснить».(См. табл. 1).

«Взгляните на проценты по колонке, — стала подсказывать Карлин. — Они показывают, что группа "наиболее желающих" покупателей — это те, кто заказывал по каталогу Omni в прошлом году. Более 75% этих людей (40,5% и 37,5%) так или иначе, желают повторять заказы. В то же время, почти 25% тех, кто покупал в прошлом году, больше заказывать не желают. Теперь присмотритесь к цифре в том месте, где сказано: хи-квадрат по сырым данным. Основное назначение этой цифры — дать меру того, являются ли результаты нашего анализа статистически значимыми, или они просто случайны. В данном случае это значение таково, что мы можем с некоторой определенностью утверждать, что измерявшиеся нами переменные действительно связаны.

То есть желание покупателя приобретать по каталогу Omni представляется зависящим от того, делались ли по нему приобретения прежде». «Возможно, так оно и есть, — согласился Зелмер, — но, сказав мне, что люди, которые однажды покупали по каталогу Omni, почему-то желают сделать заказ вновь, вы не даете мне ничего сверхординарного, что позволило бы понять, как оживить мою вяло идущую торговлю по каталогу». «Не торопитесь, есть и еще кое-что, — успокоила его Карлин. — В этих анкетах запрятана масса ценной информации. Например, посмотрим вопрос 11. Мы спрашивали людей, какой уровень доверия ощущают они, покупая по почте программное обеспечение разного типа. Красота этого подхода в том, что мы генерировали индекс, кратко названный CATCON что означает «catalog confidence» (доверие каталогу), — который был сформирован для количественной оценки доверия, испытываемого людьми при покупке продукции по каталогу. В данном случае индекс CATCON представляет собой то, что вы получите, если сложите оценки, назначенные категориям ответов, относящихся к тому, насколько доверительно вели себя индивиды, приобретая по почте программное обеспечение каждого типа. Оценки ответов на этот вопрос ранжировались от 1 (вовсе не доверяю) до 5 (очень доверяю). Взгляните на эту таблицу», — продолжала Карлин и протянула Зелмеру небольшого размера распечатку (См. табл. 2).

«Полагаю, вы намерены растолковать мне, что все это означает», — добродушно откликнулся Зелмер.

«Ну, то, что мы обнаружили, вещь действительно интересная. Речь идет о различии оценки на базе пола покупателей. Таблица показывает, что средняя оценка для мужчин выше, чем для женщин. Поскольку наша выборка была сравнительно небольшой, вы вправе усомниться в обладании этого различия статистической значимостью», — сказала Карлин. «Верно, — оживился Зелмар, — вопрос уже вертелся на кончике моего языка». «Различие значимо, — ответила Карлин. — Просто взгляните на значение t». Формирование индекса CATCON это пример построения гипотезы о двух средних, поскольку его цель состояла в оценке того, имело ли место различие в степени доверия между мужчинами и женщинами, когда они покупали программное обеспечение по каталогу. Использовалась двунаправленная проверка, так как альтернативная гипотеза заключалась в том, что доверие не одинаково, но заранее не было уверенности, более ли доверчивы люди одного пола, чем другого. В данном случае нулевая гипотеза отвергается, так как действительно имеет место статистически значимое различие между доверием мужчин и женщин, покупающих компьютерное программное обеспечение по каталогу.

Резюме

УЧЕБНАЯ ЦЕЛЬ 1

Объяснить основы использования критерия хи-квадрат.

С помощью критерия хи-квадрат проверяется гипотеза о принадлежности выборки к некоторой генеральной совокупности с известным распределением. Применение данного критерия предполагает сравнение частот попадания элементов выборки в некоторые фиксированные интервалы с теоретическими вероятностями попадания в эти же интервалы значений всей совокупности.

УЧЕБНАЯ ЦЕЛЬ 2

Обсудить сходства и различия в процедуре проверки по критериям хи-квадрат и Колмогорова-Смирнова.

Проверка по критерию Колмогорова-Смирнова подобна проверке по хи-квадрат в том, что в ней используется сравнение реализованных и ожидаемых частот для определения того, находятся ли полученные результаты в соответствии с заявленной нулевой гипотезой. Но в проверке Колмогорова-Смирнова используется преимущество природы упорядоченности данных.

УЧЕБНАЯ ЦЕЛЬ 3

Определить, какой критерий следует применить при проверки гипотезы о значении среднего одной выборки при известной дисперсии. Какой критерий применяется при неизвестной дисперсии?

Для проверки гипотезы о среднем подходит z-критерий, если дисперсия известна, и применяется t-критерий, если она неизвестна.

УЧЕБНАЯ ЦЕЛЬ 4

Определить критерии, которые применяются при проверки гипотезы о средних значениях двух независимых выборок.

В анализе, где участвует два средних значения независимых выборок, используется z-критерий, когда дисперсии известны. Если разбросы неизвестны, но предполагаются равными, применяется t-критерий с использованием дисперсии объединенной выборки.

УЧЕБНАЯ ЦЕЛЬ 5

Определить критерии, которые используются при анализе различий между двумя долевыми выборками из одной генеральной совокупности.

Проверка равенства долей двух независимых выборок включает в себя «нормальное» объединение выборочных дисперсий. Применяется z-проверка.

Соседние файлы в папке Часть 6