- •Проверка статистических гипотез: выбор между реальностью и совпадением
- •Гипотезы
- •Нулевая гипотеза
- •Исследовательская гипотеза
- •Примеры гипотез
- •Проверка гипотезы о равенстве среднего генеральной совокупности некоторому заданному значению
- •Использование доверительных интервалов: простой способ
- •Статистическая значимость и уровни проверки
- •Доверительная вероятность (р-значение)
- •Сравнение двух выборок
Примеры гипотез
Ниже приведены примеры нулевых и альтернативных гипотез, сформулированных относительно генеральной совокупности. Обратите внимание, что в каждом случае обе гипотезы не могут быть верными одновременно и чтобы выбрать, какую из них следует принять, необходимо использовать данные.
Ситуация. Случайно отобранная группа из 200 человек посмотрела рекламу; после этого регистрируется количество людей из этой группы, которые в течение следующей недели купили рекламируемый продукт.
Нулевая гипотеза. Реклама не имела никакого эффекта. Другими словами, процент покупателей среди тех в генеральной совокупности, кто видел рекламу, в точности равен проценту покупателей среди тех в генеральной совокупности, кто не видел ее (т.е., равен обычному уровню продаж). Из прошлого опыта известно, что этот обычный уровень продаж составляет 19,3%.
Альтернативная гипотеза. Реклама имеет эффект. Это значит, что процент покупателей среди тех в генеральной совокупности, кто видел рекламное объявление, отличается от обычного уровня продаж, равного 19,3%, и представляющего тех покупателей в генеральной совокупности, кто не видел рекламу.
Обсуждение. Обратите внимание, что эти гипотезы представляют собой предположения относительно генеральной совокупности в целом, а не относительно выборки из 200 человек. Выборочные данные, собранные в результате наблюдения поведения 200 случайно отобранных человек, помогут решить, какую из гипотез принять. Поскольку нулевая гипотеза содержит точное значение процента, она является более определенной, чем альтернативная гипотеза, которая содержит утверждение о более широком диапазоне (т.е. о любом значении, отличном от 19,3%). Кроме того, заметим, что если вы примете решение, что реклама была эффективной, вы сделаете более строгое утверждение, так как это альтернативная гипотеза. Это так, как если бы вы заявили: “Прекрасно. Если эта реклама работает так хорошо, как мы думаем, давайте это докажем. Или, с другой стороны, если эта реклама будет иметь катастрофические последствия для продаж, давайте это также докажем”.
Ситуация. Вы оцениваете добавку, улучшающую объем выпуска продукции, описанную в начале этой главы.
Нулевая гипотеза. Добавка в долгосрочном плане не оказывает влияния на объем выпускаемой продукции, величина которого известна из прошлого опыта.
Альтернативная гипотеза. Добавка оказывает некоторое долгосрочное влияние на объем выпускаемой продукции.
Обсуждение. Нулевая гипотеза является более определенной. Обе гипотезы формулируются относительно генеральной совокупности (объем продукции за длительный период времени), а не только относительно результатов работы за прошедшую неделю (выборка). Вы должны опровергнуть, что добавка неэффективна, и убедиться в противоположном, что потребует дополнительных доказательств. Производители добавки должны представить доказательства и продемонстрировать ее эффективность. Это не ваша забота доказывать им, что добавка не является эффективной.
Ситуация. Вашей фирме предъявлен иск в дискриминации сотрудников по полу, и вы анализируете документы, представленные другой стороной. Они включают проверку статистической гипотезы, основанную на данных о заработной плате мужчин и женщин, которая утверждает наличие “очень значительной разницы” между размерами средней заработной платы мужчин и женщин.
Нулевая гипотеза. Размеры заработной платы мужчин и женщин равны, если не принимать во внимание случайные отклонения. Иными словами, реальная разница в размерах заработной платы мужчин и женщин не намного бы изменилась, если бы мы сложили все заработные платы в шляпу, хорошо их перемешали и раздали сотрудникам без учета их пола.
Альтернативная гипотеза. Различие в размерах заработной платы мужчин и женщин превышает простую случайность.
Обсуждение. Обратите внимание, что здесь используют идеализированную совокупность. Ввиду того, что эти служащие никак не могут рассматриваться как случайная выборка, гипотеза относится к некоторой идеализированной совокупности, которая представляет собой мужчин и женщин, равных с точки зрения размера заработной платы и таких, что все имеющие место различия в размерах заработной платы могут быть объяснены случайностью распределения заработной платы между отдельными людьми. Если будет отвергнута нулевая гипотеза и принята альтернативная, то ваша фирма будет иметь проблемы. Такое сильное заключение будет работать против вас. Но не все потеряно! Не забывайте, что статистические методы говорят в основном только о числах, а не о том, почему эти числа именно такие. Разница в заработной плате может быть обусловлена непосредственно дискриминацией по полу, а может, и другими факторами, такими как образование, опыт и способности. Проверка статистической гипотезы, рассматривающей только пол и размер заработной платы, не может показать, какие именно факторы повлияли на эту разницу. Кроме того, результаты проверки гипотезы могут быть неверными, так как использование статистических методов всегда связано с наличием ошибок.
