Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
36
Добавлен:
01.05.2014
Размер:
625.15 Кб
Скачать

Гипотеза о значениях средних двух выборок

Рассмотрим процедуру проверки гипотезы о различии (совпадении) параметров выборок из двух генеральных совокупностей. При предположении о независимости этих выборок подлежат рассмотрению три случая.

• Дисперсии обеих генеральных совокупностей известны.

• Дисперсии генеральных совокупностей неизвестны, но считаются равными.

• Дисперсии генеральных совокупностей неизвестны и не являются равными.

ДИСПЕРСИИ ИЗВЕСТНЫ

Опыт показывает, что дисперсия (разброс) генерального среднего обычно меняется много медленнее, чем среднее генеральной совокупности. Это означает, что в качестве “известного” разброса генеральной совокупности в исследованиях, которые подлежат повторению, зачастую может быть использовано “старое” значение разброса. Например, мы можем ежегодно проверять потребление безалкогольных напитков на душу населения людей, живущих в разных регионах Соединенных Штатов. Если мы проверяем теперь гипотезу о различиях в потреблении на душу населения какого-то нового напитка, то можем использовать ранее определенные разбросы в качестве “известных” разбросов для нашего нового безалкогольного напитка. Будем считать, что наша проблема действительно состоит в определении того, существует ли различие между северянами и южанами в их потреблении нового безалкогольного напитка, который наша компания недавно вывела на рынок и дала ему название Spark. Кроме того, прошлые данные показывают, что вариация в потреблении безалкогольных напитков на душу населения составляет 10 унций в день для северян и 14 унций в день для южан. Принимая эти вариации в качестве меры стандартного отклонения, имеем и .

Нулевая гипотеза состоит в том, что не существует различий в потреблении напитка Spark между северянами и южанами, или что средние объемы потребления равны (), а в качестве альтернативной гипотезы принимается предположение о существовании различия (). Имеет место ситуация, состоящая в том, что если выборочные средние и являются нормально распределенными случайными величинами, то их сумма или разность также распределяется нормально. Два выборочные средние могут быть нормально распределены, поскольку потребление на душу населения в каждом регионе распределяется по нормальному закону, или по той причине, что две выборки достаточно велики, чтобы оказывалась применимой центральная предельная теорема. В любом случае статистикой проверки является z=выборочное среднее первой выборки минус выборочное среднее второй выборки, минус величина, определяемая как гипотетическое среднее генеральной совокупности в первой выборке за вычетом гипотетического среднего генеральной совокупности во второй выборке, и все это поделенное на стандартную ошибку разности двух средних, т. е.

где

— выборочное среднее для первой (северной) выборки;

— выборочное среднее для второй (южной) выборки;

и — гипотетические средние «северной» и «южной» генеральных совокупностей;

— оценка стандартной ошибки разности средних, и она равна квадратному корню из суммы двух разбросов средних, а именно:

где. в свою очередь, =, и =. Здесь и являются «известными» разбросами генеральной совокупности и .

Положим, что случайная выборка из 100 человек, проживающих на Севере, и 100 человек, проживающих на Юге, показывают =20 унций в день и =25 унций в день. Свидетельствует ли этот результат о действительном существовании различия в интенсивности потребления? Стандартная ошибка оценки равна:

и расчетное z составляет:

Расчетное значение превышает критическое табулированное значение, которое равно -1,96 для =0,05, и нулевая гипотеза отвергается. Имеет место статистически значимое различие в потреблении напитка Spark на душу населения северянами и южанами.

Доверительный интервал для разности двух средних задается формулой

Для 95% доверительного интервала z=1,96, и интервальная оценка различия в потреблении напитка Spark. двумя рассмотренными группами населения составляет-5±(1,96)(1,720)=-5±3,4. Северяне выпивают в день в среднем на 1,6-8,4 унции напитка Spark меньше, чем южане.

ДИСПЕРСИИ НЕИЗВЕСТНЫ

Когда дисперсии двух генеральных совокупностей неизвестны, стандартная статистика проверки также неизвестна, поскольку неизвестны , и , которые необходимо оценить. Как и в случае одной выборки, для оценки стандартных отклонений двух генеральных совокупностей используются выборочные стандартные отклонения:

используется для оценки и

используется для оценки , а оценки стандартных ошибок средних становятся:

и

Тогда общая оценка стандартной ошибки разности двух средних определяется как:

Хотя разбросы неизвестны, если их можно предполагать равными, общая оценка разброса генеральной совокупности получается посредством объединения выборок для расчета:

где — суммарный выборочный разброс, используемый для общей оценки разброса генеральной совокупности. Заметим, что расчет суммарного выборочного разброса связан с суммированием квадратов отклонений первой выборки от ее среднего и сложением итога с суммой квадратов отклонений второй выборки от ее среднего. В данном случае формула для оценки ошибки статистики проверки упрощается к виду

Если распределение каждой переменной в генеральной совокупности можно и далее предполагать нормальным, то подходящей статистикой проверки является

обладающая t-распределением с степенями свободы.

Предположим, например, что какой-то изготовитель воска для натирания пола недавно разработал новый состав. Компания рассматривает две разные емкости для нового воска одну пластиковую, другую металлическую. Компания принимает решение прийти к окончательному выводу на базе ограниченного по объему продаж эксперимента, в котором пластиковые емкости поступают в десять случайным образом выбранных магазинов, а металлические — в другие десять магазинов, определяющих вторую независимую случайную выборку. Результаты проведенного торгового эксперимента представлены в табл. 20.3.

Расчетное

Это значение необходимо сопоставить с t-таблицей для степеней свободы. Проверка является двунаправленной, поскольку нулевая гипотеза состоит в том, что предпочтения того или иного типа емкостей равнозначны; альтернативной гипотезой априорно не предполагается ожидание того, что половой воск в одной упаковке будет продаваться лучше, чем в другой. Если принять, что =0,05, то при 18 степенях свободы t=2,101. (Необходимо сверяться с колонкой 1-=0,975, а не 0,95 таблицы 3 приложения, поскольку в данном случае речь идет о двунаправленной проверке.) Так как расчетное t меньше критического, нулевая гипотеза об отсутствии различия не отвергается. Несмотря на то, что данный ограниченный эксперимент показал предпочтение пластиковых емкостей перед металлическими, выборочные данные не подтверждают, что в масштабе всей популяции можно ожидать лучшей продажи именно в этой упаковке.

На этом примере можно еще раз продемонстрировать важность четкого определения уровня статистической значимости посредством надлежащего баланса ошибок первого и второго рода. Здесь вероятность ошибки была произвольно установлена равной 0,05. Это привело к тому, что нулевая гипотеза не была отвергнута, а согласно заключению, в масштабе страны пластиковая емкость не будет продаваться лучше, чем металлическая. И все же, если бы тот, кто принимает решение, допустил ошибку а, скажем, на уровне 0,20, он мог бы обосновать совершенно противоположный вывод. Это неудивительно, поскольку интерполяция значений табл. 3 приложения для 18 степеней свободы показывает, что вероятность получения расчетного t=1,56 в предположении об отсутствии различия средних генеральной совокупности составляет примерно 15%. Если полагать, что производственные и другие затраты окажутся для разных упаковок одинаковыми, можно прийти к заключению, что пластиковая упаковка предпочтительнее. Если же производственные и иные затраты не одинаковы, то это должно быть отражено в правилах принятия решения.

СВЯЗАННЫЕ ВЩБОРКИ

СВЯЗАННЫЕ ВЫБОРКИ

Выборки, которые берутся не независимо, в результате чего наблюдения оказываются каким-то образом связанными.

В предыдущем обсуждении предполагалось, что выборки независимы, и что представляющая интерес переменная распределена по нормальному закону в каждой генеральной совокупности. Допущение о нормальном распределении снова оказалось необходимым для обеспечения возможности использования t-распределения. Что бы произошло, если бы переменная не была распределена нормально, или выборки не были бы независимыми? В нижней половине Исследовательского окна 20.2 дается итоговый обзор подхода к распределениям генеральной совокупности, не соответствующим нормальному закону, для случаев известного и неизвестного о, а в следующем разделе дается разбор случая связанных выборок.

ВЫБОРКИ СВЯЗАНЫ

Изготовитель туристского снаряжения пожелал изучить предпочтение покупателями цвета недавно разработанного спального мешка. Этот мешок отличался среднего уровня качеством и средней ценой. Традиционно высококачественные спальные мешки солидной стоимости, используемые серьезными туристами, как и заплечные рюкзаки, поступали в продажу защитных цветов, в основном зеленого или землисто-буроватого. Предыдущие исследования показали, что спальные мешки невысокого качества и умеренной стоимости чаще всего продавались детям для использования в походах с ночевкой. В этом сегменте рынка предпочтение отдавалось живым цветам с преобладанием ярко-красного и оранжевого. Производственные ограничения не позволяли компании производить новый спальный мешок того и другого спектра цветов. Чтобы провести сравнение, она определила случайную выборку из пяти магазинов, в которых были выставлены на продажу мешки обоих спектров цветов. Объем продаж на один магазин показан в табл. 20.4. Дают ли представленные данные достаточное свидетельство для установления различий между средними значениями продаж мешков разных цветов?

Анализ данных показывает разность двух средних

. Принимая во внимание вариантность объема продаж в пяти магазинах, эту разность скорее следует признать небольшой. Более того, применение процедур предыдущего раздела убеждает в том, что эту разность нельзя считать статистически значимой.

Исследовательское окно 20.2

Проверка гипотез о разности двух средних

известно

неизвестно

Распределение переменных в генеральных совокупностях нормальное или симметричное

Малое п: Используется

Где

Малое п: Можете ли вы принять ?

1. Да: Используется t-проверка суммарного разброса, где

И

При степенях свободы.

2. Нет: Рекомендуется несколько разных подходов полемического свойства.

Большое п: Используется

Большое п: Используется

и суммарный разброс, если разбросы могут предполагаться равнозначными; если же допущение равенства не гарантировано, разброс не объединяется.

Распределения переменных в генеральных совокупностях асимметричны

Малое п: Теоретической поддержки параметрической проверки не существует. Либо необходимо преобразовать переменные таким образом, чтобы они были распределены нормально, а затем использовать z-проверку, либо прибегнуть к статистической проверке свободного распределения.

Малое п: Теоретической поддержки параметрической проверки не существует. Либо необходимо преобразовать переменные таким образом, чтобы они были распределены нормально, а затем использовать t-проверку, либо прибегнуть к статистической проверке свободного распределения.

Большое п: Если выборки достаточно велики, чтобы центральная предельная теорема действовала для каждой из них по отдельности, то она будет действовать также для их суммы или разности. Используется

Большое п: Можно предположить, что , и , велики настолько, что центральная предельная теорема применима к отдельным выборочным средним. В этом случае она применима также к их сумме или разности. Используется

с суммарным разбросом, если неизвестные разбросы генеральной совокупности можно полагать равными, и с не объединяемым разбросом, когда обоснования допущения о равенстве нет.

Суммарная оценка общего разброса составляет:

И

Расчетное t получается равным

что меньше критического значения t=2,306, определяемого по таблице для =0,05 и степеней свободы. Нулевая гипотеза о том, что в объеме продаж изделий двух разных спектров цветов нет различий, на базе этих выборочных данных отвергнута быть не может.

Однако более пристальное, рассмотрение данных показывает явную несостоятельность этого заключения. Спальные мешки ярких цветов в каждом магазине продавались лучше, чем мешки защитных цветов, и анализ разностей продаж по магазинам (детально процедура рассматривается ниже) действительно показывает, что в объемах продаж мешков двух спектров цветов существует статистически значимое различие. Объяснение кажущегося несоответствия заключений — одного о том, что различие не является значимым, а другого о том, что оно статистически значимо, — кроется в том, что для решения данной проблемы t-проверка разностей данных двух средних неприемлема. Этой проверкой разности средних предполагается независимость выборок. Объемы же продаж спальных мешков ярких и защитных цветов определенно связаны, поскольку и те, и другие продавались в одних и тех же магазинах. Обратите внимание, как этот пример отличается от примера с половым воском, в котором металлические емкости размещались для продажи в одной выборке магазинов, а пластиковые в другой независимой выборке. Нам необходима процедура, в которой принимается в расчет тот факт, что наблюдения связаны.

Подходящей процедурой является t-проверка для связанных выборок. Выглядит она следующим образом. Определяется новая переменная , представляющая собой разность между объемами продаж спальных мешков ярких и защитных цветов в i-м магазине. Таким образом:

=64-56=8

=72-66=6

=43-39=4

=22-20=2

=50-45=5

Теперь рассчитывается среднее значение разностей выборки для магазинов:

и стандартное отклонение разности посредством определения суммы отклонений от среднего в квадрате, а именно

Проверочная статистика — это выборочная средняя разность минус определяемая гипотезой средняя разность генеральной совокупности, деленная на стандартное отклонение разности, поделенной на квадратный корень из объема выборки. Либо в принятых обозначениях:

где D разность, которая ожидается согласно нулевой гипотезе.

Поскольку нет априорной причины для ожидания предпочтения мешков одного спектра цвета по сравнению с другим, подходящая нулевая гипотеза состоит в том, что различия нет, тогда как альтернативная гипотеза определяет, что оно есть; таким образом:

Расчетное t, следовательно,

Это значение соотносится с t-таблицей для =(количество разностей минус 1) степеней свободы;

в данном случае пять пар разностей, значит =4. Критическое t для =4 и =0,05 равно 2,776, следовательно, гипотеза об отсутствии различия отвергается. Выборочное свидетельство показывает, что спальные мешки ярких цветов, вероятно, продаются лучше, чем мешки защитных цветов.

Оценка того, насколько объем продаж мешков ярких цветов будет превышать объем продаж мешков защитных цветов в одном магазине, должна рассчитываться по формуле доверительного интервала, т. е.

или

что для 95% доверительного интервала дает

Другими словами, объем продаж мешков ярких цветов должен превышать среднее значение на магазин от 2.2 до 7.8 спальных мешков.

Соседние файлы в папке Часть 6