Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
37
Добавлен:
01.05.2014
Размер:
261.12 Кб
Скачать

Определение объема выборки при работе с выборочными долями

В примерах, приведенных выше, речь шла о средних. Сбытовиков же часто интересует определение иных параметров, например, выборочной доли р. В нашем примере исследователя может заинтересовать определение доли имеющих лицензии рыболовов, прибывших из других штатов, или рыболовов, проживающих в сельской местности, или рыболовов, выезжающих на рыбалку с ночевкой.

В начале этой главы мы говорили о трех вещах, потребных для определения объема выборки: определенном доверительном уровне, определенной точности и знании характера распределения выборочной статистики. Как уже отмечалось выше, определение первых двух величин обусловлено спецификой постановки проблемы. Абсолютная точность, пусть и выраженная в процентном отношении, означает, что оценка будет находиться в интервале, определяемом в долях истинного значения, например, в пределах ±5% от истинного значения.

Таким образом, нам остается рассмотреть распределение величин выборочных долей. Если отбор элементов выборки проводился независимо, что весьма вероятно при относительно небольшом по сравнению с объемом генеральной совокупности размере выборки, теоретически корректное распределение доли выборки является биноминальным. Но биноминальное распределение может быть аппроксимировано нормальным при больших выборках или в тех случаях, когда доля исследуемого признака в генеральной совокупности приближается к 1 /2. Поэтому при оценке объема таких выборок принято использовать нормальное распределение. После формирования и оценки доли выборки исследователь может вернуться к биноминальному распределению, чтобы определить доверительный интервал в том случае, когда нормальное приближение представляется ему ошибочным.

Центром распределения значений выборочных долей является доля признака в генеральной совокупности. Значение выборочной доли является несмещенной оценкой величины соответствующей доли в генеральной совокупности. Среднеквадратическое отклонение нормального распределения выборочных долей, то есть среднеквадратическая ошибка доли, обозначаемая , равна

.

Поскольку мы вновь работаем с нормальной кривой, степень точности снова определяется количеством среднеквадратических отклонений, на которое оценка может отклоняться от среднего значения. Теперь средним значением является генеральная доля, а среднеквадратическим отклонением — среднеквадратическая ошибка доли, то есть,

(17.3)

Подставляя на место и разрешая уравнение относительно n, получаем

(17/4)

или

Предположим, что в департаменте туризма желают узнать долю всех рыболовов, которые в течение года хотя бы раз выезжали на рыбалку с ночевкой. Предположим также, что они хотят произвести оценку этой доли с точностью ± 2% и доверительным уровнем 95% (z=2). Подставим эти значения в формулу 17.4

.

Уравнение содержит два неизвестных: оцениваемую долю признака в генеральной совокупности и объем выборки. Не пугайтесь! Исследователь должен оценить первое значение и определить объем выборки, используя эту оценку.

Это обстоятельство смущает как аналитиков, так и начинающих исследователей. Тем не менее, при работе с долями для определения объема выборки необходимо задаваться ориентировочным значением параметра. Считайте это очередной иллюстрацией того, как при выборочном контроле информация порождает информацию. Для того чтобы произвести названную оценку, исследователь должен обратиться“к данным предыдущих исследований. Допустимо и проведение предварительного обследования. Если в силу каких-то причин невозможно ни то, ни другое, возможно произвести оценку параметра на основе компетентного правдоподобного суждения.

Следствием неточной оценки может стать увеличение или уменьшение точности доверительного интервала. Представим, к примеру, что исследователь принял долю рыболовов, выезжавших на рыбалку с ночевкой, равной 20%. В этом случае исчисленный объем выборки будет равен

Представьте себе, что после обследования этой состоящей из 1600 рыболовов выборки выборочная доля р оказалась равной 0,40. Величина доверительного интервала будет зависеть от выборочной среднеквадратической долевой ошибки , которая в данном случае подменяет собой неизвестную среднеквадратическую долевую ошибку генеральной совокупности

где р — доля единиц выборки, обладающая заданным признаком; q= 1-р. В нашем примере

Доверительный интервал для доли признака в генеральной совокупности определяется как выборочная доля ± (z) (среднеквадратическая долевая ошибка) или

или

Обратите внимание, что интервал оказался шире заданного. Причина состоит в том, что выборочная доля оказалась больше расчетной доли признака в генеральной совокупности.

Предположим, интервал, больший заданного, считается неприемлемым. Один из возможных способов предотвращения подобных исходов состоит в принятии такого объема выборки, который соответствовал бы наихудшему варианту. Из формулы видно, что объем выборки прямо пропорционален произведению π(1-π). В свою очередь, как можно было и ожидать, это произведение максимально при π=0,5, поскольку если половина генеральной совокупности ведет себя одним образом, а другая половина — иначе, при формулировании выводов исследователь нуждается в более серьезном их обосновании, нежели в ситуации, когда большая часть совокупности ведет себя одинаково.

В отсутствие какой-либо информации о доле признака в генеральной совокупности можно принимать π=0,5. При этом точность доверительного интервала возрастет в той же мере, в какой выборочная оценка будет отличаться от принятого значения, равного 0,5.

Соседние файлы в папке Часть 5