Определение объема выборки с использованием предполагаемой перекрестной классификации

До сих пор мы подходили к проблеме определения объема выборки с чисто статистических позиций, при этом особый акцент делался на соответствующей ошибке выборки и компромиссе между доверительным уровнем и степенью точности. Мы ограничивались рассмотрением этих факторов, поскольку теоретически они являются наиболее важными. На практике же при определении объема выборки учитываются и иные, уже не теоретические, но практические соображения. При обсуждении стратифицированных и групповых выборок мы говорили о том, что объем выборки зависит от бюджета исследования и себестоимости одного наблюдения. Помимо прочего, на него могут влиять и некие чисто субъективные соображения. Скажем, исследователи могут обнаружить, что расчетный объем выборки превышает статически необходимый объем, достаточный для убеждения ничего не смыслящих в теории выборочных наблюдений администраторов в достоверности полученных результатов.

Одна из важнейших практических основ для определения объема выборки — перекрестная классификация, которую исследователи планируют использовать для упорядочения данных. Предположим, мы хотим оценить долю всех рыболовов, выезжавших на рыбалку с ночевкой хотя бы один раз в течение года, и соотнести эту долю с возрастом и уровнем доходов рыболовов. Примем к рассмотрению следующие возрастные категории: моложе 20 лет, 20-29,30-39,40-49 и не моложе 50 лет. Уровень доходов разделим на категории: менее $10000,$10000-$19999,$20000-$29999, $30000-$39999 и свыше $40000. Таким образом, означенная доля должна быть соотнесена с пятью возрастными категориями и с пятью категориями, учитывающими уровень доходов.

Мы можем рассчитать доли отдельно для каждого признака, учитывая их известную взаимозависимость, выражающуюся в том, что уровень доходов, как правило, повышается с возрастом. Для учета названной взаимозависимости мы должны рассматривать одновременно оба этих признака. С этой целью составляется перекрестная классификационная таблица, в которой возраст и уровень доходов соответствуют тем или иным классификационным ячейкам таблицы.

Примером такой таблицы может служить табл. 17.2. Нам остается заполнить ее ячейки конкретными значениями, которые будут получены при рассмотрении выборки. Общее число ячеек, требующих заполнения, равно 25. Аналитик, заказавший настоящее обследование, вряд ли удовлетворится оценкой, основанной на единичных случаях. Но даже для выборки, состоящей из 500 рыболовов, потенциальный размер ячейки при равномерном распределении элементов выборки по указанным категориям составит 20 единиц (500/25). Такое распределение элементов крайне маловероятно, и по этой причине исследователь может оказаться в ужасном положении, когда ему придется оценивать доли по единичным наблюдениям.

Для оценки требуемого объема выборки может быть применено обратное рассуждение. Вначале исследователь определяет количество ячеек в таблице предполагаемой перекрестной классификации. Это количество определяется как произведение чисел классификационных уровней того и другого признаков. В нашем случае исследователь перемножит пять возрастных и пять «доходных» уровней и получит 25 ячеек. Если минимальное количество наблюдений на ячейку будет определено равным 30, мы получим выборку объемом 750 единиц. Поскольку вероятность равномерного распределения элементов этой выборки между ячейками крайне мала, исследователю необходимо предварительно определить распределение элементов выборки. После выделения наиболее важных ячеек исследователь может определить требуемый объем выборки, обеспечивающий заданную точность и достоверность результатов. Следует взять за правило следующие требования: «объем выборки должен обеспечивать не менее 100 наблюдений для каждой первостепенной и не менее 20—50 наблюдений для каждой второстепенной классификационной составляющей». Первостепенные классификационные составляющие соответствуют наиболее критичным, а второстепенные — наименее критичным ячейкам перекрестной классификации, принятой в данном обследовании.

При этом следует сделать поправку на неполучение данных, поскольку отдельные индивиды, включенные в выборку, окажутся вне пределов досягаемости или откажутся участвовать в обследовании. Таким образом, исследователь «выстраивает» выборку по классификационной таблице, учитывая как специфику совокупности, так и специфику классификации.

Возможно, перекрестная классификация не будет избрана в качестве основного метода для анализа данных. Для этого могут использоваться другие статистические способы. Тем не менее, подобную аргументацию можно использовать и в этом случае. Количество наблюдений должно соответствовать требованиям применяемого метода; только в этом случае результаты будут обладать потребной достоверностью. Различные способы требуют использования различных объемов выборки, часто выражаемых степенью свободы, потребной для проведения анализа. Читатели, намеревающиеся использовать для анализа определенную статистическую технику, должны обратить особое внимание на соответственные требования к объему выборки. Мы же хотим лишний раз отметить, что все исследовательские стадии тесно связаны между собой, и решения, принимаемые на определенной стадии, могут сказаться на других стадиях. В данном случае решения, имеющие отношение к этапу 6, на котором определяется метод анализа, могут сказаться на результатах этапа 5, заключающегося в определении требуемого объема выборки. Соответственно, прежде чем приступать к процессу сбора данных, исследователю необходимо тщательно продумать все аспекты обследования, включая и метод анализа данных.

<<< < Предыдущая 1 2 3 4 56 / 86 7 8 > Следующая >>>

Соседние файлы в папке Часть 5

#
01.05.2014526.85 Кб35Глава 15.doc
#
01.05.2014358.91 Кб37Глава 16.doc
#
01.05.2014261.12 Кб37Глава 17.doc
#
01.05.2014445.95 Кб40Глава 18.doc
#
01.05.2014348.16 Кб32ПРИМЕРЫ к части 5.doc