Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii (1) / Лекции 1 кт / Лек 7 - Выборочное обследование.doc
Скачиваний:
50
Добавлен:
09.02.2015
Размер:
126.46 Кб
Скачать

Отличия между кластерной и стратифицированной выборкой

Кластерная выборка

Стратифицированная выборка

Выборка формируется только из некоторых субпопуляций (кластеров)

Выборка формируется из всех субпопуляций (страт)

В пределах кластера элементы должны отличаться (быть разнородными), тогда как поддерживается однородность или схожесть между различными кластерами

В пределах страты элементы должны быть однородными, а между стратами должны быть различия (разнородность)

Схема выборки нужна только для кластеров, попавших в выборку

Должна быть сформирована полная схема выборки для всех стратифицированных субпопуляций

Повышает эффективность выборки, умень-шая стоимость

Повышает точность

Одной из наиболее распространенных форм кластерной выборки является пространственная выборка. Пространственная выборка основана на кластеризации по географическим областям, таким как округа, жилые участки и кварталы. Выборка может быть получена за один или несколько этапов. При одноэтапной выборке происходит выборка всех элементов из данного кластера. Например, если за кластеры принимаются городские кварталы, тогда все семьи в отобранных кварталах должны быть включены в выборку. В случае двухэтапной выборки только часть семей, прожи-вающих в каждом квартале, попадет в выборку [5].

Кластерная выборка имеет два основных преимущества: легкая осуществимость и низкая стоимость. Так как структуры выборки часто составляются на основании кластеров, а не элементов популяции, кластерная выборка может быть единственно возможным подходом. Принимая во внимание ограниченность ресурсов проекта исследования, составление списка всех элементов популяции может быть очень дорогостоящей, или даже неосуществимой задачей. Однако списки географических районов, телефонных узлов и прочих кластеров потребителей можно составить сравнительно легко. Кластерная выборка является самым экономически эффективным методом выборки. Это преимущество следует рассматривать, принимая во внимание то, что существуют и некоторые ограничения. При кластерном методе построения получаются некачественные выборки, в которых трудно сформировать отличающиеся, разнородные кластеры. Например, семьи, проживающие в одном квартале, скорее будут похожими, чем непохожими. Вычисление и интерпретация статистики на основании кластеров может быть сложной задачей.

7.5 Определение объема выборки различными методами

Поскольку выборка является частью изучаемой совокупности, полученные выборочные данные скорее всего не будут в точности соответствовать данным, которые можно было бы получить при изучении всех единиц генеральной совокупности. Различие между выборочными и истинными данными называется ошибкой выборки. Она обусловливается методом формирования и размером выборки.

Для определения размера выборки необходимо учитывать целый ряд финансовых, статистических и управленческих вопросов. Известно, что чем больше объем выборки, тем меньше ее ошибка. Однако большая выборка дорогостоящая, а имеющиеся в наличии денежные средства всегда ограничены. Кроме того, стоимость выборки растет пропорционально ее объему, а ошибка выборки уменьшается по норме, равной квадратному корню из относительного роста размера выборки. Другими словами, если размер выборки увеличить в 4 раза, то ошибка выборки уменьшится только на половину.

На практике используется несколько методов определения объема выборки (приложение Б): произвольный; традиционный; статистический; графический; эмпирический; затратный.

Произвольный подход основан на том, что бездоказательно принимается, что для получения точных результатов выборка должна составлять 1 % от совокупности. Данный подход является простым и легким в исполнении, однако не представляется возможным установить точность полученных результатов. При достаточно большой совокупности он к тому же может быть и весьма дорогим.

Объем выборки может быть установлен исходя их неких заранее оговоренных условий. Скажем, заказчик маркетингового исследования знает, что при изучении общественного мнения выборка обычно состав-ляет 1000–1200 человек, поэтому он рекомендует исследователю придерживаться данной цифры. В случае, если на каком-то рынке проводятся ежегодные исследования, то в каждом году используется выборка одного и того же объема. В отличие от первого подхода при определении объема выборки традиционным методом используется известная логика, которая, однако, является весьма уязвимой. Например, при проведении определенных исследований может потребоваться точность меньше, чем при изучении общественного мнения, да и объем совокупности может быть во много раз меньше, нежели при изучении общественного мнения. Таким образом, данный подход не принимает в расчет текущие обстоятельства, может быть достаточно дорогим.

Объем выборки может определяться на основе статистического анализа. Этот подход основан на определении минимального объема выборки исходя из определенных требований к надежности и достоверности полученных результатов. Он также используется при анализе полученных результатов для отдельных подгрупп, формируемых в составе выборки по полу, возрасту, уровню образования и т.п. Требования к надежности и точности результатов для отдельных подгрупп диктуют определенные требования к объему выборки в целом.

1. Размер повторной выборки при неизвестном объеме генеральной совокупности, но известном распределении контролируемого признака определяется по формуле (1):

n =, (1)

где t – нормированное отклонение, которое определяется по выбранному уровню доверительной вероятности. Обычно используется два значения уровня доверительности: 95 % или 99 %, которым соответствуют t =1,96 и t = 2,58; p – вероятность наступления интересующего события; g – 100 – p; – допустимая ошибка, в % или в долях.

2. Размер повторной выборки при известной дисперсии изучаемого признака определяется по формуле (2):

n = , (2)

где дисперсия изучаемого признака, определяется по формуле (3):

, (3)

где – средняя величина показателя, определяется по формуле (4):

. (4)

3. Размер бесповторной выборки при известном объеме генеральной совокупности и известном распределении контролируемого признака, определяется по формуле (5):

n=, (5)

где N – объем генеральной совокупности.

4. Размер бесповторной выборки при известной дисперсии изучаемого признака определяется по формуле (6):

n =. (6)

В ряде случаев в качестве главного аргумента при определении объема выборки используется стоимость проведения обследования. Так, в бюджете маркетинговых исследований предусматриваются затраты на проведение определенных обследований, которые нельзя превышать. Очевидно, что ценность получаемой информации не принимается в расчет. Однако в ряде случаев и малая выборка может дать достаточно точные результаты.

Стремление упростить процедуру расчета объема выборки приводит к созданию номограмм, которые ориентированы на обеспечение статистической надежности информации, но при этом не обременяют пользователя знаниями специальных формул из области статистики.

При использовании эмпирического метода выборка считается достаточной, когда все новые сведения вносят лишь незначительные изменения (которыми можно пренебречь) в уже собранные результаты исследования.

Представляется разумным учитывать затраты не абсолютным образом, а по отношению к полезности информации, полученной в результате проведенных обследований. Заказчик и исследователь должны рассмотреть различные объемы выборки и методы сбора данных, затраты, учесть другие факторы [2].