
rek_market_lekzii / ЛРМ 4
.docИз табл. 8.3 видно, что при доверительном интервале со значением не более чем ±3% при ожидаемой доле утвердительных ответов:— объем выборки должен составлять 400;
-
10% - объем выборки должен составлять 400
-
20% — объем выборки должен составлять 700;
-
85% — объем выборки должен составлять около 600.
Таким образом, окончательный объем выборки при данных значениях должен составлять 700 человек (наибольший из трех требуемых объемов выборки).
Бывают случаи, когда необходимо задать другой доверительный уровень. Следовательно, примером, приведенным в таблице, руководствоваться нельзя.
В этом случае объем выборки можно определить по формуле:
где z – z-балл, соответствующий требуемому доверительному уровню, а е — желаемый доверительный интервал. Z-баллы для различных доверительных уровней приведены в таблице.
Доверительный уровень в % |
Z-балл |
99 |
2,57 |
95 |
1,96 |
90 |
1,64 |
Представьте, например, следующую ситуацию. Вы обратились к группе респондентов с вопросом: "Знакомы ли вы с рекламой офисного оборудования фирмы Lanierl", ожидая получить утвердительный ответ от 35% опрашиваемых. Кроме того, вам необходимо на 99% быть уверенными в том, что действительная доля положительных ответов будет находиться в пределах ±2%. Требуемый объем выборки при заданном доверительном уровне получается следующим образом:
= (128,5)2х(0,35)х(0,65).
Объем выборки велик, так как доверительный уровень и доверительный интервал задают высокий уровень точности. Однако объем выборки будет гораздо меньшим, если доверительный интервал возрастет до ±4%, а доверительный уровень снизится до 95%:
100 300 500 700 900 1,500 2,500 4,000 200
400 600 800 1,000 2,000 3,000 5,000 Объем
-
ожидаемая реакция – 50%
-
ожидаемая реакция – 25% или 75% (ответы/неответы)
-
ожидаемая реакция – 10% или 90% (ответы/неответы)
Зависимость между объемом выборки и доверительным уровнем для трех значений ожидаемой ответной реакции при 95% -ном доверительном интервале.
Если полагать, что доверительный уровень имеет постоянную величину, то чтобы уменьшить доверительный интервал вдвое, объем выборки следует увеличить вчетверо. Например, при ожидаемой доле в 20% выборка из 100 участников обеспечивает доверительный интервал ±8%, выборка из 400 — ±4%, а выборка из 1600 участников— ±2%. Зависимость между точностью (выражающейся в меньших доверительных интервалах) и объемом выборки показана на рис. 8.2. Как видим, точность значительно увеличивается при небольшом увеличении объема выборки (приблизительно до 1000 участников), однако увеличение точности существенно замедляется, если объем выборки превышает 1000 участников. Вот почему при проведении большей части потребительских, маркетинговых и рекламных исследовательских работ выборка редко превышает 1000 участников.
Вычисление объема выборки в случае, когда оценивается среднее значение. Можно также определить объем выборки, если требуется оценить среднее значение в генеральной совокупности. В этих случаях, кроме указания доверительного уровня и доверительного интервала, необходимо располагать оценкой изменчивости изучаемого признака. (Мерой изменчивости переменной является среднеквадратическое (стандартное) отклонение. Поскольку значение среднеквадратического отклонения в генеральной совокупности редко бывает известно, его можно оценить одним из следующих трех способов.
-
Воспользуйтесь оценкой среднеквадратического отклонения на основании предыдущих аналогичных исследований, проведенных на той же генеральной совокупности.
-
Проведите небольшое пилотажное исследование; используйте среднеквадратическое отклонение, полученное в пилотажных исследованиях, в качестве оценки среднеквадратического отклонения в генеральной совокупности.
-
Вычислите сумму максимального и минимального значений изучаемой переменной и разделите ее на четыре.
Оценив среднеквадратическое отклонение и определив доверительный интервал и доверительный уровень, оценку объема выборки можно получить по следующей формуле:
объем выборки =
где так же, как и в предыдущей формуле, z представляет z-балл, соответствующий конкретному доверительному уровню (взят из приведенной ранее таблицы), а е — желаемый доверительный интервал. Новый член этой формулы, s, является оценкой среднеквадратического отклонения в генеральной совокупности.
Приводим пример, подобный только что рассмотренному. Представьте следующую ситуацию. Вы обратились к группе респондентов с просьбой: "Дайте, пожалуйста, оценку правдоподобия рекламы офисного оборудования фирмы Lanier по шкале от одного до пяти". Вы хотите на 95% быть уверенными в том, что истинное значение среднего рейтинга в генеральной совокупности будет находиться в пределах ±0,2 от среднего значения в выборке. Оценка среднеквадратического отклонения получена путем суммирования экстремальных значений шкалы и деления суммы на четыре, и равна 1,5 (т.е. 5 + 1:4=1,5). Необходимый объем выборки для заданного желаемого доверительного уровня будет равен 216. Рассчитывается он с помощью формулы:
Так же, как и в предыдущей формуле, изменения доверительного уровня и доверительного интервала приводят к изменениям требуемого объема выборки. Например, требуемый объем выборки значительно возрастает, если повысить доверительный уровень до 99% и уменьшить доверительный интервал до 0,1:
Таким образом, учет взаимосвязи между объемом выборки и точностью результатов опроса имеет значение при попытке достичь баланса между объемом выборки и степенью доверия. Рассматривая различные альтернативы объема выборки, следует задаться вопросом: "Оправдано ли достижение точности повышением стоимости сбора данных? Например, оправдано ли уменьшение доверительного интервала с +3% до ±1,5% при условии четырехкратного повышения стоимости интервьюирования?"
Центральная предельная теорема
Доверительные интервалы — это один из вопросов, рассматриваемых при определении объема выборки. Мы уже выяснили, что доверительные интервалы уменьшаются при увеличении общего объема выборки. Дополнительные соображения при определении объема выборки касаются типов статистических критериев, которые можно использовать при анализе данных. Некоторые статистические критерии используются только для выборки, состоящей из тридцати или более участников, тогда как другие — для выборки меньших размеров, состоящей из менее чем тридцати участников. Дифференциация между выборками большого и малого объема является отражением центральной предельной теоремы, которая утверждает, что если выборка имеет большой объем (состоит, по крайней мере, из тридцати участников), то распределение выборочных средних значений приближается к нормальному распределению независимо от характера распределения в генеральной совокупности, из которой извлекаются выборки. Таким образом, поскольку объем выборки влияет на выбор статистических критериев и интерпретацию результатов, выводы центральной предельной теоремы должны приниматься во внимание при разработке плана выборки и определении ее объема.
Неслучайная выборка
В предыдущем разделе рассматривались три типа случайной выборки: простая случайная, систематическая случайная и стратифицированная случайная. Каждая из этих схем отбора является вероятностной, так как все элементы заданной генеральной совокупности имеют известный и равный шанс быть выбранными
Однако, несмотря на все преимущества, не всегда при проведении исследований в области рекламы используют случайную выборку. Для удовлетворения одних информационных потребностей не нужна точность и обобщаемость случайной выборки, а для удовлетворения других время и средства, затраченные на проведение случайной выборки, являются неоправданными. В этих случаях используется иная форма отбора — так называемая неслучайная выборка, при которой элементы выбираются некоторым неслучайным образом. Основными формами неслучайной выборки являются выборка первого встречного, выборка на основе экспертного суждения, квотная выборка и целенаправленная выборка.
Формы неслучайного отбора
Выборка первого встречного. Выборка первого встречного проводится именно так, как указано в ее названии: участники исследований отбираются в силу своей доступности и соображений удобства сбора данных. Опрос друзей, коллег по работе, просто случайных прохожих на улице - вот типичные примеры такой схемы отбора, так же, как и выбор последних тридцати сделок, которые находятся под рукой. Формирование выборки первого встречного, как и следовало ожидать, - несложный, недорогостоящий и быстро осуществимый процесс.
При формировании выборки первого встречного существует серьезная вероятность, что полученная информация будет совершенно ненадежной. Следовательно, использовать ее можно только в том случае, если нет абсолютно никакой необходимости обобщать отношение и поведение участников выборки первого встречного на более широкую генеральную совокупность. Поскольку нет никакой уверенности в том, что отличительные особенности участников выборки первого встречного репрезентативны для более широкой генеральной совокупности, использовать выборку первого встречного можно лишь при проведении предварительных пилотажных исследований или для получения быстрой информации необобщающего характера, отвечающей отдельным потребностям исследований, например предварительного тестирования анкеты.
Выборка на основе экспертного суждения. При проведении выборки на основе экспертного суждения участники выбираются из состава целевой совокупности, исходя из суждений эксперта о характерных особенностях репрезентативной выборки. В роли жеперта могут выступать сам исследователь, сотрудники рекламного агентства, клиент, специалист в конкретной предметной области. Например, владелец магазина может отобрать на основании собственных суждений "типичных" заказчиков.
Уверенность в результатах исследований, проводимых на основе экспертных суждений, прямо пропорционально зависит от опыта эксперта, на основании которого определяется и извлекается выборка. Чем больше опыт, тем выше вероятность получения достоверных результатов. Например, выбор городов для маркетингового тестирования нового товара почти всегда осуществляется на основе экспертных суждении. Лица, хорошо знающие товар и различные города Российской Федерации, скорее всего, остановят свой выбор на более подходящих городах, в отличие от случайного выбора. С другой стороны, эксперт может полагать, что наиболее подходящей целевой аудиторией программы сбережений для поступления в колледж являются родители, имеющие детей от 10 до 17 лет. Если это суждение неверно, исследования, проводимые среди данной аудитории, будут осуществляться в неправильном направлении. Выборка на основе экспертных суждений рекомендуется только в том случае, если есть абсолютная уверенность в объективности мнения эксперта, или, как и в случае с выборкой первого встречного, когда необходимо получить сугубо предварительную, разведочную информацию.
Квотная выборка. Квотная выборка — наиболее сложная форма неслучайного отбора. При использовании квотной выборки добиваются того, чтобы интересующие исследователя демографические характеристики были представлены в выборке в той же пропорции, что и в целевой генеральной совокупности. Квотная выборка проводится в пять этапов.
-
Установление определяющих характеристик ключевых подгрупп.
-
Определение процента всей совокупности по каждой из характеристик.
-
Определение процента от всей совокупности по каждой из ячеек квоты.
-
Пересчет процентного отношения в объем выборки.
-
Извлечение выборки из генеральной совокупности.
Таблица 8.4. Определение объема выборки квотным методом. Процент целевой совокупности, попадающий в ячейки квоты
Образование
Пол |
Не получившие среднего образования |
Получившие среднее образование |
Учились в колледже |
Окончили колледж и выше |
Всего, % |
Мужчины Женщины Всего |
10 11 21 |
17 18 35 |
11 12 23 |
10 11 21 |
48 52 100 |
В табл. 8.4 отражен результат выполнения перечисленных шагов.
Во-первых, генеральная совокупность была разделена на основании признаков пола и полученного образования.
Во-вторых, процент людей в генеральной совокупности, обладающих соответствующим значением каждого признака, внесен в итоговые строку и столбец.
В-третьих, предполагая, что две характеристики являются независимыми, процент генеральной совокупности в каждой из ячеек рассчитывался умножением соответствующих итоговых значений по строке и столбцу. Например, доля мужчин, не получивших среднего образования, получена перемножением 0,21 (доля всего населения, не получившего среднего образования) и 0,48 (доля мужчин в генеральной совокупности). В-четвертых, вся выборка из 400 участников распределяется на основе процентного соотношения. (В этом примере общая выборка из 400 участников является достаточной по объему для каждой из ячеек для проведения сравнительного анализа подгрупп. Если бы это было не так, общий объем выборки следовало бы увеличить.) Наконец, выборка извлекается таким образом, чтобы каждая из ячеек квоты была заполнена согласно составленному плану.
Определение объема выборки квотным методом Процент целевой совокупности, попадающей в ячейки квоты
Пол |
Не получившие среднего образования |
Получившие среднее образование |
Учились в колледже |
Окончили вуз |
Всего,% |
м |
10 |
17 |
11 |
10 |
48 |
ж |
11 |
18 |
12 |
11 |
52 |
Всего |
21 |
35 |
23 |
21 |
100 |