Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Otvety_po_mat_statistike.docx
Скачиваний:
7
Добавлен:
01.03.2025
Размер:
378.66 Кб
Скачать

Мат.Статистика

1)Измерение социальных явлений и процессов. Измерительные шкалы: номинальные, ранговые (порядковые) и интервальные.

Под измерением в социологическом исследовании понимаетсяпроцедура, с помощью которой объекты измерения, рассматриваемые как носители соответствующих отношений, отображаются в некоторую математическую систему с соответствующими отношениями между элементами. Это процедура приписывания чисел значениям изучаемого признака, целью которой является получение числовой модели исследования.

Под шкалой понимается тот алгоритм, с помощью которого устанавливается соответствие между свойствами социального объекта и свойствами сопоставляемых чисел. В социологии обычно выделяют следующие виды шкал:

номинальные,

порядковые (ранговые),

метрические (шкалы отношений, интервальные).

Номинальная шкала это шкала соответствия социальных свойств равенства и неравенства соответствующим числовым отношениям с целью отличия одного социального объекта от другого, то есть выявление непересекающихся классов - каждый класс соответствует определенной позиции на шкале. Например, пол: мужской - 1, женский - 2; мужчины: холостой - 1, женатый - 2, разведенный - 3, вдовец - 4. Это закрытые вопросы, то есть все возможные ответы предлагаются респонденту. При этом решаются следующие задачи: во-первых, измеряется количество каждого признака; во-вторых, определяется различие между ними. Для выполнения второй задачи достаточно решить математическое уравнение сравнения равенства или неравенства, при этом первая задача решается методом выбора той или иной категории или числового балла на шкале или применением открытых вопросов, то есть вопросов, в которых дается респонденту возможность дать свой ответ, например, “Ваш возраст?”, “Ваше образование?”, “Ваше отношение к коллективному отдыху? - 1. Мне нравится отдыхать коллективом, 2. Предпочитаю отдыхать один, 3. Предпочитаю незнакомую компанию, 4. Другое, напишите свой ответ” и т.п.

Порядковая (ранговая) шкала это шкала соответствия социальных свойства равенства или неравенства и их степени выраженности с соответствующими числовыми отношениями. Например, удовлетворенность чем-либо: полностью - 5, скорее да чем нет - 4, трудно сказать - 3, скорее нет - 2, полностью не удовлетворен - 1. Для этого помимо задач, приведенных в номинальных шкалах, необходимо измерить интенсивность выраженности признаков. Чтобы решить эту задачу, достаточно выполнить математического сравнение "больше", "меньше" и расположить признаки в порядке возрастания или убывания, то есть проранжировать.

Метрическая шкала это шкала соответствия социальных свойств равенства или неравенства и пропорций внутри них с соответствующими числовыми отношениями. Например, равных пропорций - определение возрастных групп: 16-20 лет - 1, 21-25 лет - 2, 26-30 лет - 3; неравных пропорций - срок службы: 1-2 года - 1, 2-5 лет - 2, 5-20 лет - 3, 20-25 лет - 4, более 25 лет - 5. Если на шкале ноль условный, то это интервальная шкала, если естественный - шкала отношений (возраст, заработанная плата и т.д.). Метрические шкалы помимо задач, решаемых с помощью номинальных и порядковых шкал, позволяют ответить на вопрос: на сколько или во сколько раз интенсивность выраженности одного признака больше или меньше другого.

Обращение к респонденту с целью получения от него информации по теме исследования называется вопросом. Вопросы отражают интерпретацию основных понятий исследования.

При составлении анкет, карточек наблюдения и т.п. наиболее часто встречаются такие ошибки, как обнаружение установки исследователя, неадекватность терминов и ошибка несоразмерности, состоящая в предложении выбрать одну или несколько ценностей, несопоставимых между собой. Правильно составленный опросник - важное условие успешного решения задач социологического исследования, обеспечения его качества, надежности результатов.

Качество измерения зависит от регистрации характеристик отобранных единиц исследования Надежность заключается в гарантии однозначности получаемой социологической информации. Вероятность отсутствия систематических ошибок - обоснованность (употребляется так же термин “валидность”) выражается в том, что шкала должна измерять те свойства и характеристики, которые планируются для измерения, не смешивая их с другими. Вероятность отсутствия случайных ошибок обеспечивается устойчивостью и точностью измерения. Устойчивость это способность шкалы давать однозначную информацию при любом повторном измерении, точность - степень совпадения полученных данных с истинной величиной. Чувствительность измерения заключается в способности выявлять отношение респондентов к изучаемому явлению с той или иной степенью достоверности, она основана на полноте - учете всех значений индикаторов. Основными способами проверки измеренияявляются:обоснованности - логические рассуждения, тест по известной группе (например, экспертные оценки для отбора пунктов шкалы и т.д.), поиск независимого критерия (регистрация приборами, данные документов и т.д.);устойчивости - повторные измерения, использование нескольких лиц (групп) для измерения одного свойства, расщепление шкалы (каждому индикатору присваиваются два синонима);точности - устранение явных погрешностей (то, что в шкале лишнее, не работает), установление оптимальной величины дробности шкалы при высокой устойчивости.

В социологическом исследовании применяются количественный и качественный способы измерения, сущность которых заключается в выборе респондентами той или иной категории или цифрового балла из серии предложенных ответов, с последующей логико-математической обработкой полученных статистических результатов. При этом основными способами проверки обоснованности и надежности измерительных шкал являются: логико-математический и статистический анализ; определение системы независимых критериев, например сведения документов, результаты экспертиз, апробированных методик и т.д.

2)Выборочный метод статистического исследования. Генеральная и выборочная совокупности. Репрезентативность выборочной совокупности. Статистические исследования очень трудоемки и дороги, поэтому возникла мысль о замене сплошного наблюдения выборочным.

Основная цель несплошного наблюдения состоит в получении характеристик изучаемой статистической совокупности по обследованной ее части.

Выборочное наблюдение – это метод статистического исследования, при котором обобщающие показатели совокупности устанавливаются только по отдельно взятой части на основе положений случайного отбора.

При выборочном методе изучению подвергается только некоторая часть изучаемой совокупности, при этом подлежащая изучению статистическая совокупность называется генеральной совокупностью.

Выборочной совокупностью или просто выборкой можно называть отобранную из генеральной совокупности часть единиц, которая будет подвергаться статистическому исследованию.Значение выборочного метода: при минимальной численности исследуемых единиц проведение статистического исследования будет происходить в более короткие промежутки времени и с наименьшими затратами средств и труда.

В генеральной совокупности доля единиц, которая обладает изучаемым признаком, называется генеральной долей (обозначается р), а средняя величина изучаемого варьирующего признака – это генеральная средняя (обозначается х).

В выборочной совокупности долю изучаемого признака называют выборочной долей, или частью (обозначается w), средняя величина в выборке – это выборочная средняя.

Если в период обследования будут соблюдены все правила его научной организации, то выборочный метод даст довольно точны результаты, и поэтому данный метод целесообразно применять для проверки данных сплошного наблюдения.

Этот метод получил широкое распространение в государственной и вневедомственной статистике, потому что при исследовании минимальной численности изучаемых единиц позволяет тщательно и точно провести исследование.

Изучаемая статистическая совокупность состоит из единиц с варьирующими признаками. Состав выборочной совокупности может отличаться от состава генеральной совокупности, это расхождение между характеристиками выборки и генеральной совокупности составляет ошибку выборки.

Ошибки, свойственные выборочному наблюдению, характеризуют размер расхождения между данными выборочного наблюдения и всей совокупности. Ошибки, возникающие в ходе выборочного наблюдения, называются ошибками репрезентативности и делятся на случайные и систематические.Если выборочная совокупность недостаточно точно воспроизводит всю совокупность из–за несплошного характера наблюдения, то это называют случайными ошибками, и их размеры определяются с достаточной точностью на основании закона больших чисел и теории вероятностей.Систематические ошибки возникают в результате нарушения принципа случайности отбора единиц совокупности для наблюдения. Статистическая совокупность - множество единиц, обладающих массовостью, типичностью, качественной однородностью и наличием вариации.

Статистическая совокупность состоит из материально существующих объектов (Работники, предприятия, страны, регионы), является объектом статистического исследования.

Единица совокупности — каждая конкретная единица статистической совокупности.

Одна и таже статистическая совокупность может быть однородна по одному признаку и неоднородна по другому.

Качественная однородность — сходство всех единиц совокупности по какому-либо признаку и несходство по всем остальным.

В статистической совокупности отличия одной единицы совокупности от другой чаще имеют количественную природу. Количественные изменения значений признака разных единиц совокупности называются вариацией.

Вариация признака — количественное изменение признака (для количественного признака) при переходе от одной единицы совокупности к другой.

Признак - это свойство, характерная черта или иная особенность единиц, объектов и явлений, которая может быть наблюдаема или измерена. Признаки делятся на количественные и качественные. Многообразие и изменчивость величины признака у отдельных единиц совокупности называется вариацией.

Атрибутивные (качественные) признаки не поддаются числовому выражению (состав населения по полу). Количественные признаки имеют числовое выражение (состав населения по возрасту).

Показатель — это обобщающая количественно качестванная характеристика какого-либо свойства единиц или совокупности в цельм в конкретных условиях времени и места.

Система показателей — это совокупность показателей всесторонне отражающих изучаемое явление.

Например, изучается зарплата:

Признак — оплата труда

Статистическая совокупность — все работники

Единица совокупности — каждый работник

Качественная однородность — начисленная зарплата

Вариация признака — ряд цифр

Генеральная совокупность и выборка из нее

Основу статистического исследования составляет множество данных, полученных в результате измерения одного или нескольких признаков. Реально наблюдаемая совокупность объектов, статистически представленная рядом наблюдений случайной величины , является выборкой, а гипотетически существующая (домысливаемая) — генеральной совокупностью. Генеральная совокупность может быть конечной (число наблюдений N = const) или бесконечной (N = ∞), а выборка из генеральной совокупности — это всегда результат ограниченного ряда наблюдений. Число наблюдений , образующих выборку, называется объемом выборки. Если объем выборки достаточно велик (n → ∞) выборка считается большой, в противном случае она называется выборкой ограниченного объема. Выборка считается малой, если при измерении одномерной случайной величины объем выборки не превышает 30 (n <= 30), а при измерении одновременно нескольких (k) признаков в многомерном пространстве отношение n к k не превышает 10 (n/k < 10). Выборка образует вариационный ряд, если ее члены являются порядковыми статистиками, т. е. выборочные значения случайной величины Х упорядочены по возрастанию (ранжированы), значения же признака называются вариантами.

Пример. Практически одна и та же случайно отобранная совокупность объектов — коммерческих банков одного административного округа Москвы, может рассматриваться как выборка из генеральной совокупности всех коммерческих банков этого округа, и как выборка из генеральной совокупности всех коммерческих банков Москвы, а также как выборка из коммерческих банков страны и т.д.

Совокупность и выборка. Репрезентативность выборки

Статистическая совокупность - объект статистического изучении, состоящий из качественно однородных единиц, но отличающихся по каким-то другим признакам.

Генеральная совокупность - совокупность единиц, подлежащая изучению, ее численность обозначается N.

Выборочная совокупность - часть единиц генеральной совокупности, отобранная в случайном порядке, ее численность обозначается n. Выборочное наблюдение - не сплошное наблюдение, при котором обследованию подвергается определенная часть единиц изучаемой совокупности, отобранная в случайном порядке.

Преимущества выборочного наблюдения:

1) при обследовании слишком больших совокупностей, когда сплошное наблюдение требует огромных затрат труда и средств;

2) при необходимости получения информации в сжатые сроки;

3) при невозможности сплошного наблюдения.

Основные принципы выборочного наблюдения

1) обеспечение случайности - заключается в том, что при отборе каждой из единиц изучаемой совокупности обеспечивается равная возможность попасть в выборку

1) -обеспечение достаточного числа отобранных единиц.

Репрезентативность выборки - представительность отобранной из всей изучаемой совокупности части в отношении тех признаков, которые изучаются или оказывают влияние на формирование обобщающих характеристик.

Суть выборочного метода - получение первичных данных наблюдением выборки, анализом и их распространением на всю генеральную совокупность, с целью получения достоверной информации, об исследуемом явлении.

Характеристики генеральной совокупности - средняя, дисперсия, доля - называются генеральными и соответственно обозначаются х, , р, где р - доля, отношение числа М единиц, обладающих данным признаком, ко всей численности генеральной совокупности, т. е. р = М/N.

Обобщающие характеристики в выборочной совокупности называются выборочными и обозначаются соответственно x, , , где - частость, отношение числа единиц, обладающих данным признаком, в выборочной совокупности л, т.е. = m/n.

Разность x - х= x, называется ошибкой репрезентативности выборочной средней, соответственно разность - р = называется ошибкой частости и разность - = - ошибкой дисперсии.

Ошибка репрезентативности - расхождение между выборочной характеристикой и предполагаемой характеристикой генеральной совокупности.

Систематические ошибки репрезентативности - ошибки, возникающие в связи с особенностями принятой системы отбора и обработки данных наблюдений или в связи с нарушением установленных правил отбора.

Случайные ошибки репрезентативности ошибки, возникающие в результате случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности.

Стандартная ошибка выборки:

Предельная ошибка выборки: (t-коэффициент доверия).

Величина случайной стандартной и предельной ошибки зависит:

1) от принятого способа формирования выборочной совокупности;

2) от объема выборки;

3) от степени колеблемости изучаемого признака в генеральной совокупности.

3)Случайный отбор и его виды. Простой случайный бесповторный отбор и простой случайный повторный отбор. Типический, механический и серийный отбор. На практике применяются различные способы Отбора. Принципиально эти способы можно подразделить на два вида:

1. Отбор, не требующий расчленения генеральной совокупности на части. Сюда относятся: а) простой случайный бесповторный отбор; б) простой случайный повторный отбор.

2. Отбор, при котором генеральная совокупность разбивается на части. Сюда относятся: а) типический отбор; б) механический отбор; в) серийный отбор. Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности. Осуществить простой отбор можно различными способами. Например, для извлечения п объектов из генеральной совокупности объема N поступают так: выписывают номера от 1 до N на карточках, которые тщательно перемешивают, и наугад вынимают одну карточку; объект, имеющий одинаковый номер с извлеченной карточкой, подвергают обследованию; затем карточку возвращают в пачку и процесс повторяют, т. е. карточки перемешивают, наугад вынимают одну из них и т. д. Так поступают п раз; в итоге получают простую случайную повторную выборку объема п.Если извлеченные карточки не возвращать в пачку, то выборка является простой случайной бесповторной. При большом объеме генеральной совокупности описанный процесс оказывается очень трудоемким. В этом случае пользуются готовыми таблицами «случайных чисел», в которых числа расположены в случайном порядке. Для того чтобы отобрать, например, 50 объектов из пронумерованной генеральной совокупности, открывают любую страницу таблицы случайных чисел и выписывают подряд 50 чисел; в выборку попадают те объекты, номера которых совпадают с выписанными случайными числами. Если бы оказалось, что случайное число таблицы превышает число N, то такое случайное число пропускают. При осуществлении бесповторной выборки случайные числа таблицы, уже встречавшиеся ранее, следует также пропустить. Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части. Например, если детали изготовляют на нескольких станках, то отбор производят не из всей совокупности деталей, произведенных всеми станками, а из продукции каждого станка в отдельности. Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях генеральной совокупности. Например, если продукция изготовляется на нескольких машинах, среди которых есть более и менее изношенные, то здесь типический отбор целесообразен. Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект. Например, если нужно отобрать 20% изготовленных станком деталей, то отбирают каждую пятую деталь; если требуется отобрать 5% деталей, то отбирают каждую двадцатую деталь, и т. д. Следует указать, что иногда механический отбор может не обеспечить репрезентативности выборки. Например, если отбирают каждый двадцатый обтачиваемый валик, причем сразу же после отбора производят замену резца, то отобранными окажутся все валики, обточенные затупленными резцами. В таком случае следует устранить совпадение ритма отбора с ритмом замены резца, для чего надо отбирать, скажем, каждый десятый валик из двад­цати обточенных. Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Например, если изделия изготовляются большой группой станков-автоматов, то подвергают сплошному обследованию продукцию только нескольких станков. Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.Подчеркнем, что на практике часто применяется комбинированный отбор, при котором сочетаются указанные выше способы. Например, иногда разбивают генеральную совокупность на серии одинакового объема, затем простым случайным отбором выбирают несколько серий и, наконец, из каждой серии простым случайным отбором извлекают отдельные объекты.

4)Вариационный ряд. Эмпирическая функция распределения. Гистограмма и полигон. Пусть в некотором опыте наблюдается случайная величина Х с функцией распределения F(x). И пусть однократное осуществление опыта позволяет нам найти одно из возможных ее значений. Предположим, что опыт в одних и тех же условиях можно повторять какое угодно число раз, и что сами опыты (испытания) являются независимыми.

Результаты рассматриваемых n опытов представляют собой последовательность x1, x2, … , xn действительных чисел, которая называется выборкой объема n. Такова практическая трактовка выборки. Каждое xi (i=1, 2, …, n) называется вариантой(элементом выборки, наблюденным значением, значением признака).

Полученные в результате n опытов наблюдаемые значения x1, x2 xn представляют собой выборку из всей совокупности значений, которые может принимать интересующая нас величина Х. Принято говорить, что мы имеем дело с набором значений, соответствующим некоторой выборке из генеральной совокупности. Рассматриваемая выборка должна обладать свойством репрезентативности (представительности), то есть быть такой, чтобы по ее данным можно было получить правильное представление об всей генеральной совокупности в целом. Будет рассматриваемая выборка репрезентативной или нет – это зависит от способа отбора.

В математической литературе слово «выборка» гораздо чаще используется в другом смысле. Конкретную выборку x1, x2, …, xn мы можем рассматривать как реализацию значений системы случайных величин (X1, X2, …, Xn), распределенных одинаково, по тому же закону, что и Х.

Выборкой объема n из распределения случайной величины Х называется последовательность x1, x2, …, xn независимых и одинаково распределенных – по тому же закону, что и Х – случайных величин.

Часто в практических ситуациях возникает следующая задача: имеется выборка и отсутствует всякая информация о виде функции распределения F(x). Требуется построить оценку (приближение) для этой неизвестной функции F(x).

Наиболее предпочтительной оценкой функции F(x) является эмпирическая функция распределения Fn(x), которая определяется следующим образом

где nx – число вариант меньших х (х принадлежит R), n – объем выборки.

Функция Fn(x) служит хорошим приближением для неизвестной функции распределения для большихn. Эмпирическая функция распределения

Пусть известно статистическое распределение частот количественного признака X. Введем обозначения:

– число наблюдений, при которых наблюдалось значение признака, меньшее ;

– общее число наблюдений (объем выборки).

Ясно, что относительная частота события равна .

Если будет изменяться, то будет изменяться и относительная частота, то есть относительная частота есть функция от .

Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Эмпирической функцией распределения (функцией распределения выборки) называют функцию , определяющую для каждого значения относительную частоту события .

Итак, по определению , где – число вариант, меньших , – объем выборки.

Из определения функции вытекают следующие ее свойства:

1) значения эмпирической функции принадлежат отрезку

2) – неубывающая функция;

3) если – наименьшая варианта, то , при ;

если – наибольшая варианта, то при .

Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности. Для наглядности строят различные графики статистического распределения.

По данным дискретного вариационного ряда строят полигон частот или относительных частот.

Полигоном частот называют ломанную, отрезки которой соединяют точки (x1; n1), (x2; n2), ..., (xk; nk). Для построения полигона частот на оси абсцисс откладывают варианты xi, а на оси ординат - соответствующие им частоты ni. Точки ( xi; ni) соединяют отрезками прямых и получают полигон частот (Рис. 1).

Полигоном относительных частот называют ломанную, отрезки которой соединяют точки (x1; W1), (x2; W2), ..., (xk; Wk). Для построения полигона относительных частот на оси абсцисс откладывают варианты xi, а на оси ординат - соответствующие им относительные частоты Wi. Точки ( xi; Wi) соединяют отрезками прямых и получают полигон относительных частот.

В случае непрерывного признака целесообразно строить гистограмму.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны отношению ni / h (плотность частоты).

Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии ni / h.

Площадь i - го частичного прямоугольника равна hni / h = ni - сумме частот вариант i - го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны отношению Wi / h (плотность относительной частоты).

Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии Wi / h (Рис. 2).

Площадь i - го частичного прямоугольника равна hWi / h = Wi - относительной частоте вариант попавших в i - й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

5)Выборочные характеристики. Среднее значение выборочной случайной величины. Выборочная дисперсия и среднеквадратическое отклонение. Генеральная совокупность – это всё множество объектов, обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени, входящих в предмет изучения в соответствии с программой исследования. В социальных науках под объектами исследования и, соответственно, выборку составляют люди, но генеральную совокупность также могут составлять другие объекты (домохозяйства, предприятия, населенные пункты и т.д.).

Определения выборки:

1. Выборка – это некоторая часть объектов генеральной совокупности, которая выступает в качестве объектов непосредственного изучения.

2. Выборка (sample, set) — конечный набор прецедентов (объектов, случаев, событий, испытуемых, образцов, и т.п.), некоторым способом выбранных из множества всех возможных прецедентов, называемого генеральной совокупностью.

3. Выборка (Выборочная совокупность). Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.

Репрезентативность – свойство выборки воспроизводить характеристики генеральной совокупности. Таким образом, выборка должно быть копией генеральной совокупности относительно характеристик, существующих для цели исследования. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.

Характеристики выборки:

Качественная характеристика выборки – кого именно мы выбираем и как способы построения выборки мы для этого используем.

Количественная характеристика выборки – сколько человек выбираем, другими словами объём выборки.

Объём выборки зависит от однородности генеральной совокупности, необходимой точности исследования и от числа признаков, относительно которых производится выборка.Объем выборки определяется четырьмя факторами. Первый - число групп и подгрупп, анализ которых следует провести. Второй - ценность информации, которую должно предоставить исследование, и требуемая точность результатов. Третий фактор - стоимость выборки: следует провести анализ затрат и выгод. Если стоимость выборки низка, оправдано формирование большей по объему выборки. Четвертый фактор - разброс значений совокупности. Если все члены совокупности придерживаются единого мнения, вполне достаточно выборки из одного человека. По мере возрастания разброса мнения должен увеличиваться и объем выборки.

Ошибка выборки - отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности. Ошибка выборки бывает двух видов – статистическая и систематическая.

Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже. Например: Для простой случайной выборки размером 400 единиц максимальная статистическая ошибка (с 95% доверительной вероятностью) составляет 5%, для выборки в 600 единиц – 4%, для выборки в 1100 единиц – 3% Обычно, когда говорят об ошибке выборки, подразумевают именно статистическую ошибку.

Систематическая ошибка зависит от организации выборочного обследования (смещение выборки в сторону одного из полюсов выборочного параметра), отсутствие из подразделения генеральной совокупности.Например:использование любых вероятностных выборок занижает долю людей с высоким доходом, ведущих активный образ жизни. Происходит это в силу того, что таких людей гораздо сложней застать в каком-либо определенном месте (например, дома). Проблема респондентов, отказывающихся отвечать на вопросы анкеты (доля «отказников» в Москве, для разных опросов, колеблется от 50% до 80%). В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично.

Если Вам необходимо понять, сколько респондентов надо опросить с приемлемой точностью, чтобы их мнение можно было экстраполировать на всю генеральную совокупность — воспользуйтесь онлайн калькулятором объёма выборки.

Типы выборок

Выборки делятся на два типа:

- вероятностные

- невероятностные

Вероятностные выборки:

1. Простая вероятностная выборка:

Простая повторная выборка. Использование такой выборки основывается на предположении, что каждый респондент с равной долей вероятности может попасть в выборку. На основе списка генеральной совокупности составляются карточки с номерами респондентов. Они помещаются в колоду, перемешиваются и из них наугад вынимается карточка, записывается номер, потом возвращается обратно. Далее процедура повторяется столько раз, какой объём выборки нам необходим. Минус: повторение единиц отбора.

Простая бесповторная выборка. Процедура построения выборки такая же, только карточки с номерами респондентов не возвращаются обратно в колоду.

2.Систематическая вероятностная выборка. Является упрощенным вариантом простой вероятностной выборки. На основе списка генеральной совокупности через определённый интервал (К) отбираются респонденты. Величина K определяется случайно. Наиболее достоверный результат достигается при однородной генеральной совокупности, иначе возможны совпадение величины шага и каких-то внутренних циклических закономерностей выборки (смешение выборки). Минусы: такие же как и в простой вероятностной выборке.

3.Серийная (гнездовая) выборка. Единицы отбора представляют собой статистические серии (семья, школа, бригада и т.п.). Отобранные элементы подвергаются сплошному обследованию. Отбор статистических единиц может быть организован по типу случайной или систематической выборки. Минус: Возможность большей однородности, чем в генеральной совокупности.

4.Районированная выборка. В случае неоднородной генеральной совокупности, прежде, чем использовать вероятностную выборку с любой техникой отбора, рекомендуется разделить генеральную совокупность на однородные части, такая выборка называется районированной. Группами районирования могут выступать как естественные образования (например, районы города), так и любой признак, заложенный в основу исследования. Признак, на основе которого осуществляется разделение, называется признаком расслоения и районирования.

5.«Удобная» выборка. Процедура «удобной» выборки состоит в установлении контактов с «удобными» единицами выборки - с группой студентов, спортивной командой, с друзьями и соседями. Если необходимо получить информацию о реакции людей на новую концепцию, такая выборка вполне обоснованна. «Удобную» выборку часто используют для предварительного тестирования анкет.

Невероятностные выборки (отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д.):

1.<Квотная выборка – выборка строится как модель, которая воспроизводит структуру генеральной совокупности в виде квот (пропорций) изучаемых признаков. Число элементов выборки с различным сочетанием изучаемых признаков определяется с таким расчётом, чтобы оно соответствовало их доле (пропорции) в генеральной совокупности. Так, например, если генеральная совокупность у нас представлена 5000 человек, из них 2000 женщин и 3000 мужчин, тогда в квотной выборке у нас будут 20 женщин и 30 мужчин, либо 200 женщин и 300 мужчин. Квотированные выборки чаще всего основываются на демографических критериях: пол, возраст, регион, доход, образование и прочих.

Плюсы: обычно такие выборки репрезентативны.

Минусы: применение данного способа построения выборки возможно при наличии достаточно полной информации о генеральной совокупности.

2.Метод снежного кома. Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)

3.Стихийная выборка – выборка так называемого «первого встречного». Часто используется в теле- радио- опросах. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов.

Минусы: невозможно установить какую генеральную совокупность представляют опрошенные, и как следствие – невозможность определить репрезентативность.

4.Маршрутный опрос – часто используется, если единицей изучения является семья. На карте населённого пункта, в котором будет производится опрос, нумеруются все улицы. С помощью таблицы (генератора) случайных чисел отбираются большие числа. Каждое большое число рассматривается как состоящее из 3-х компонентов: номер улицы (2-3 первых числа), номер дома, номер квартиры. Например, число 14832: 14 – это номер улицы на карте, 8 – номер дома, 32 – номер квартиры.

5.Районированная выборка с отбором типичных объектов. Если после районирования из каждой группы отбирается типичный объект, т.е. объект, который по большинству изучаемых в исследовании характеристик приближается к средним показателям, такая выборка называется районированной с отбором типичных объектов.

Способы построения выборки:

1.Рандомизация, или случайный отбор, используется для создания простых случайных выборок. Использование такой выборки основывается на предположении, что каждый член популяции с равной вероятностью может попасть в выборку.

2.Попарный отбор — стратегия построения групп выборки, при котором группы испытуемых составляются из субъектов, эквивалентных по значимым для эксперимента побочным параметрам. Данная стратегия эффективна для экспериментов с использованием экспериментальных и контрольных групп.

3.Многоступенчатый способ построения выборки. При многоступенчатом отборе выборка строится в несколько этапов, причём на каждой стадии меняется единица отбора.

4.Многофазный способ построения выборки – является разновидностью многоступенчатого способа, заключается в том, что из сформированной выборки большего объёма производится новая выборка меньшего объёма, при этом, единица отбора остаётся одной и той же.

5.Комбинированный способ построения выборки – соединение в многоступенчатой выборке различных приёмов отбора.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]