- •1. Выборочный метод в системе статистического обследования.
- •1. Понятие и сущность выборочного наблюдения
- •3. Инструменты выборочного обследования.
- •5. Преимущество выборочного метода перед сплошным наблюдением.
- •2. Теоретические основы применения выборочного метода.
- •1. Основные законы случая и их роль в выборочных наблюдениях
- •2. Средняя и предельная ошибки выборки. Теоремы Чебышева и Ляпунова
- •3. Теорема Бернулли. Уточнение формулы средней ошибки выборки
- •3. Подготовка и организация выборочного обследования.
- •2. Программа проведения выборочного обследования
- •3. Разработка формуляр выборочного обследования
- •2. Построение основы выборки
- •4. Определение объема выборки.
- •1. Основные этапы определения объема выборки
- •2. Определение объема выборки в случае непрерывных переменных
- •3. Определение объема выборки при оценивании долей и процентов
- •5. Простой случайный отбор.
- •1. Формирование простой случайной выборки
- •2. Параметры выборочной совокупности
- •6. Расслоенный случайный отбор.
2. Параметры выборочной совокупности
При выборочном обследовании сосредотачивается внимание на определенных свойствах единичной совокупности, которые пытаются измерить и зафиксировать для каждой единице попавшей в выборку. Эти свойства называют параметрами, характеристиками или просто признаками.
Численное значение, полученное для какого-либо признака для N совокупности единиц, обозначается через YN (y1, y2,…, yN). Соответствующее значение для единиц, попавших в выборку, обозначается через yi (i = 1, n). Заглавные буквы относятся к характеристикам параметров генеральной совокупности, а строчные – параметрам выборочной совокупности. Для арифметических и средних значений будут использоваться следующие определения:
|
Генеральная совокупность |
Выборочная совокупность |
Суммарное значение |
Y= |
|
Среднее значение |
|
|
Наибольший интерес при проведении выборочного обследования представляют следующие 4 характеристики совокупности:
Среднее значение . Например, средне число детей на одну семью.
Суммарное значение Y. Например, общая посевная площадь агрофирм района.
Отношение двух суммарных или средних значений R или R= . Например, соотношение стоимости ликвидного имущества к общей стоимости имущества у группы семей.
Доля единиц, попадающих в некоторую определенную группу P.
Рассмотрим оценивание первых трех характеристик.
Символ обозначает оценку значения некоторого признака для совокупности, сделанную по выборке.
Рассмотрим только наиболее простые оценки:
Характеристики |
Оценка |
Среднее значение для совокупности |
= |
суммарное значение для совокупности Y |
|
Отношение двух совокупностей R |
|
Входящий в расчет оценки суммарного значения для совокупности множитель называется множителем распространения (повышения, инфляции). Величина обратная ему: называется долей отбора (f - частота).
Свойства оценок
Точность какой-либо оценки, полученной по выборке, зависит от двух факторов:
от способа, которая оценка вычисляется по данной выборке;
от способа отбора.
Способ оценивания называется состоятельным, если оценка становится в точности равной оцениваемому значению для совокупности при n=N, то есть когда выборку составляет вся генеральная совокупность.
При простом случайном отборе и суммарное значение для совокупности N* представляют собой состоятельные оценки соответственно среднего и суммарного значения для генеральной совокупности.
Состоятельность является желательным свойством оценки.
Но применение может найти и несостоятельная оценка, в том случае если она обеспечивает удовлетворительную точность в случае, когда численность выборки n мала по сравнению с численностью генеральной совокупности N.
Существует и другое определение состоятельности для случая конечной совокупности. Его дают такие ученые, как Медоу, Хансем, Хервиц:
« Способ оценивания называется несмещенным, если среднее значение оценки взятое по всем возможным выборкам данного объема n в точности равно истинному значению для совокупности.»
Если метод называют несмещенным без всяких оговорок, то это утверждение справедливо для любой совокупности конечных значений и для любого объема выборки n.
При простом случайном отборе выборочная средняя есть несмещенная оценка среднего значения генеральной совокупности ; несмещенная оценка суммарного значения для генеральной совокупности Y равна произведению N* .
Дисперсии оценок
Дисперсия yi для конечной совокупности обычно рассчитывается по формуле:
Для генеральной совокупности можно воспользоваться несколько иным выражением:
В таком виде формула дисперсии применяется в том случае, если теория выборочного метода рассматривается с точки зрения дисперсионного анализа. Преимущество такой записи в том, что большинство результатов принимают более простой вид, при условии, что одни и те же значения применяются постоянно и все результаты эквивалентны в любой из двух форм записи.
Стандартная ошибка выборочного среднего для простой случайной выборки определяется по формуле:
Дисперсия простого выборочного среднего находится по формуле:
Дисперсия величины оценки , которая является оценкой суммарного значения для генеральной совокупности, определяется по формуле:
Стандартную ошибку определяют по формуле:
Поправка на конечность совокупности (ПКС).
Для случайной выборки объема n из бесконечной совокупности дисперсия среднего равна .
Если совокупность конечна, то в этом случае необходимо ввести множитель .
Множители для дисперсии , для СКО называются поправками на конечные совокупности.
Если доля отбора остается низкой, то эти множители приближаются к единице и объем совокупности сам по себе не оказывает непосредственного влияния на стандартную ошибку выборочного среднего. На практике поправку на конечность совокупности можно не учитывать, если доля отбора не превышает 5%, а для некоторых целей, если достигает 10%. В том случае, если поправка не учитывается вообще, то это приводит к некоторым преувеличениям стандартной ошибки выборочного среднего .
Оценивание стандартной ошибки по выборке.
Формулы стандартных ошибок оценок средних и средних значений для генеральной совокупности применяются в основном для трех целей:
Сравнить точность, которая дает простой случайный отбор с точностью других способов отбора.
Оценить объем выборки, необходимой для предполагаемого обследования.
Оценить точность действительно достигнутого в проведенном выборочном обследовании.
В эти формулы входит дисперсия для генеральной совокупности S2, в действительности она не известна, но ее можно оценить по данным выборки.
Для простой случайной выборки:
Для стандартных ошибок среднего и суммарного значений выборочной совокупности используется следующая формула:
Доверительные границы.
При случайном отборе предполагается, что оценки и нормально распределены относительно соответствующих значений для совокупности на основании такого предположения нижняя и верхняя доверительные границы среднего и суммарного значения для совокупности имеют следующий вид:
Для среднего значения
Для суммарного значения:
Где, t – квантиль нормального распределения соответствующей желательной доверительной вероятности.
Наиболее употребительное значение:
Доверительная вероятность, % |
50 |
80 |
90 |
95 |
T |
0,67 |
1,28 |
1,64 |
1,96 |
Если объем выборки n меньше 60, то значение квантилей можно взять t – распределение Стьюдента.
Оценивание отношения.
Часто величиной, которую нужно оценить по простой случайной выборке служит отношение двух переменных, значение которых изменяется от единицы к единице совокупности.
Например, при обследовании домохозяйств это может быть среднее число костюмов приходящихся на одного взрослого мужчину, средние расходы на косметику на одну женщину и так далее.
Для того чтобы оценить среднее число костюмов приходящихся на одного взрослого мужчину необходимо для каждого i-домохозяйства зарегистрировать число взрослых мужчин xi и общее число принадлежащих им костюмов yi. Параметром совокупности, который необходимо оценить будет являться отношение:
R=
Выборочной оценкой параметра R является
Такого рода отношения часто возникают в том случае, когда единица отбора (домохозяйство) представляет собой группу элементов (взрослых мужчин). А нас интересует среднее значение для совокупности на один элемент.
Такие отношения могут встречаться и в других случаях. Например: отношение банковских ссуд на строительство к общему объему банковских ссуд, или отношение площади, занятой под посевами пшеницы к общей площади земли агрофирмы.
Если переменные yi и xi наблюдаются для каждой единицы простой случайной выборки объемом n, то дисперсия приближенно составит:
R=
Оценка стандартной ошибки по выборке определяется по формуле:
Если неизвестно, то в знаменатель можно поставить его выборочную оценку .
Для более удобного расчета оценки стандартной ошибки отношения выше приведенную формулу можно записать в следующем виде: