Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ruhmanova_2012

.pdf
Скачиваний:
117
Добавлен:
08.04.2015
Размер:
1.26 Mб
Скачать

показатели являются случайными величинами, т. е. могут принимать различные значения. В связи с этим необходимо определить среднюю ошибку выборки, т. е. среднюю из возможных ошибок.

Значение средней ошибки выборки будет зависеть от объема выборочной совокупности и степени варьирования изучаемого признака.

Во-первых, чем больше единиц попадает в выборочную совокупность, тем полнее она характеризует (представляет, или репрезентирует) генеральную, следовательно, тем меньше средняя ошибка выборки, и наоборот.

Во-вторых, чем меньше вариация изучаемого признака, а следовательно, и дисперсия, тем меньше и средняя ошибка.

Указанные зависимости используются при расчетах величины средней ошибки выборки, когда неизвестны характеристики генеральной совокупности (например, x ) и нет возможности определить фактические ошибки выборки по рассмотренным выше формулам.

Величина средней ошибки выборки различна для отдельных разновидностей случайного отбора.

Однако вследствие того, что точное значение дисперсии признака в генеральной совокупности (σ 2 ) чаще всего неизвестно, на практике используют выборочную дисперсию ( S 2 ). В соответствии с действием закона больших чисел выборочная совокупность при довольно большом объеме выборки достаточно точно воспроизводит свойства генеральной совокупности.

При собственно-случайном бесповторном отборе проис-

ходит сокращение численности генеральной совокупности на ве-

личину (1 − n ) . Множитель (1 − n ) будет всегда меньше едини-

N N

цы, поэтому средняя ошибка выборки при бесповторном отборе всегда будет меньше, чем при повторном.

Если число единиц генеральной совокупности N неизвестно или численность выборочной совокупности n очень мала по

сравнению с N, то значение множителя (1 n ) будет близко к

N

единице. В этом случае им можно будет пренебречь, даже если выборка организуется как бесповторная.

141

Таблица 24

Характеристика видов средней ошибки выборки1

Вид отбора

Порядок расчета средней ошибки

выборки

 

Собственно-случайный:

μ ~

=

 

S

2

 

 

 

 

 

 

 

 

а) повторный

 

 

 

 

 

х

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

μ~

=

 

S 2

 

 

(1 −

 

 

 

n

) ,

 

 

 

 

 

 

 

 

 

 

б) бесповторный

 

 

 

х

 

 

 

n

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

 

доля выборки

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Механический2

 

μ~

=

 

 

S 2

 

 

(1 −

 

n

)

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

n

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Типический:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

μ~

=

 

 

 

Si2

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а) повторный

 

средняя из внутри-

где

S 2

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

групповых дисперсий по выбо-

 

рочной совокупности3;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) бесповторный

 

μ~

=

 

 

Si2

 

 

(1 −

n

)

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

n

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Серийный:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

μ ~

=

 

 

 

δ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

r

 

 

 

 

 

 

а) повторный

где r

число отобранных серий;

δ х2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

межгрупповая дисперсия

 

 

серийной выборки4

 

 

 

 

 

 

 

 

 

 

 

б) бесповторный

 

μ~ =

 

δ x2

 

 

(1 −

r

) ,

 

 

 

 

 

 

 

 

 

 

х

 

 

 

r

 

 

 

 

 

 

 

 

 

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где R

общее число серий

Примечания. 1 Расшифровку условных обозначений см. в п. 9.1.

2При достаточно большой совокупности этот отбор близок к собствен- но-случайному бесповторному отбору.

3Средняя из внутригрупповых дисперсий по выборочной совокупности рас-

 

 

=

Si2 ni

, где

2

— внутригрупповая дисперсия для i

считывается как

2

Si

n

Si

 

 

 

 

 

 

группы; ni — численность i-й группы; n

численность выборочной совокупности.

142

 

 

4 Межгрупповая

 

дисперсия серийной

выборки рассчитывается как

 

 

~

~

2

 

 

~

 

 

2

=

(xi

x )

~

— средняя i-й серии;

общая средняя по выбо-

δ x

r

 

, где

хi

х

 

 

 

 

 

 

 

 

 

рочной совокупности.

При механической выборке также может появиться опасность систематической ошибки, обусловленной случайным совпадением выбранного интервала и циклических закономерностей в расположении единиц генеральной совокупности. Так, при переписи населения 1989 г. в ходе 25%-го выборочного обследования семей имела место опасность попадания в выборку квартир только одного типа (например, только однокомнатных или только трехкомнатных), т. к. на лестничных площадках многих типовых домов располагаются именно по 4 квартиры. Чтобы избежать систематической ошибки, в каждом новом подъезде счетчик менял начало отбора.

Типическая выборка дает более точные результаты по сравнению с другими способами отбора, т. к. представительство каждой типологической группы обеспечивает репрезентативность выборки. В этом случае исключается влияние межгрупповой дисперсии на среднюю ошибку выборки. При определении средней ошибки типической выборки в качестве показателя вариации используется средняя из внутригрупповых дисперсий.

Следовательно, на величине полученной ошибки будет сказываться различие между единицами внутри этих групп, т. е. внутригрупповая вариация. Поэтому ошибка типической выборки будет определяться величиной не общей дисперсии, а только ее части — средней из внутригрупповых дисперсий.

При использовании серийной выборки из генеральной совокупности случайным образом отбираются равновеликие группы единиц (серии, гнезда), которые затем полностью и подробно изучаются.

В связи с тем что при серийном отборе внутри отобранных групп обследуются все без исключения единицы, внутригрупповая вариация признака не отразится на ошибках выборочного наблюдения. В то же время обследуются не все группы, а только попавшие в выборку.

143

Ввыделенных группах (сериях) исследуются все единицы.

Всвязи с этим средняя ошибка выборки при условии отбора равновеликих серий зависит только от межгрупповой (или межсерийной) дисперсии.

Ошибка выборки или отклонение выборочной средней от средней генеральной находится в прямой зависимости от дисперсии изучаемого признака в генеральной совокупности и в обратной зависимости от объема выборки. При проведении выборочного наблюдения дисперсия изучаемого признака в генеральной совокупности, как правило, неизвестна.

Всвязи с тем что на практике в большинстве случаев из генеральной совокупности в определенный момент времени производится только одна выборка, дисперсия изучаемого признака по этой выборке и используется при расчете ошибки.

Вкаждой конкретной выборке разность между выборочной и генеральной средней может быть меньше, больше или равной

 

~

 

 

< μ ~x ;

 

~

 

 

> μ ~x ;

 

~

 

 

 

средней ошибке выборки: (

x

 

x

 

x

= μ ~ ).

x

 

x

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При этом каждый из перечисленных вариантов имеет различную вероятность появления. В связи с этим можно считать, что разность между выборочной и генеральной средней является предельной ошибкой, связанной со средней ошибкой и определенной вероятностью появления. Предельная ошибка необходима для определения возможных границ значений характеристик генеральной совокупности. Согласно теореме А. М. Ляпунова, при достаточно большом количестве наблюдений вероятность того,

 

~

 

 

 

что разность между выборочной и генеральной средней

x

не

x

превысит по своему абсолютному значению некоторую величину tμ ~x , равна интегралу Лапласа (интегральной функции Лапласа).

Величина значим ее как

tμ ~x и есть предельная ошибка выборки. Если обо- ~x , то получим

~ = μ

x t ~x .

Таким образом, предельная ошибка выборки равна t числу средних ошибок выборки.

144

Значения интеграла Лапласа при различных величинах t как коэффициента кратности средней ошибки выборки представлены в специальных статистических таблицах. Рассмотрим наиболее часто используемые уровни доверительной вероятности (значения интеграла Лапласа) и соответствующие значения t для выборок большого объема ( n ³ 30 ):

P

0,683

0,950

0,954

0,997

t

1,000

1,960

2,000

3,000

Судя по значениям, приведенным выше, можно утверждать, что в 68,3 % случаев предельная ошибка не превысит значения ± 1μx% . При t = 2 с вероятностью 0,954 можно утверждать что расхождение между выборочной средней и генеральной средней будет не больше двукратной величины средней ошибки выборки ( ± ~x ) и т. д.

Как можно судить по последнему приведенному в таблице значению интегральной функции (0,997), вероятность появления

ошибки,

равной

или большей утроенного значения средней

ошибки (

Dx

³ x

Та-

~

 

~ ), составляет 0,3 % (или 1 – 0,997 = 0,003).

кое маловероятное событие считается практически невозможным,

 

Dx

= x

можно принять за предел возмож-

поэтому величину

~

~

ной ошибки выборки.

Кроме абсолютных значений предельной ошибки нередко рассчитывают и предельную относительную ошибку выборочной средней:

D= D ~

%~x *100 . x

9.3.Распространение выборочных результатов на генеральную совокупность

и определение необходимого объема выборки

Главной задачей выборочного наблюдения является характеристика генеральной совокупности на основе полученных выборочных показателей, т. е. распространение выборочных результатов на генеральную совокупность.

145

Значение выборочной средней распространяют на генеральную среднюю с учетом предельной ошибки. В этом случае предельные значения генеральной средней равны

= ~ ±

x x ~x ,

а границы доверительного интервала генеральной средней определяются следующим образом:

~ x

~

x

~ +

xx ~x .

Таким образом, можно утверждать, что с заданной вероятностью значение генеральной средней будет находиться в преде-

лах от ~ x

~

x

~

+ ~x .

до x

Очевидно, что, увеличивая объем выборки, можно уменьшить значения средней и предельной ошибок выборочного наблюдения и, следовательно, сузить границы доверительного интервала генеральной средней. Однако большой объем выборки приводит к увеличению сроков сбора и обработки информации, стоимости обследования, расхода материальных ресурсов, привлечению дополнительных кадров. Как показывает практика, затраты всех ресурсов на 20—30%- е выборочное наблюдение могут быть сопоставимы с расходами на сплошное обследование. Однако выборочные показатели не всегда полностью характеризуют генеральную совокупность и поэтому будут уступать результатам сплошного наблюдения по точности и надежности. Таким образом, важным вопросом подготовки выборочного наблюдения является необходимость определения минимально допустимого объема выборки, который обеспечит требуемую точность полученных статистических характеристик при заданном уровне вероятности.

Расчет необходимого объема выборки предполагает, что организаторы выборочного наблюдения уже на этапе его проектирования располагают по крайней мере косвенными данными о вариации изучаемых признаков. Источниками таких данных могут служить:

а) результаты исследования данного объекта в предшествующие периоды;

б) результаты исследования аналогичных объектов (жителей других населенных пунктов, предприятий других регионов и т. п.);

146

в) специально проведенное небольшое по объему выборочное обследование данного объекта, ставящее целью лишь изучение вариации наблюдаемых признаков.

Формулу расчета объема выборки можно получить из соответствующей формулы предельной ошибки.

Для случайной выборки необходимый объем определяется следующим образом:

 

 

t

2

2

 

 

 

n =

 

S

(для повторного отбора);

 

 

 

2

 

 

 

 

~

 

 

 

 

 

 

x

 

 

n =

t 2 S 2

N

 

 

t 2 S 2 + N

~ 2 (для бесповторного отбора).

 

 

 

 

 

 

x

Необходимый объем выборки в условиях механического отбора определяется аналогично объему случайной бесповторной выборки.

При определении необходимого объема типической выборки в рассмотренных выше формулах общую дисперсию наблюдаемого признака заменяют на среднюю из внутригрупповых дисперсий.

n =

t 2

S 2

 

 

 

 

 

(для условий повторного отбора);

 

 

2

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

n =

 

 

 

t 2

S 2 N

 

 

 

 

 

 

+ N ~ 2 (для бесповторного отбора).

t 2 S 2

 

 

 

 

 

 

 

 

 

x

Объем серийной (групповой) выборки определяется с учетом межгрупповой дисперсии:

 

 

 

 

t

2

2

 

 

 

 

r =

 

δ x

 

(для повторного отбора);

 

 

 

 

2

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

x

 

 

 

r =

 

t 2

δ x

2 R

 

 

(для бесповторного отбора).

t 2

δ 2

+

 

 

 

 

 

 

~

2 R

 

 

x

 

 

 

x

 

 

 

 

 

 

 

 

 

 

147

Как следует из рассмотренных выше формул необходимого объема выборки, при увеличении предполагаемой предельной ошибки необходимый объем выборки значительно уменьшается.

Кроме того, следует иметь в виду, что вместо генеральной дисперсии определенного вида может использоваться значение, полученное из ранее проводимых обследований данной или аналогичной совокупности. Если такая информация отсутствует, то для определения дисперсии необходимо организовать и провести специальное выборочное обследование небольшого объема.

Контрольные вопросы

1.Дайте определение выборочного наблюдения и охарактеризуйте его задачи.

2.Какие этапы включает в себя проведение выборочного наблюдения?

3.Назовите основные виды, методы и способы отбора.

4.Раскройте сущность ошибок выборочного наблюдения?

5.Каким образом определяют среднюю и предельную ошибки наблюдения для разных видов выборки?

6.Каким образом распространяют выборочные данные на генеральную совокупность?

7.Как определяется необходимая численность выборки?

Тесты

1. По формуле

определяется ________ ошибка при

___________ отборе:

a) средняя, бесповторном;

б предельная, бесповторном; в) средняя, повторном; г) предельная, повторном.

2. Для использования выборочной совокупности с целью дальнейшего анализа развития социально-экономического явления необходимо, чтобы разница между средним значением генеральной совокупности и средним значением выборочной совокупности была не больше

__________ ошибки выборки: a) предельной;

б) средней; в) генеральной;

г) индивидуальной.

148

3. Выборка, заключающаяся в отборе единиц из общего списка единиц генеральной совокупности через равные интервалы в соответствии с установленным процентом отбора, называется:

a) механической; б) типической;

в) случайной повторной; г) случайной бесповторной.

4. При случайном бесповторном отборе средняя ошибка выборки определяется по следующей формуле:

a)

;

б) ;

в) ;

г) .

5. Если при переписи населения 25 % населения отвечало на дополнительные вопросы переписного листа и в выборку попало каждое четвертое жилое помещение, то использовался ___________ способ формирования выборочной совокупности:

a) механический; б) случайный; в) типический; г) серийный.

6. По формуле

определяется __________ ошибка выборки:

a) средняя;

б) предельная; в) генеральная;

г) индивидуальная.

7. Выборка называется малой в том случае, если ее объем составляет менее ___ единиц:

a)30; б) 50; в) 100; г) 40.

8.Если сплошному обследованию подвергаются случайно отобранные группы единиц, то выборка называется:

a)серийной;

б) механической;

149

в) типической; г) случайной.

9. Для получения предельной ошибки выборки необходимо _________

умножить на среднюю ошибку выборки:

a)t; б) p; в) n; г) N.

10.При случайном повторном отборе средняя ошибка выборки определяется по формуле:

a);

б)

;

в)

;

г)

.

150

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]