Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Общая теория статистики Назаров

.pdf
Скачиваний:
410
Добавлен:
27.05.2015
Размер:
2.8 Mб
Скачать

14.3. Понятие ошибки выборки

341

Предельная ошибка выражается следующим образом:

x= μxt

изависит от вариации изучаемого признака в генеральной сово купности, объема и доли выборки, способа отбора единиц из гене ральной совокупности и от величины вероятности, с которой га рантируются результаты выборочного наблюдения.

Средняя величина количественного признака в генеральной со вокупности определяется с учетом предельной ошибки выбороч

ной средней x = x ± x.

Иногда для определения размеров предельной ошибки величи

на t определяется эмпирически: t = 3 + 6 . n − 4

Выборочная доля представляет собой отношение числа единиц, обладающих данным признаком или данным его значением (m), к общему числу единиц выборочной совокупности (n):

w = m . n

Эту статистическую характеристику не следует путать с долей выборки, являющейся отношением числа единиц выборочной со вокупности к числу единиц генеральной совокупности.

Ошибка выборочной доли представляет собой расхождение (раз ность) между долей в выборочной совокупности w и долей в гене ральной совокупности p, возникающее вследствие несплошного характера наблюдения. Величина ошибки выборочной доли опре деляется как предел отклонения w от p, гарантируемый с заданной вероятностью

где t — гарантийный коэффициент, зависящий от вероятности Pt, с которой гарантируется невыход разности w – p за пределы tμw;

μw — средняя ошибка выборочной доли.

Средняя ошибка выборочной доли определяется по формуле

μw = σ 2p . Или, как было доказано выше,

μw = σ

2

=

σ 2p

=

σ 2

 

w ,

 

 

p

n

 

 

 

 

n

342

Глава 14. Выборочное наблюдение

где σ 2p — дисперсия доли в генеральной совокупности (дисперсия гене ральной доли);

σ w2 — дисперсия доли в выборке (дисперсия выборочной доли).

Приведенная формула средней ошибки выборочной доли при меняется при повторном отборе.

Для определения дисперсии альтернативного признака допус тим, что общее число единиц совокупности равно n. Число единиц, обладающих данным признаком, — f, тогда число единиц, не обла дающих данным признаком, равно n – f. Ряд распределения каче ственного (альтернативного) признака представлен ниже.

Значение переменной

 

Частота повторений

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

f

0

 

 

 

 

 

 

n – f

Итого

 

 

 

 

n

Средняя арифметическая такого ряда равна

 

 

=

1 f + 0(n f )

=

f

,

 

x

 

 

 

 

n

n

т.е. равна относительной частоте (частости) появления данного при знака, которую можно обозначить через p, тогда x = p.

Таким образом, доля единиц, обладающих данным признаком, равна p; соответственно доля единиц, не обладающих данным при знаком, равна q; p + q = 1. Тогда дисперсия альтернативного при знака определяется по формуле

σ = (1 − p)2 p + (0 − p)2 q = q2 p + p2q = p q = p(1 − p).

p + q

p + q

Для показателя доли альтернативного признака в выборке (вы борочной доли) дисперсия определяется по формуле

σ w2 = w(1 − w).

При бесповторном отборе численность генеральной совокупно сти сокращается, поэтому дисперсия умножается на коэффициент

1 − Nn . Формулы расчета средних ошибок выборочной доли для раз

личных способов отбора единиц из генеральной совокупности при ведены в табл. 14.2—14.4.

14.3. Понятие ошибки выборки

343

Дисперсии в формулах расчета средних ошибок выборочной доли рассчитываются следующим образом:

а) межсерийная дисперсия выборочной доли:

 

 

 

 

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

∑ (wj

 

)2

 

 

w

 

 

 

 

 

 

δ w2 =

j=1

 

 

 

,

 

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где wj — выборочная доля в j0й серии;

 

 

 

 

 

 

 

 

— средняя величина доли во всех сериях;

 

 

w

 

б) средняя из групповых дисперсий:

 

 

 

 

 

 

 

 

 

k

 

 

(1 − wj )nj

 

 

 

 

 

 

 

 

 

wj

 

 

 

σ w2 =

w(1 − w)

=

j=1

 

 

 

,

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

nj

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

где wj — выборочная доля в j й типической группе; nj — число единиц в j0й типической группе;

k — число типических групп.

Для случая, когда доля (частость) даже приблизительно неизве стна, можно произвести «грубый» расчет средней ошибки выборки для доли, используя в расчете максимальную величину дисперсии доли, равную 0,25. Тогда для повторного отбора:

 

σ 2

0,25

 

0,5

 

1

 

μw =

w <

 

=

 

=

 

,

n

n

2 n

 

n

 

 

 

для бесповторного отбора:

μw =

σ 2

n

<

0,25

 

n

=

1

1 −

n

 

w 1

 

 

 

1

 

 

 

 

.

 

n

 

2 n

N

 

n

 

N

 

 

 

N

 

 

 

Предельное значение ошибки выборочной доли определяется по следующей формуле:

w = μwt.

Величина средней ошибки выборочной доли μw зависит от доли изучаемого признака в генеральной совокупности, числа наблю дений и способа отбора единиц из генеральной совокупности для наблюдения, а величина предельной ошибки w зависит еще и от величины вероятности Pt, которой гарантируются результаты вы борочного наблюдения.

344

Глава 14. Выборочное наблюдение

Распространение выборочных данных на генеральную совокуп ность производится с учетом доверительных интервалов. Доля аль тернативного признака в генеральной совокупности p = w ± w.

Определение необходимого объема выборки n основывается на формулах предельных ошибок выборочной доли и выборочной средней. Например, для повторного отбора предельные ошибки равны

отсюда объемы выборок для расчета выборочной доли nw и выбо рочной средней nx следующие:

Аналогичным образом определяются объемы выборок при раз личных способах отбора выборочной совокупности. Для серийно го отбора определяется число отобранных серий. Формулы расчета приведены в табл. 14.5, где приняты следующие обозначения:

nw, nx — объемы выборок соответственно для определения оши бок выборочной доли и выборочной средней;

rw, rx — число отобранных серий соответственно для определе ния ошибок выборочной доли и выборочной средней;

w, x — предельные ошибки соответственно выборочной доли и выборочной средней.

Вариация σ2 признака существует объективно независимо от ис следователя, но к началу выборочного наблюдения она неизвестна. Для приближенной оценки σ2 используются следующие способы:

üдисперсия определяется на основе результатов проведения «пробного» обследования (обычно небольшого объема). По данным нескольких пробных обследований выбирается наи большее значение дисперсии;

üдисперсия принимается из предыдущих исследований;

 

14.3. Понятие ошибки выборки

345

 

 

 

 

 

 

 

 

 

 

 

Таблица 14.5

Формулы расчета объема выборки

 

Метод отбора

 

 

 

 

 

Объем выборки или число серий

выборки

 

 

 

 

 

 

 

для определения

 

 

 

выборочной доли

выборочной средней

Механический

 

 

 

 

 

 

 

или

 

 

и собственно

 

 

 

 

 

 

 

 

 

случайный

 

 

 

 

 

 

 

 

 

 

 

повторный

 

 

 

 

 

2

 

 

 

 

 

 

n = t W (1− W )

 

 

отбор

 

 

 

 

 

 

 

 

2w

 

 

 

 

 

Механический

 

 

 

 

 

 

 

 

или

 

 

и собственно

 

 

 

 

 

 

 

 

 

 

случайный

 

 

 

 

 

 

 

 

 

 

 

бесповторный

n =

 

t2W (1− W ) N

 

 

отбор

2w N + t2W (1− W )

 

 

 

 

 

 

Серийный отбор

 

 

 

 

 

или

 

 

 

при повторном

 

 

 

 

 

 

 

 

отборе равно

 

 

 

 

 

 

 

 

 

 

 

великих серий

 

 

t

2

 

 

 

)

 

 

 

 

r =

 

Wr (1− Wr

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

Серийный отбор

 

 

 

 

 

 

 

 

или

 

 

при бесповторном

 

 

 

 

 

 

 

 

 

 

отборе равно

 

 

t2 Wr (1− Wr ) R

 

 

великих серий

r =

 

 

 

 

2

R + t 2 W

 

(1

W )

 

 

 

 

r

 

 

 

 

w

 

 

 

 

 

r

 

 

Типический отбор

 

 

 

 

 

 

 

 

 

 

 

при повторном

 

 

 

 

 

или

 

 

 

случайном отборе

 

 

 

 

 

 

 

 

 

 

 

внутри групп,

 

 

 

 

t2W (1− W )

 

 

 

пропорциональном

 

n =

 

 

 

 

 

 

 

2

 

 

 

 

 

объему групп

 

 

 

 

 

w

 

 

 

 

 

Типический отбор

 

 

 

 

 

 

 

 

 

 

или

при бесповторном

 

 

 

 

 

 

 

 

 

 

случайном отборе

 

 

 

 

 

 

 

 

 

 

 

внутри групп,

 

 

 

 

 

 

 

 

 

 

 

пропорциональ

 

 

 

 

 

 

 

 

 

 

 

ном объему групп

 

 

 

 

 

 

 

 

 

 

 

346Глава 14. Выборочное наблюдение

üпо правилу «трех сигм» общий размах вариации Н укладыва ется в 6 сигм, среднее квадратическое отклонение принимает

ся равным . Для большей точности размах делится на 5;

üесли хотя бы приблизительно известна средняя величина изу

чаемого признака, то σ = x ; 3

üпри изучении альтернативного признака (изучении доли), если нет даже приблизительных сведений о доле единиц, об ладающих заданным значением этого признака, принимает ся максимально возможная величина дисперсии, равная 0,25.

Всвязи с тем что генеральная дисперсия оценивается прибли женно, рекомендуется рассчитанный объем выборки округлять в большую сторону.

Часто на практике задается не величина абсолютной предель

ной ошибки x, а величина относительной погрешности относ, вы раженная в процентах к средней величине

откуда

В этом случае объем выборки будет равен

Если известен коэффициент вариации то объем

выборки будет рассчитываться по формуле

Например, по данным пробного обследования коэффициент вариации составляет 40%. Сколько необходимо отобрать единиц, чтобы с вероятностью 0,954 предельная относительная ошибка вы борки не превышала 5%?

При V = 40%, относ = 5%, t = 2

= 22402 =

nx 52 256.

14.4. Малая выборка

347

При серийном или типическом отборе, не пропорциональном объему групп, общее число отбираемых единиц делится на количе ство групп. Полученная величина является объемом выборки из каждой группы.

При отборе, пропорциональном числу единиц в группе, число наблюдений по каждой группе определяется по формуле

nj

= n

N j

= n

N j

,

 

 

 

 

N

N j

где nj — объем выборки из j й группы; n — общий объем выборки;

Nj — объем j й группы;

N — объем генеральной совокупности.

При отборе с учетом вариации признака, приводящем к мини мальной ошибке выборки, процент выборки из каждой типичес кой группы должен быть пропорционален среднему квадратичес кому отклонению в этой группе. Расчет численности выборки производится по следующим формулам:

а) для средней:

 

nj

= n

 

N jσ j

;

 

 

 

 

 

 

 

б) для доли:

 

 

N jσ j

 

 

 

 

 

 

 

 

 

nj

= n

N j

 

wj (1 − wj

)

.

 

 

 

 

 

N j

wj (1 − wj )

 

 

 

14.4. Малая выборка

Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 20—30 и может состав лять 5—6. С увеличением численности выборочной совокупности повышается точность выборочных данных, однако приходится иногда ограничиваться малым числом наблюдений. Эта необходи мость возникает, например, при проверке качества продукции, свя занной с уничтожением проверяемой единицы продукции. В мате матической статистике доказывается, что при малых выборках характеристики выборочной совокупности можно распространять на генеральную, но расчет средней и предельной ошибок выборки имеет особенности.

348

Глава 14. Выборочное наблюдение

Ранее указывалось, что при большом объеме выборочной сово

n

купности (n > 100) коэффициент n − 1, на который необходимо ум

ножить выборочную дисперсию, чтобы получить генеральную, не играет большой роли. Но когда выборочная совокупность неболь шая, этот коэффициент необходимо принимать во внимание. Сред няя ошибка малой выборки (μm) вычисляется по формуле

μm =

σ 2

m

,

 

 

n − 1

где σ m2 — дисперсия в малой выборке, которая определяется следующим образом:

 

n

x)2

σ m2 =

∑ (xi

i=1

 

.

 

 

 

 

n

Предельная ошибка имеет вид

 

 

m = tμm.

Значение коэффициента доверия t зависит не только от задан

ной доверительной вероятности, но и от численности единиц вы борки n. Английский ученый Стьюдент доказал, что в случаях ма лой выборки действует особый закон распределения вероятности. В табл. 14.6 приводятся значения, характеризующие вероятность (St) того, что предельная ошибка малой выборки не превысит t — кратную среднюю ошибку:

St = P [(x x ) ≤ m ].

Таблица 14.6

Распределение вероятности St в малых выборках в зависимости от значения коэффициента t и численности выборки

t

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

5

7

10

12

16

18

20

 

 

 

 

 

 

 

 

1,0

0,626

0,644

0,657

0,662

0,666

0,668

0,670

1,5

0,792

0,816

0,832

0,838

0,846

0,848

0,850

2,0

0,884

0,908

0,923

0,930

0,936

0,938

0,940

2,5

0,933

0,953

0,966

0,970

0,975

0,977

0,978

3,0

0,960

0,976

0,985

0,988

0,991

0,992

0,993

 

 

 

 

 

 

 

 

Тесты

349

Контрольные вопросы и задания

1.Какие способы наблюдения существуют в статистике в зави симости от полноты охвата?

2.В результате чего возник выборочный метод в социально эко номическом исследовании?

3.Что относится к достоинствам выборочного наблюдения?

4.Каковы основные проблемы выборочного наблюдения?

5.Дайте определение понятию выборочного наблюдения.

6.Что является основной задачей, стоящей перед выборочным наблюдением?

7.Из каких этапов состоит проведение выборочных исследова ний статистической информации?

8.Назовите, что является генеральной, а что выборочной сово купностью?

9.Какие основные правила должны соблюдаться при составле нии программы выборочного наблюдения?

10.Назовите основные способы формирования выборочной со вокупности.

11.Что называется в статистике единицей наблюдения, едини цей отбора?

12.Что такое повторный и бесповторный отбор?

13.Какие бывают ошибки выборки?

14.Как рассчитывается средняя ошибка выборочной доли/сред ней при механическом или собственно случайном повторном ме тоде отбора?

15.С учетом чего производится распространение выборочных данных на генеральную совокупность?

16.Как определяется необходимый объем выборки n?

17.Что такое малая выборка?

Тесты

1. Какие бывают выборки по степени охвата единиц совокупно сти?

А. Большие. Б. Средние. В. Малые.

Г. Микровыборки.

350Глава 14. Выборочное наблюдение

2.Каким видам наблюдений присущи ошибки репрезентатив ности?

А. Только сплошным наблюдениям. Б. Только несплошным наблюдениям. В. Всем видам наблюдений.

Г. Правильного ответа нет.

3.Как можно записать доверительный интервал для генераль

ной средней?

А. x t μ ≤ Б. w t μxp

В.p ( p) +

x x + t μx . p w + t μ p .

p (d).

Г. x x x x + x .

Д. Правильного ответа нет.

4. Какова формула предельной ошибки выборки для простой случайной повторной выборки?

А.

x

= t

σ 2 .

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

относит

 

 

 

 

 

Б.

 

=

 

x

.

 

 

x

 

 

 

 

 

 

 

 

100%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В.

x

=

 

относит 100%.

 

 

 

 

x

 

 

 

 

 

 

 

= t

σ 2

n

Г.

x

 

1

 

.

 

 

 

 

 

 

n

 

 

 

N

5.Чем измеряются возможные расхождения между характерис тиками выборочной и генеральной совокупностей?

А. Средней ошибкой выборки.

Б. Дисперсией выборочной совокупности. В. Генеральной дисперсией.

Г. Правильного ответа нет.

6.Какие способы отбора единиц из генеральной совокупности использует практика применения выборочного метода в экономи ко статистических исследованиях?