Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5163.pdf
Скачиваний:
5
Добавлен:
13.11.2022
Размер:
1.04 Mб
Скачать

3

Введение

В настоящее время очень широкое распространение получили различного рода выборочные обследования. Эффективное использование результатов выборки предполагает грамотное применение соответствующего статистико-математического аппарата.

Выборочные методы занимают особое и очень важное место в статистической науке. Вся математическая ветвь этой науки развивалась как учение о вероятностной оценке данных, получаемых в результате выборочного статистического наблюдения и эксперимента.

Организация выборочного исследования − это дело, требующее знаний и определённых навыков, таких как определение совокупности, установление круга данных, подлежащих сбору, и методов наблюдения.

Цель теории выборочного метода состоит в повышении результативности выборочного исследования. В ней разрабатываются методы извлечения выборки и оценивания, позволяющие при минимальных затратах получать оценки с достаточной точностью.

Велико и практическое значение выборочного метода. Возможность сократить расходы на проведение статистических работ представляет собой немаловажный довод в пользу применения выборочного наблюдения вместо наблюдения сплошного, особенно когда проведение сплошного статистического обследования провести невозможно.

Научной литературы по проблемам проведения и обработки результатов выборочного наблюдения много, однако учебно-методической явно недостаточно. Поэтому целью настоящего практикума является доступное изложение вопросов статистической обработки в выборочном наблюдении и распространение полученных результатов с указанной степенью точности.

В данном практикуме изложение методов выборочного обследования сопровождается подробными примерами.

Пособие содержит математические таблицы, с помощью которых решаются конкретные задачи, а также имеются ссылки на них при расчётах.

4

1. Ошибки выборки при некоторых способах отбора. Необходимая численность выборки

1.1. Собственно-случайная и механическая выборка

Ошибки выборки зависят от конкретного способа отбора. Способ отбора определяет механизм выборки единиц из генеральной совокупности. В практике выборочных обследований наибольшее распространение получили следующие виды выборки: 1) собственнослучайная; 2) механическая; 3) типическая; 4) серийная; 5) многоступенчатая; 6) многофазная.

Собственно-случайная выборка заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системы. Технически собственно-случайный отбор проводят методом жеребьёвки или по таблицам случайных чисел.

Собственно-случайный отбор может быть как повторным, так и бесповторным. При повторном отборе каждая единица или серия после регистрации возвращается в генеральную совокупность. При проведении бесповторного отбора раз отобранная единица в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют. После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибка выборки.

Средняя ошибка повторной собственно-случайной выборки определяется по формулам:

 

 

 

2

~

 

 

 

 

 

 

 

 

2

 

w(1 w)

 

 

для средней ~

 

x

 

,

для доли

 

 

 

w

 

,

 

 

 

 

w

 

 

 

 

х

 

n

 

 

 

 

 

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где ~

− средняя ошибка средней;

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2~х

− выборочная дисперсия;

 

 

 

 

 

 

 

 

 

 

 

w – доля единиц, обладающих изучаемым признаком в выбороч-

ной совокупности;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w2 − дисперсия доли,

w2 w(1 w) ;

 

 

 

 

 

 

 

 

 

(1 w) – доля единиц в выборке, не обладающих изучаемым признаком;

n

− объём выборки.

 

 

 

 

 

 

 

 

 

 

 

 

Предельная ошибка выборки определяется по формулам:

 

 

для средней ~ t ~ ;

 

для доли

w

t

w

.

 

 

 

 

 

 

 

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

На основе предельной ошибки и выборочной средней или доли определяются пределы отклонения генеральной средней (доли):

~

~

~ ;

w

 

p w

 

х

~ х х

w

w

 

х

х

 

 

Например. Методом собственно случайной выборки обследована жирность молока у 100 коров ( n ). По данным выборки, средняя жирность

~

2

~х

).

молока оказалась равной 3,64% ( х ), а дисперсия составила 2,56 (

 

Определить: а) среднюю ошибку выборки; б) с вероятностью, равной 0,954, предельные значения генеральной средней.

~

x

 

 

 

 

2

~

 

 

 

 

2,56

 

 

 

Решение: а)

средняя ошибка средней ~

 

 

х

 

 

 

 

0,16% ;

 

 

 

 

 

 

 

 

 

 

х

 

 

n

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

б) предельная ошибка выборки ~ t

~ .

 

 

 

 

 

x

 

 

 

 

x

 

 

 

 

 

По таблице

значений Ф(t) (Приложение

 

Г)

при

 

0,954

t 2 .

2 0,16 0,32%

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, предельные значения средней жирности молока в

генеральной совокупности

~

~

x ~ x x ~ ;

 

x

x

 

3,64 0,32

х 3,64 0,32;

 

3,32%

х 3,96% .

Таким образом, с вероятностью 0,954 можно утверждать, что пределы изменения средней жирности молока в генеральной совокупности будут находиться от 3,32% до 3,96%.

Можно решить и обратную задачу: задав предельную ошибку выборки,

определить вероятность, с которой она может

быть гарантирована.

При

 

этом,

зная

и

, сначала находят

коэффициент

доверия

t

,

а

затем

по

таблице Приложения

Г определяют

искомое

 

 

 

 

 

 

 

 

значение вероятности.

Например. На основе выборочного обследования 600 рабочих ( n 600) одной из отраслей промышленности установлено, что численность женщин составляет 240 человек ( m 240).

С какой вероятностью можно утверждать, что при определении доли женщин, занятых в этой отрасли, допущенная ошибка ( w ) не превышает

5% (0,05)?

6

Решение:

Определяем выборочную

долю:

w

m

 

240

0,4 .

Чтобы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

600

 

 

 

найти вероятность допуска той или иной ошибки,

из формулы w

t w ,

определяем показатель t , связанный с вероятностью:

 

 

 

 

 

t w

 

w

 

 

 

 

0,05

 

 

 

2,5.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

w 1 w

 

 

 

0,4 1

0,4

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

600

 

 

 

 

 

 

 

 

 

По таблице значений Ф(t) (Приложение Г)

для t 2,5

находим,

что

0,988, то

есть с вероятностью

0,988 можно

 

утверждать, что

при

определении доли женщин (0,4) в общем числе рабочих допущена ошибка не более 0,05 (5%).

При расчёте

средней ошибки

собственно-случайной

бесповторной

выборки необходимо учитывать поправку на бесповторность отбора:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

~

 

 

n

 

 

 

 

 

2

 

n

 

 

для средней ~

 

х

 

(1

) ;

для доли

 

 

w (1

) .

 

 

 

 

 

w

 

 

х

 

n

 

 

N

 

 

n

 

N

 

 

 

 

 

 

 

 

 

Чем больше

объём

 

выборки

и доля обследованных

единиц, тем

меньше ошибка выборки.

 

 

 

 

 

 

 

 

 

 

 

 

 

Например. Если предложить, что данные, представленные в предыдущей задаче, являются результатом 5%-го бесповторного отбора, то есть объём генеральной совокупности

 

 

 

 

 

 

 

N

100

 

100 2 000 коров,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

тогда средняя ошибка средней для бесповторного отбора

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 ~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

2,56

 

 

100

 

 

 

~

 

х

 

(1

 

)

 

(1

) 0,156% ,

 

 

 

 

 

 

 

 

 

 

х

 

 

 

n

 

 

 

N

100

 

2000

 

 

 

 

 

 

 

 

 

 

 

а предельная ошибка средней:

~ t ~ 2 0,156 0,312% .

 

 

 

 

 

 

 

 

 

х

 

x

 

 

 

 

Следовательно,

пределы

отклонения

генеральной средней будут

находиться:

~

 

х

~

~ ;

 

 

 

 

 

 

 

х ~

х

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

х

 

 

 

 

 

 

 

3,64 0,312 х 3,64 0,312;

3,328% х 3,952% .

Средняя ошибка выборки для доли при собственно-случайном

 

 

 

 

 

 

бесповторном отборе рассчитываем по формуле w

w(1 w)

(1

n

) .

 

 

 

n

 

N

7

Если w(1 w) обозначить w2 (дисперсия альтернативного признака), то

 

2

n

 

 

w

w (1

 

) .

N

 

n

 

 

Например. На заводе электроламп из партии продукции в количестве 1 600 шт. взято на выборку 160 шт., из которых 4 шт. оказались бракованными. Определить с вероятностью 0,683 пределы, в которых будет находиться процент брака для всей партии продукции.

Решение: определим долю бракованной продукции выборки

w mn 1604 0,025, или 2,5%.

При вероятности P 0,683 t 1 (Приложение Г). Размер предельной ошибки

 

 

2

n

 

 

 

0,024

 

160

 

 

 

w t w

t

w (1

 

) 1

 

 

(1

 

 

)

 

0,011, или 1,1%

N

160

 

1 600

 

 

n

 

 

 

 

 

 

 

 

 

 

2

0,025(1 0,025) 0,024 .

 

 

w

 

 

 

 

 

 

 

 

 

 

 

 

Доверительные

интервалы для

генеральной

доли с вероятностью

P 0,683:

w w p w w ; 2,5 1,1 p 2,5 1,1;

1,4% p 3,6%.

Механическая выборка применяется в случаях, когда генеральная совокупность каким-либо образом упорядочена, то есть имеется определённая последовательность в расположении единиц (табельные номера работников, списки избирателей, телефонные номера респондентов, номера домов и квартир и т.п.).

Для проведения механической выборки устанавливается пропорция отбора, которая определяется соотнесением объёмов выборочной и генеральной совокупностей. Так, если из совокупности в 500 000 единиц предлагается получить 2%-ю выборку, то есть отобрать 10 000 единиц, то

пропорция отбора составит

1

 

1

.

50

500 000 : 10 000

 

 

 

Отбор единиц осуществляется в соответствии с установленной пропорцией 1:50 (2%-я выборка) отбирается каждая 50-я единица, при

8

пропорции 1:20 (5%-я выборка) – каждая 20-я единица, и т.д. Такой способ отбора удобен в том случае, если заранее известны границы генеральной совокупности.

Задачи

1.1.Средняя жилая площадь, приходящаяся на одного жителя, в выборке составила 19,6 м2, а средняя ошибка выборки ─ 1,2 м2. Определите пределы, в которых находится средняя жилая площадь в расчёте на одного жителя в генеральной совокупности (при вероятности

0,954).

1.2.Для определения скорости расчётов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платёжных документов, по которым средний срок начисления и получения денег оказался равным 22 дням со стандартным отклонением 6 дней. Необходимо с вероятностью 0,954 определить предельную ошибку выборочной средней, а также доверительные пределы средней продолжительности расчётов предприятий данной корпорации.

1.3.В туристских агентствах города с общим числом сотрудников 1 000 человек было проведено 5%-е выборочное обследование возраста сотрудников методом случайного бесповторного отбора. В результате обследования были получены следующие данные:

Возраст, лет

до 30

30 − 40

40 − 50

50 − 60

свыше 60

Число сотрудников

8

22

10

6

4

С вероятностью 0,997 определите пределы, в которых находится средний возраст работающих в туристических агентствах.

1.4. Свободные места на авиалайнерах являются причиной потери дохода авиакомпаний. Предположим, авиакомпании требуется оценить среднее количество свободных пассажирских мест на рейс за последний год с вероятностью 0,997. Для этого из файла базы данных, содержащего 4 500 записей о рейсах, были отобраны случайным образом 225 и выяснено число свободных мест на этих рейсах. Среднее значение составило 11,6 мест, а стандартное отклонение 4,1 места.

9

1.5. По результатам выборочного обследования жилищных условий населения в городе доля людей, не обеспеченных жильём в соответствии с социальными нормами, составляет 30%, а средняя ошибка выборки − 2,5%. С вероятностью 0,997 определите, в каких пределах находится доля людей, не обеспеченных жильём в генеральной совокупности.

1.6.Из 5 тыс. человек, совершивших правонарушения в течение года, было обследовано методом механического отбора 500 правонарушителей.

Врезультате обследования установлено, что 300 человек выросли в ненормальных семейных условиях. С вероятностью 0,997 определите долю правонарушителей, выросших в ненормальных семейных условиях.

1.7.По результатам выборочного обследования 10 000 семей региона по уровню душевого дохода (выборка 25%-я, механическая) малообеспеченных оказалось 400 семей. Требуется с вероятностью 0,997 определить предельную ошибку доли, а также долю малообеспеченных семей во всём регионе.

1.8.Для определения среднего срока пользования краткосрочным кредитом в банке была проведена 5%-я механическая выборка, в которую попали 200 счетов. По результатам выборки установлено, что средний срок пользования кредитом составляет 60 дней при среднеквадратическом отклонении 20 дней. В 8 счетах срок пользования кредитом превышал 6 месяцев. Необходимо с вероятностью 0,99 определить пределы, в которых находится срок пользования краткосрочными кредитами банка и доля краткосрочных кредитов со сроком пользования более полугода.

1.9.В результате выборочного обследования населения региона по проблемам занятости получено распределение тех, кто не имел работы и искал её, пребывая в статусе безработного

Число месяцев безработицы

0 − 3

3 − 6

6 − 9

9 − 12

12 и более

Число безработных

20

50

15

10

5

10

Требуется с вероятностью 0,95 определить: а) среднюю продолжительность пребывания в статусе безработного; б) долю лиц, являющихся безработными один год и более.

1.10. Дорасчёт валового внутреннего продукта провели с использованием распределения малых предприятий региона по объёму выпуска продукции (работ, услуг), полученного на основе 10%-ого выборочного наблюдения:

Группа предприятий

 

 

 

 

 

 

по объёму выпуска

 

 

 

 

 

 

продукции (работ,

До 1,0

1,0 − 2,0

2,0 − 3,0

3,0 − 4,0

4,0 − 5,0

5,0 и более

услуг), млн руб.

 

 

 

 

 

 

Число предприятий

12

14

16

18

4

3

Определите: 1) в целом по региону с вероятностью 0,954 пределы, в которых можно ожидать: а) средний объём производства продукции (работ, услуг) на одно предприятие: б) долю предприятий с объёмом производства продукции более 4,0 млн руб.; 2) общий объём выпуска продукции (работ, услуг) по региону.

1.11. Для изучения стоимости плазменных телевизоров была проведена 2%-я механическая выборка телевизоров одного размера разных производителей. Результаты предоставлены в таблице:

Стоимость телевизоров, долл.

Число образцов

До 960

2

960

980

7

980 − 1 000

24

1 000

− 1 020

40

1 020

− 1 040

20

Свыше 1 040

7

Определите: 1) с вероятностью 0,997 пределы, в которых можно ожидать среднюю стоимость всех телевизоров; 2) с вероятностью 0,954 пределы, в которых можно ожидать долю телевизоров стоимостью свыше

220долларов.

1.12.Партия роз 80 000 шт., поступивших из Голландии, была подвергнута выборке. Для этого было обследовано 800 роз, отбракованных при помощи механического способа отбора. Среди обследованных обнаружено 160 бракованных. Определите с вероятностью 0,997

11

возможный размер убытка от некачественной транспортировки, если цена приобретения розы 100 рублей.

1.13. На основе выборочного обследования 600 рабочих одной из отраслей промышленности установлено, что удельный вес численности женщин составил 40%. С какой вероятностью можно утверждать, что при определении доли женщин, занятых в этой отрасли, допущена ошибка, не превышающая 5%.

1.14.Какова вероятность того, что по данным 5%-й механической выборки 100 рабочих предельная ошибка средней заработной платы рабочего не превысит 250 руб., а предельная ошибка доли рабочих, получающих среднюю заработную плату свыше 45 000 руб. будет не более 3%? По предыдущим обследованиям известно, что дисперсия заработной платы составила 400, а доля рабочих, получающих заработную плату свыше 45 000 руб., 10%.

1.15.По данным выборочного обследования 64 переселенцев из бывших союзных республик удельный вес семей в составе 3 человек составил 20%. С вероятностью 0,954 определите ошибку выборки для доли выбывших семей в составе 3 чел. С какой вероятностью можно утверждать, что доля выбывших семей в составе 3 чел. не превышает 30%?

1.16.Методом собственно-случайной бесповторной 5%-й выборки было обследовано 150 студентов дневного отделения одного из высших учебных заведений. Доля студентов, совмещающих работу и учёбу, составила, по данным выборки, 30%. Определите вероятность того, что ошибка доли студентов дневного отделения этого учебного заведения, работающих в течение учебного года, не превысит 5%; 10%.

1.17.В сберегательных банках города методом случайной повторной выборки было отобрано 1 600 счетов вкладчиков. Средний размер остатков вклада по этим счетам составил 3,2 тыс.руб при коэффициенте вариации

12

30%. Какова вероятность того, что ошибка репрезентативности при определении среднего размера остатков вклада не превысит 0,05 тыс.руб.

1.18. По городской телефонной сети в порядке случайной выборки (механический) отбор произвели 100 наблюдений и установили среднюю продолжительность одного телефонного разговора 5 мин, при среднем квадратическом отклонении 2 мин. Какова вероятность того, что ошибка репрезентативности при определении средней продолжительности телефонного разговора не превысит 18 секунд?

1.2. Типический (стратифицированный, расслоённый, районированный) отбор

Типический отбор используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько типических групп. При обследовании населения такими группами могут быть, например, районы, социальные, возрастные или образовательные группы, при обследовании предприятий – отрасль или подотрасль, форма собственности и т.п. Типический отбор предполагает выборку единиц из каждой типической группы собственно-случайным или механическим способом.

Наиболее часто применяется пропорциональное размещение (пропорциональная типическая выборка), когда количество отбираемых в выборку единиц пропорционально удельному весу данной группы по числу единиц в генеральной совокупности, то есть число наблюдений по

каждой группе определяется по формуле n n

Ni

,

 

 

 

 

 

 

 

 

 

i

N

 

 

 

 

 

 

 

 

 

 

где ni

число наблюдений из i -й типической группы;

 

 

 

n

общий объём выборки;

 

 

 

 

 

N i − объём i -й типической группы в генеральной совокупности;

 

 

 

N

объём генеральной совокупности.

 

 

При отборе пропорционально численности группы

 

 

2

 

i2 Ni

 

i2ni

. В этом случае средняя ошибка средней:

 

~

Ni

ni

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

− при повторном отборе ~

 

 

2

 

 

 

 

 

 

 

x ;

 

 

 

x

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

n

 

 

 

 

 

 

 

2

 

 

 

− при бесповторном отборе ~

 

 

 

 

x (1

 

).

 

 

 

 

 

x

 

 

 

 

 

n

N

 

 

 

 

 

 

 

 

 

 

Например. Для определения средней заработной платы рабочих завода была произведена 20%-я бесповторная выборка по цехам с отбором единиц пропорционально численности групп (таблица 1.2.1).

Таблица 1.2.1 − Результаты обследования рабочих завода

Цех

Объём выборки,

Средняя заработная

Среднее квадратическое

 

чел., ni

плата, руб.,

~

отклонение, руб.,

 

 

x

i

i

 

 

 

 

 

 

 

 

 

 

 

 

1

120

26 873

 

 

30

 

2

100

27 886

 

 

80

 

3

180

28 900

 

 

60

 

Итого

400

-

 

 

-

 

С вероятностью 0,997 (t=3) определить пределы, в которых находится заработная плата всех рабочих завода.

Решение:

1. Находим общую выборочную среднюю заработную плату:

~

 

~

 

26 873 120 27 886 100 28 900 180

 

 

 

xi ni

 

28 038,4

руб.

x

 

 

 

ni

400

 

 

 

 

 

 

 

2. Рассчитаем среднюю из групповых дисперсий:

 

 

2

 

i2ni

 

302 120 802 100 602 180

 

 

~

 

 

 

 

 

340.

ni

 

 

 

x

 

 

400

 

 

 

 

 

 

 

 

 

3. Определяем среднюю ошибку выборочной средней заработной

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

n

 

 

 

340

 

 

платы

~

 

 

хi

(1

 

)

(1 0,2) 2,64 руб.

 

 

 

 

 

 

х

 

n

 

N

400

 

 

 

 

 

 

4.Находим предельную ошибку выборочной средней заработной платы

w t w 3 2,64 7,92 руб.

5.Определяем пределы изменения генеральной средней

~

~

~ ;

 

 

 

28 038,4 7,92 x 28 038,4 7,92;

x

~ x x

 

x

x

 

 

 

28 030,48руб. x 28 046,32руб.

Средняя ошибка доли при пропорциональном типическом отборе:

14

 

 

 

 

 

2

 

 

 

 

 

w

 

w ,

 

 

 

n

 

 

 

 

 

 

2

 

 

 

 

wi

(1 wi )ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

w (1 w )

;

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

w

 

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

n

 

 

− при бесповторном отборе: w

 

(1

 

 

 

w

 

).

 

n

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Второй вариант выбора единиц в типическую группу пропорционально внутригрупповой дифференциации признака, то есть оптимальное размещение (непропорциональная типическая выборка). Расчёт объёма выборки из каждой типической группы производится по формуле

n n

Ni i

,

 

i

Ni i

 

где i − среднее квадратическое отклонение признака в i-й группе генеральной совокупности.

Средняя ошибка средней непропорциональной типической выборки:

− при повторном отборе ~

1

 

 

 

 

2 N

2i

 

,

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

N

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

− при бесповторном отборе ~

 

 

1

 

 

 

2 N 2i

(1

n

 

) .

 

 

 

 

i

 

 

 

i

 

 

 

 

 

 

 

 

 

 

х

 

 

 

N

 

 

n

 

 

 

N

i

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

Например. 10% бесповторный типический отбор рабочих предприятия, пропорциональный дифференциации признака (число дней временной нетрудоспособности), привёл к следующим результатам

(таблица 1.2.2).

Таблица 1.2.2 − Результаты обследования рабочих предприятия

Цех

Всего рабочих,

Дисперсия числа дней временной

 

чел, Ni

нетрудоспособности, i2

1

1 000

49

2

1 400

25

3

800

16

Итого

3 200

-

С вероятностью 0,954 определить предельную ошибку выборки.

15

Решение:

1. Определим необходимый объём выборки по каждому цеху:

 

 

n

i Ni

 

 

 

 

 

 

 

 

 

 

 

n

i

;

 

N

i

 

49 1 000

25 1 400

16 800 17 200;

 

 

 

i

Ni

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

25 1 400

130 чел. ;

 

 

 

 

 

 

 

16 800

60 чел.

n 320

 

49 1 000

130 чел. ;

n2 320

 

 

n3

320

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

17 200

 

 

 

 

 

 

 

17 200

 

 

 

 

 

 

 

 

 

 

 

 

17 200

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Рассчитаем среднюю ошибку выборки

 

~

1

 

 

 

2 N 2i

(1

 

n

 

 

 

 

 

 

 

i

 

 

 

 

 

i

) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

N

 

n

 

 

 

N

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

1

 

 

49 10002

(1

130

)

251 4002

(1

 

130

)

16 8002

 

(1

 

60

) 0,28.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3 200

 

130

 

1 000

 

130

 

 

1400

 

 

 

60

 

 

 

 

 

 

800

 

 

 

 

 

3. Находим предельную ошибку выборки с вероятностью 0,954 (t=2)

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

0,56.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х t ~ 2 0,28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Разновидностью типической является районированная выборка, при которой отбор единиц для наблюдения проводится из групп, представленных административно-территориальными образованиями.

Задачи

2.1. На металлургических заводах корпорации работают 100 формовщиков и 200 литейщиков. Проведено районированное изучение среднемесячной заработной платы 60 рабочих с пропорциональным распределением их по специальностям в соответствии с удельным весом в общем количестве рабочих. Внутри каждой группы применялся метод повторного отбора. В результате получены следующие данные:

Показатель

Формовщики

Литейщики

Месячная заработная плата, руб.

38 000

41 100

Среднее квадратическое отклонение по

 

 

заработной плате, руб.

540

880

Определите предел ошибки репрезентативности при установлении средней заработной платы, гарантировав результат с вероятностью 0,954.

2.2. Для определения урожайности зерновых культур проведена типическая пропорциональная выборка 100 хозяйств региона различных форм собственности:

16

Хозяйства (по формам

Количество

Средняя

Дисперсия

обследованных

урожайности в

собственности)

урожайность

хозяйств

каждой группе

 

 

Коллективная

30

18

15

Акционерные общества

50

20

25

Крестьянские (фермерские)

20

28

40

Итого

100

-

-

Необходимо с вероятностью 0,954 определить предельную ошибку выборочной средней и доверительные пределы средней урожайности зерновых культур по всем хозяйствам региона.

2.3. По результатам 5%-го выборочного обследования, проведённого методом пропорционального типического отбора, с целью изучения уровня оплаты труда по отрасли получены следующие данные:

Тип предприятия

Средняя заработная

Число

Среднее

 

плата, руб.

обследованных

квадратическое

 

 

работников

отклонение, руб.

Среднее

32 500

800

1 100

Малое

28 900

200

800

Определите с вероятностью 0,9996 пределы, в которых находится средняя заработная плата работников отрасли.

2.4. В области 150 тыс. молочных коров. Из них в районе А – 70 тыс. коров, в районе Б – 50 тыс. коров, в районе В – 30 тыс. коров. Для определения средней удойности коров области произведена 1%-я типическая выборка с отбором единиц пропорционально численности коров в районах (внутри районов применялся случайный бесповторный метод отбора). Результаты выборки представлены в таблице:

Районы

Средний удой коров, кг

Среднее квадратическое отклонение

А

3 200

700

Б

3 000

400

В

2 500

240

С вероятностью 0,997 определите пределы, в которых находится удойность коров.

2.5. Для установления дальности пробега машин на трёх автобазах методом случайного бесповторного отбора было отобрано 300 путёвок. Из них на автобазе № 1 – 150, № 2 – 60, № 3 – 90 путёвок. В результате

17

обследования установлено, что доля машин с дальностью пробега свыше 100 км составляет на автобазе № 1 –30 %, на автобазе № 2 – 15 % и на автобазе № 3 – 25 %. С вероятностью 0,954 определите предел, в котором находится доля машин с дальностью пробега, превышающей 100 км, по трём автобазам при условии, что выборка составляет 5 %.

2.6.С целью определения доли расходов на питание населением города

Аметодом типической выборки был произведён 5%-й отбор семей. Внутри типов производилась случайная бесповторная выборка. Результаты выборки представлены в таблице:

Тип семей

Число лиц

Доля расходов на питание (в %)

Одинокие

30

33

Семейные

70

45

С вероятностью 0,954 определите предел, в котором находится доля расходов на питание семей города А.

2.7.Для определения женского труда в одной из отраслей обрабатывающей промышленности все предприятия отрасли были разбиты на три группы крупные, средние и мелкие. По численности рабочих эти группы распределились следующим образом: крупные − 50%, средние − 40%, мелкие − 10%. От общего числа рабочих всей отрасли. В порядке бесповторной типической выборки был произведён отбор 10 000 человек с пропорциональным распределением по группам, в результате которого доля мужчин оказалась равной в крупных предприятиях 60%, в средних − 50%, в мелких − 45%. Определите с вероятностью 0,997, в каких пределах заключена доля женщин среди всех рабочих данной отрасли.

2.8.Для изучения влияния общего стажа работы на квалификацию рабочих механического цеха была проведена бесповторная типическая выборка с непропорциональным распределением (по 50 рабочих в каждой группе), которая дала следующие результаты:

Группа рабочих

Общее число рабочих

Объём

 

В том числе по разрядам

 

по стажу работы

в группе (человек)

выборки

1

 

2

3

4

5

 

6

До 10 лет

600

50

10

 

23

14

2

1

 

-

Свыше 10 лет

400

50

-

 

5

8

17

14

 

6

18

По этим данным определите: 1) необходимый объём выборки по каждой из групп рабочих при определении среднего разряда рабочих цеха, который даст наиболее точные результаты; 2) возможные пределы среднего разряда рабочих цеха с вероятностью 0,954; 3) необходимую численность выборки по каждой из групп рабочих при определении доли рабочих высокой квалификации (5-й и 6-й разряды), которая даст наиболее точные результаты; 4) возможные пределы доли рабочих в цехе, имеющих высокую квалификацию (5-й и 6-й разряды), с вероятностью 0,683.

2.9. Для изучения сортности продукции акционерного общества была проведена бесповторная типическая выборка с непропорциональным отбором, которая дала следующие результаты:

№ цеха

Объём продукции,

Объём выборки,

Сортность продукции, шт.

 

шт.

шт.

высший

первый

1

500

50

20

30

2

800

100

20

80

По этим данным определите: 1) необходимую численность выборки по каждому из цехов при определении доли продукции высшего сорта, которая даст наиболее точные результаты; 2) возможные пределы доли продукции высшего сорта с вероятностью 0,954.

2.10. В целях изучения производительности четырёх типов станков, производящих одни те же операции, была произведена 10%-я типическая выборка с непропорциональным отбором единиц:

Тип

 

Среднее число деталей,

Среднее

Всего станков

изготовленных на станке за

квадратическое

станков

 

час работы, штук

отклонение

 

 

I

150

400

40

II

300

520

20

III

450

700

50

IV

100

610

70

Определите: 1) необходимую численность выборки по каждому типу станков при определении производительности, которая даст наиболее точные результаты; 2) с вероятностью 0,997 определите предел, в котором находится среднее число деталей, производимых на всех станках.

19

2.11. С целью определения среднего стажа работы рабочих завода (в годах) произведена 10%-я бесповторная выборка способом типического пропорционального отбора. Результаты обследования сведены в следующую таблицу:

 

 

Группа рабочих по стажу работы

 

 

Группа рабочих по полу

до 2

2 − 5

5 10

10 − 20

20

25

 

25 и

Итого

 

 

выше

 

 

 

 

 

 

 

 

 

 

Мужчины

20

80

100

60

30

 

 

10

300

Женщины

20

50

80

43

5

 

 

2

200

Всего

40

130

180

103

35

 

 

12

500

Определите: 1) с вероятностью 0,954 для всех рабочих предприятия предельную ошибку среднего стажа работы всех рабочих; 2) пределы, в которых находится средний стаж их работы; 3) предельную ошибку доли рабочих со стажем до 5 лет с вероятностью 0,997; 4) пределы, в которых находится число рабочих со стажем до 5 лет; 5) необходимую численность непропорциональной выборки по полу рабочих, которая наиболее точные результаты; 6) с вероятностью 0,954 определите предел, в котором находится средний стаж всех рабочих; 7) необходимую численность выборки по полу при определении доли рабочих со стажем до 5 лет, которая даст наиболее точные результаты; 8) предел, в котором находится доля рабочих со стажем до 5 лет с вероятностью 0,997. Сравните полученные результаты и сделайте выводы.

2.12. По данным выборочного обследования (20%-й типический отбор) трудовое участие женщин в общественном производстве характеризуется следующими данными:

Наличие детей в

Число

В среднем отработано

Среднее

квадратическое

возрасте до 12 лет

женщин

на одну женщину,

отклонение

отработанных

 

 

чел.-дней

чел.-дней

 

Без детей

200

158

 

10

Один ребенок

120

150

 

20

Двое и больше детей

80

130

 

15

С вероятностью 0,954 определите ошибку выборки для среднего числа отработанных человеко-дней на одну женщину. С какой вероятностью можно утверждать, что среднее число отработанных за год человеко-дней на одну женщину не меньше 147,4?

20

1.3. Серийный (гнездовой) отбор Серийный (гнездовой) отбор применяется в том случае, если

генеральная совокупность разбита на группы ещё до начала выборочного обследования. При проведении выборки из генеральной совокупности отбираются не отдельные единицы, а целые их серии, причём в рамках каждой серии обследуются все попавшие в неё единицы.

При равновеликих сериях стандартная ошибка выборки для средней определяется по формулам:

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

− при повторном отборе серий: ~

 

~

,

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

х

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где r – число отобранных серий;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

~

2

 

 

 

 

 

 

 

 

2

2

 

(xi

x )

 

,

 

 

 

 

 

 

 

~

− межсерийная дисперсия: ~

 

 

 

 

 

 

 

 

 

 

 

x

x

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

− средняя i-й серии;

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

 

 

 

 

 

 

 

 

~

− общая средняя по всей выборочной совокупности:

~

 

xi

;

x

x

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

r

 

 

 

 

 

 

− при бесповторном отборе серий

~

 

~

 

 

 

 

 

 

 

 

 

х (1

 

),

 

 

 

 

 

 

 

 

 

 

 

 

х

 

r

 

 

R

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где R – общее число серий в генеральной совокупности.

Из приведённых формул следует, что случайная ошибка серийной выборки должна быть меньше, чем межсерийная дисперсия и тем, следовательно, более однородны внутри себя серии.

Например. Из 100 ящиков (R) по 400 деталей в каждом, поступивших в течение квартала на склад готовой продукции, в порядке случайной бесповторной серийной выборки отобрано 5 ящиков (r), все детали

которых проверены на вес, были

получены

следующие

результаты

(таблица 1.3.1).

 

 

 

 

 

 

 

Таблица 1.3.1 − Исходные данные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показатель

 

 

 

 

Ящик

 

 

 

 

1

2

 

3

 

4

5

Средний вес детали, г

 

50

49

 

53

 

53

55

По этим данным установить возможные пределы среднего веса детали в ящиках, поступивших на склад, с вероятностью 0,954 (t=2).

21

Решение:

Средний вес детали в 5 отобранных ящиках составляет:

 

 

 

 

 

 

~

 

~

 

50 49 53 53 55

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

52 г .

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

Межсерийная дисперсия равна:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

~

2

 

(50 52)

2

(49

52)

2

(53 52)

2

(53 52)

2

(55 52)

2

 

2

 

(xi

x )

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4,8.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя ошибка средней серийной выборки будет

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

 

 

 

 

 

4,8

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

~

(1

 

) =

 

(1

) 0,952.

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

r

 

 

R

 

 

5

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Предельная ошибка средней

 

~

 

 

 

~

2 0,95 1,92.

 

 

 

 

х t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

Пределы отклонения генеральной средней:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

~

 

 

 

 

~

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

х х х х;

 

 

 

 

 

 

 

 

52 1,9 х 52 1,9;

50,1г х 53,9 г.

Средняя ошибка выборочной доли при случайной выборке в случае равновеликих серий определяется по формулам:

− при повторном отборе w

2

,

w

 

r

 

где w2 − межсерийная (межгрупповая) дисперсия доли, определяемая

 

 

(w

 

)2

 

по формуле 2

 

w

,

i

w

 

r

 

 

 

 

где w − доля признака по всей выборочной совокупности; wi – доля признака по i -й серии.

− при бесповторном отборе w

2

(1

r

 

 

w

 

).

r

R

 

 

 

 

Исходя из вышеизложенного приведём формулы предельной ошибки выборки для наиболее часто используемых на практике способов формирования выборочной совокупности (таблица 1.3.2).

Задачи

3.1. Из партии семян, разбитой на 40 равных по величине серий, методом случайного бесповторного отбора было проверено 8 серий на всхожесть. В результате обследования установлено, что доля взошедших

22

семян составляет 75%. Межсерийная дисперсия равна 900. С вероятностью 0,954 определите предел, в котором находится доля всхожести семян во всей партии.

3.2. Выпускаемая акционерным обществом продукция упаковывается в коробки по 80 шт. в каждом. Из 100 коробок, поступивших на склад готовой продукции, в порядке случайной бесповторной выборки было отобрано 5, все детали которых проверены на вес. Результаты проверки показали, что средний вес детали в ящиках составил (г):

Номер коробки

1

2

3

4

5

Средний вес детали, г

30

34

36

34

55

С вероятностью 0,954 определите пределы, в которых находится средний вес деталей, поступивших на склад готовой продукции акционерного общества.

3.3. Из совокупности, разбитой на 100 равных по величине серий, методом механического отбора выделено 10 серий. Межсерийная дисперсия равна 20, а средняя величина признака в выборке – 140. С вероятностью 0,997 определите предел, в котором находится генеральная средняя.

 

 

 

 

 

 

 

 

23

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 1.3.2 − Формулы предельной ошибки выборки для некоторых способов формирования выборочной

 

 

 

 

 

 

совокупности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вид выборки

 

 

 

 

 

 

 

 

Метод отбора

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

повторный

 

 

 

 

 

 

 

 

 

 

 

бесповторный

 

 

 

 

 

 

 

 

 

 

 

для средней

 

 

для доли

для средней

 

для доли

 

 

 

1. Собственно

 

2

 

 

 

 

w(1 w)

 

 

2

 

 

n

 

 

 

w(1 w)

 

 

 

 

 

n

 

 

 

~

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

t

х

 

 

t

 

 

 

t

 

х

(1

N )

 

t

 

 

 

(1 N )

 

случайная выборка

n

 

 

 

n

n

 

 

n

 

2. Механическая

 

-

 

 

 

 

 

-

 

 

 

2

 

 

n

 

 

 

w(1 w)

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

х

(1

N )

 

t

 

 

 

(1 N )

 

выборка

 

 

 

 

 

 

 

 

 

n

 

 

n

 

3. Типическая

 

2

 

 

 

 

w (1 w )

 

 

2

 

 

n

 

 

 

w (1 w )

 

 

 

 

n

 

 

t

~

 

 

t

 

t

~

(1

 

)

 

t

(1

 

)

 

выборка:

х

 

 

 

i

 

i

 

х

 

 

i

 

i

 

 

 

 

n

 

 

 

 

 

n

 

n

 

 

N

 

 

 

n

 

 

 

 

 

N

 

 

а) при пропорцио-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

нальном отборе

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) при непропорцио-

 

2

2

 

 

 

 

 

2

 

 

2

2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

t

i Ni

t

 

wi (1 wi )Ni

t

i Ni

(1

ni )

t

wi (1 wi )Ni

 

(1

ni )

нальном отборе

 

 

N

ni

 

N

 

 

 

 

ni

N

 

ni

 

 

 

Ni

N

 

 

ni

 

 

 

 

 

 

 

Ni

4. Серийная

 

2

 

 

 

 

 

 

2

 

 

2

 

 

r

 

 

 

 

 

2

 

 

r

 

 

 

 

t

~

 

 

 

 

t

 

t

~

 

 

 

 

 

t

 

 

 

 

 

 

(гнездовая) выборка

х

 

 

 

 

 

w

 

х

(1

 

)

 

 

 

w (1

 

 

)

 

 

 

r

 

 

 

 

 

r

 

r

 

 

R

 

 

 

 

r

 

 

R

 

 

 

 

24

3.4. В механическом цехе завода в десяти бригадах работает 100 рабочих. В целях изучения квалификации рабочих была произведена 20%-я серийная бесповторная выборка, в которую вошли 2 бригады. Получено следующее распределение рабочих по разрядам:

Рабочий

Разряд рабочих в бригаде № 1

Разряд рабочих в бригаде № 2

1

2

3

2

4

6

3

5

1

4

2

5

5

5

3

6

6

4

7

5

2

8

8

1

9

4

3

10

5

2

Необходимо определить с вероятностью 0,997 предел, в котором находится средний разряд рабочих механического завода.

3.5. При контрольной проверке качества поставляемых торговле пищевых яиц проведено 10%-е выборочное обследование. Из партии, содержащей 100 коробок диетических яиц, методом механического отбора в выборку взято 10 коробок. В результате сплошного обследования находящихся в каждой коробке упаковок получили следующие данные о распределении выборочной совокупности:

 

 

Количество упаковок

Коробка

 

всего

 

в том числе с весом десятка

 

 

 

яиц 440 г и выше

 

 

 

 

6-я

 

36

 

36

16-я

 

36

 

35

26-я

 

36

 

33

36-я

 

36

 

34

46-я

 

36

 

34

56-я

 

36

 

36

66-я

 

36

 

34

76-я

 

36

 

33

86-я

 

36

 

34

96-я

 

36

 

36

По выборке в целом

 

360

 

345

По данным выборочного

обследования

нужно установить с

вероятностью 0,954 предел удельного веса стандартной продукции во всей

25

партии. По условию поставки к стандартной продукции относятся диетические яйца весом не менее 440 г.

3.6. При контрольной проверке качества апельсинов проведена 10%-я серийная выборка. Из партии, содержащей 50 ящиков апельсинов (вес ящиков одинаков), методом механического отбора взято 5 ящиков. В результате сплошного обследования находящихся в ящике апельсинов получили данные об удельном весе бракованных апельсинов. Результаты следующие:

№ ящика, попавшего в выборку

1

2

3

4

5

Удельный вес бракованной продукции, %

1,2

1,8

2,0

1,0

1,5

Требуется с вероятностью 0,954 установить доверительные интервалы удельного веса бракованной продукции для всей партии апельсинов.

3.7. За рабочий день кондитерская фабрика выпускает 3 тонны печенья. Печенье упаковано в пачки по 250 граммов, в коробке 24 пачки, а коробки пакетированы в ящики по 16 штук. Для проверки качества продукции по весу пачки печенья был проведён серийный отбор. В результате отбора обследовано 3 ящика. При этом средний вес пачки составил 248 грамм, а межсерийная дисперсия равна 25. С вероятностью 0,954 определите доверительные пределы для среднего веса пачки печенья и сделайте заключение о приёме или выбраковке суточного объёма его производства. Нормативами предусмотрено отклонение по весу в пачке печенья не более

2%.

1.4.Многоступенчатый отбор (комбинированная выборка)

Впрактике выборочного наблюдения довольно часто используется многоступенчатый отбор, при котором на первом этапе из совокупности отбираются укрупнённые единицы (серии), а затем без проведения наблюдения за всеми единицами в рамках серии осуществляется собственно-случайный или механический отбор единиц из каждой отобранной серии. Ошибка выборки при двухступенчатом отборе складывается из ошибок, возникающих на каждой ступени. Средняя ошибка определяется по формулам:

 

 

 

26

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

− при повторном отборе

 

i

 

 

 

 

 

 

 

 

 

 

;

 

 

 

 

 

 

 

 

 

n

 

r

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

2

 

r

 

 

− при бесповторном отборе

 

 

i

(1

)

(1

) ;

 

 

n

N

r

R

 

 

 

 

 

 

 

 

 

 

 

Ошибка такой выборки будет зависеть от ошибки серийного отбора и от ошибки индивидуального, то есть многоступенчатый отбор даёт, как правило, менее точные результаты по сравнению с одноступенчатым, что объясняется возникновением ошибок репрезентативности на каждой ступени выборки.

При построении многоступенчатой выборки используется комбинация разных способов отбора, поэтому такой способ отбора иногда называют комбинированной выборкой.

Например. С целью проверки качества продукции путём контроля среднего размера изделий на комбинате стройматериалов проведена двухступенчатая бесповторная комбинированная выборка партии изделий в 5 000 штук. Изделия упакованы в ящики по 100 штук в каждом. На первой ступени в случайном порядке отобрано 20% всех ящиков, на второй тем же способом – 10% изделий из каждого ящика. Результаты обследования показали, что межсерийная дисперсия среднего размера изделия составила 4, а средняя из внутрисерийных дисперсий 25.

Решение:

1. Определяем число серий в генеральной и в выборочной совокупностях, а также объём выборки

 

 

 

 

 

R

 

5 000

50

ящиков, r

50 20

 

10 ящиков,

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

10 10010

 

100 изделий.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Рассчитаем среднюю ошибку комбинированной выборки:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

r

 

 

 

 

25

 

100

 

 

4

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1

 

)

 

(1

) 0,565

0,75.

 

 

 

i (1

 

 

)

 

(1

 

)

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

N

 

 

r

R

 

 

 

 

100

 

5000

10

 

50

 

 

 

 

 

От многоступенчатого следует отличать многофазный отбор, при котором из единиц совокупности, отобранных на первом этапе, осуществляется подвыборка в целях изучения дополнительных характеристик обследуемой совокупности. По структуре многофазный

27

отбор отличается от многоступенчатого отбора. Если при многоступенчатом отборе отбираются единицы разных порядков (из единиц первого порядка – единицы второго порядка и т.д.), то при многофазном отборе подвыборка состоит из тех же единиц, что и выборка основная.

Задачи

4.1. Произведена двухступенчатая бесповторная комбинированная выборка с целью определения средней высоты партии деталей в 5 000 шт. Детали упакованы в ящики по 200 деталей в каждом. На первой стадии в случайном порядке было отобрано 20% всех ящиков, на второй – также в случайном порядке 10% деталей из каждого ящика. Средняя из внутрисерийных дисперсий высоты измеряемой детали составила 25; межсерийная дисперсия – 16. Определите предельную ошибку средней высоты детали, которую можно гарантировать с вероятностью 0,997.

4.2.Проведена двухступенчатая комбинированная бесповторная выборка для определения среднего веса детали. Изготовленная продукция упакована в ящики по 50 штук. Из 500 ящиков, поступивших на склад готовой продукции на первой ступени было отобрано 10 ящиков, на второй

в случайном порядке было отобрано 10 % деталей из каждого ящика. Средняя из внутрисерийных дисперсий 12, а межсерийная – 8. Средний вес деталей в выборке равен 32 г. С вероятностью 0,997 определите предел, в котором находится средний вес деталей, поступивших на склад готовой продукции.

4.3.Генеральная совокупность состоит из 60 000 единиц, разбитых на 500 равных по объёму серий. Для определения доли единиц, обладающих изучаемым признаком, произведена двухступенчатая комбинированная бесповторная выборка 50% серий и из каждой серии отобрано по 20% единиц. Общая дисперсия альтернативного признака оказалась равной 0,21, а межсерийная дисперсия − 0,09. Определите с вероятностью 0,954 предельную ошибку выборки для доли.

28

1.5.Малая выборка

Кмалым относятся выборки объёмом менее 30 единиц (n<30). Для вероятностной оценки выборочной средней при небольшом числе наблюдений, в условиях малой выборки нужно рассматривать распределение не самих выборочных средних, а величин их нормированных отклонений от средней в генеральной совокупности, т.е. значений t, играющих роль аргумента в таблице значений интеграла

вероятностей. Для оценки возможных пределов ошибки малой выборки

~

пользуются так называемым отношением Стьюдента: t x x ,

м.в.

где

~

− выборочная средняя;

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

− генеральная средняя;

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

 

м.в.

− средняя ошибка малой выборки при собственно-случайном

или механическом повторном отборе: м.в.

 

 

2

 

 

,

 

n 1

 

 

 

 

 

 

 

 

 

где

 

2

− дисперсия для данной выборки,

не рассматриваемая как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

2

 

 

 

 

 

оценка генеральной дисперсии 2

(xi x )

.

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

Закон

 

распределения t носит

название

закона распределения

Стьюдента, согласно которому плотность распределения ошибок малой выборки S(t) равна

 

t

2

)

df 1

S(t) A(1

 

 

 

 

2 ,

df

 

 

 

 

где df – число степеней свободы при определении выборочной дисперсии, равное n-1;

А – определяется в зависимости от числа степеней свободы с

Г ( n )

помощью гамма функции (Г – функции): А 2 .

Г ( n 2 1) (n 1)

Гамма функция имеет вид: Г (и) хи 1е хdx .

0

29

Последовательно подставляя в формулу вместо и значения

n

и

n 1

,

2

2

 

 

 

 

 

можно получить значения гамма-функции, которые необходимо использовать при расчёте плотности распределения ошибок малой выборки. Вероятность того, что нормированное отклонение выборочной средней от генеральной не превысит заданного значения t, будет равна площади, ограниченной кривой распределения Стьюдента и осью абсцисс

 

 

Г (

n

)

 

t

 

2

 

n

 

 

 

2

t

)

в интервале от до t: S(t)

 

 

 

 

 

(1

 

2 dt .

 

n 1

 

 

 

 

n 1

 

 

(n 1)

 

 

 

 

 

 

Г (

 

)

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кривая t – распределения симметрична относительно оси ординат. Как видно из приводимой функции плотности, координаты кривой распределения Стьюдента зависят не только от t , но и от числа степеней свободы df . Для больших значений df (больше 30) кривая S(t) очень близка к кривой нормального распределения. Значение функции S(t) – это вероятность того, что фактический коэффициент доверия tф t .

Следовательно,

(1 S(t)) − вероятность того, что tф t . Если рассматривать

абсолютную величину нормированного отклонения, то

есть

 

tф

 

, то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

) 2 1 S(t) .

вероятность её выхода за заданные пределы t . Р(

tф

 

 

 

Вероятность того, что это отклонение будет находиться в пределах от

t до t : Р(

 

tф

 

 

 

t

 

) 1 P(

 

tф

 

 

 

t

 

) 1 2 1 S(t) 2S(t) 1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Кроме того, эта величина равна вероятности попадания среднего

значения

признака

в

 

 

 

 

 

генеральной

совокупности

в

пределы

~

~

 

 

 

 

 

 

 

~

м.в. ), где м.в

− предельная ошибка малой выборки.

 

 

 

 

 

 

х

н.в. (х

м.в. х х

 

Величины

S(t)

для

 

разных

значений

t

и df

табулированы.

Соответствующие таблицы могут быть представлены двумя способами:

1) искомая вероятность P(t) или S(t) находится на пересечении строки, соответствующей значению коэффициента доверия t , и столбца, соответствующего числу степеней свободы df или объёму выборки n, так как df n 1 (Приложение Ж);

S(t)

30

2) в клетках таблицы указывается значение коэффициента доверия t , соответствующее определённому числу степеней свободы df и значению

доверительной вероятности P(t) или уровню

значимости, равному

1 P(t) (Приложение Д).

 

В статистических таблицах вероятности S(t) и

P(t) нетождественны:

– вероятность того, что фактическое значение нормированного отклонения выборочной средней от генеральной будет не больше, чем

табличные значения, т.е.

P(tф t) S(t) ; P(t) − вероятность того, что tф

по

абсолютной

величине

не

превосходит

значения

 

t

 

,

т.е.

 

 

P(t) P( t t ) 2S(t) 1.

Например. Оздоровительный центр, рекламирует свои услуги, предлагает клиентам за короткий срок снижение веса до 10 кг. По результатам выборочного обследования 15 женщин, воспользовавшихся услугами центра, были получены следующие данные о снижении их веса

(таблица 1.5.1).

Таблица 1.5.1 − Расчётные данные

 

 

 

 

 

 

 

 

 

 

Снижение веса, кг хi

 

~

 

 

 

 

 

~ 2

(х- х )

 

 

 

 

(х- х )

 

10,2

 

3,79

 

 

 

 

 

14,36

 

7,6

 

1,19

 

 

 

 

 

1,42

 

6,1

 

-0,31

 

 

 

 

 

0,10

 

8,4

 

1,99

 

 

 

 

 

3,96

 

6,0

 

-0,41

 

 

 

 

 

0,17

 

5,7

 

-0,71

 

 

 

 

 

0,50

 

13,7

 

7,29

 

 

 

 

53,14

 

6,9

 

0,49

 

 

 

 

0,24

 

5,2

 

-1,21

 

 

 

 

1,46

 

6,1

 

-0,31

 

 

 

 

0,10

 

5,0

 

-1,41

 

 

 

 

1,99

 

3,7

 

-2,71

 

 

 

 

7,34

 

4,7

 

-1,71

 

 

 

 

2,92

 

3,6

 

-2,81

 

 

 

 

7,90

 

3,2

 

-3,21

 

 

 

 

10,30

Итого

96,1

 

-

 

 

 

 

 

105,90

 

 

 

~

хi

 

96,1

 

 

Выборочная средняя составляет

х

 

 

 

 

6,41 кг,

n

15

 

31

то есть среднее снижение веса у обследованных женщин составило 6,41 кг.

 

~

2

 

 

 

Выборочная дисперсия равна 2

(xi x )

 

105,9

7,06

n

 

15

 

 

 

Следовательно, средняя квадратическая ошибка выборки будет

 

 

 

 

2

 

7,06

 

 

 

н.в.

 

 

 

 

 

 

0,71 кг

 

 

 

 

 

 

n 1

15 1

 

 

 

 

 

 

Оценим с вероятностью 0,99 предел возможных расхождений выборочной средней и генеральной средней.

P(t) 2S(t) 1, S(t) 0,99 1 0,995 , t 3 (Приложение Ж) 2

н.в. t м.в. 3 0,71 2,13 кг ,

аснижение веса пациентов оздоровительного центра будет находиться в

пределах: 6,41 2,13 х 6,41 2,13 ; 4,28кг х 6,54кг .

Следовательно, указанное в рекламе снижение веса на 10 кг. имеет столь малую вероятность, что считается событием практически невозможным.

Задачи

5.1. Постройте 95%-й доверительный интервал для оценки генерального среднего размера детали по данным 12 деталей, произведённых на токарном автомате, если отклонения размеров этих деталей от середины поля допуска оказались следующими:

№ детали

1

2

3

4

5

6

7

8

9

10

11

12

Отклонение размера в МК

-1

+2

-2

+4

-3

+2

+6

-1

0

+4

+2

-1

5.2. При проверке автомобильных шин на сопротивление разрыву была проведена малая выборка и получены следующие результаты:

№ шины

1

2

3

4

5

6

7

8

Сопротивление разрыву, кг/см

164

180

176

168

156

186

190

170

Определите доверительные интервалы, в которых заключён средний уровень сопротивления материала разрыву, гарантируя результат с вероятностью 0,99.

5.3. Из покупателей, посещающих супермаркет, было обследовано 10 человек. Обследование установлено, что за один заход в магазине куплено

32

товаров на 3 600 рублей в среднем на 1 покупателя при среднем квадратическом отклонении 100 руб. Определите пределы отклонения стоимости купленных товаров одним покупателем во всей генеральной совокупности с вероятностью 0,99.

5.4.В токарном отделении механического цеха акционерного общества

впорядке выборки произведена фотография рабочего дня, составляющего 480 минут, 10 рабочих. Время непроизводительной работы и перерывов, зависящих от рабочего и по организационно-техническим причинам, составило: 60, 45, 46, 54, 47, 48, 49, 51, 54 и 46. Определите вероятность того, что разность между выборочным средним временем производительной работы и перерывов и временем непроизводительной работы и перерывов в среднем для всех рабочих цеха была не больше 5 минут. С вероятностью 0,95 установить пределы, в которых находится среднее для всех рабочих цеха время непроизводительной работы и перерывов.

5.5. Менеджеру универсама необходима информация о среднедневной потребности в кефире. Случайная выборка дала следующие результаты продаж (число проданных литровых тетрапакетов в день): 48; 59; 45; 62; 50; 68; 57; 80; 65; 58; 79; 69. Предположив, что это случайная выборка дневной потребности, постройте 90%-й доверительный интервал для среднего числа пакетов с кефиром, которое надо завозить ежедневно в универсам.

5.6. Из партии электроламп произведена малая выборка (отбор случайный) для определения продолжительности службы ламп. Результаты выборки следующие:

№ лампы

1

2

3

4

5

6

7

8

9

10

Срок горе-

 

 

 

 

 

 

 

 

 

 

ния, час

1 450

1 370

1 250

1 400

1 360

1 420

1 400

1 320

1 300

1 420

На основе приведённых данных требуется: 1) определить доверительные интервалы, в которых заключена средняя продолжительность службы ламп для всей партии, гарантируя результаты с вероятностью 0,99; 2)

33

определите вероятность того, что средний срок службы ламп для всей партии отличается от полученного по выборке не более чем на 40 часов.

5.7. С целью определения среднего суточного удоя молока от одной коровы способом случайного отбора в сельскохозяйственном предприятии отобрано 10 коров, средний суточный удой которых составил 10,0 кг, а среднее квадратическое отклонение – 2,0 кг. Определите: а) предельную ошибку при оценке среднего удоя, который можно гарантировать с вероятностью 0,95; б) пределы, в которых находится с этой же вероятностью средний удой молока от всех коров сельскохозяйственного предприятия. Одновременно в соседнем сельскохозяйственном предприятии в случайном порядке также было обследовано 10 коров, их средний удой оказался равным 12 кг, а среднее квадратическое отклонение удоя – 2,6 кг. Есть ли основания считать расхождение в среднем удое коров этих двух сельскохозяйственным предприятий существенным при уровне значимости = 0,05? Интерпретируйте полученные результаты.

1.6. Определение необходимой численности выборки

Для определения необходимой численности выборки нужно задать уровень точности выборочной совокупности с определённой вероятностью. В частности, необходимая численность случайной

повторной выборки определяется по формуле n

t2 2

, которая вытекает

2

 

 

 

 

из формулы предельной ошибки: t

2

 

.

 

 

 

n

 

При проектировании выборочного наблюдения предполагаются заранее заданными величина допустимой ошибки в соответствии с задачами конкретного исследования ( ) и вероятность выводов по результатам наблюдения (t) . Величина 2 , характеризующая дисперсию признака в генеральной совокупности, зачастую бывает неизвестна. Поэтому используют приближённые оценки генеральной дисперсии.

1. Исходя из результатов специально организованного пробного обследования (обычно небольшого объёма), на базе которого определяется

34

величина

дисперсии признака, используемая

в качестве

оценки

генеральной совокупности:

 

 

 

~ 2

,

 

 

2

(хi xпроб )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nпроб 1

 

 

 

где

~

средняя

арифметическая

по

результатам

пробного

xпроб

обследования;

 

 

 

 

 

 

 

 

 

 

nпроб

число единиц, попавших в пробное обследование.

По данным нескольких пробных обследований выбирается наименьшее значение.

2.Опираясь на данные предыдущих обследований как выборочных, так

исплошных, проводившихся в аналогичных целях. Дисперсию изучаемого признака в выборке можно оценить по коэффициенту вариации, значение которого получено по итогам предшествующего сплошного или

выборочного наблюдения. Коэффициент

вариации

v=

 

100%.

 

 

 

 

 

 

 

х

 

Следовательно, дисперсия будет равна 2

v2 (

 

)2

.

 

 

 

 

x

 

 

 

 

 

 

2

 

 

 

 

100

 

 

 

 

 

3.Зная примерную величину средней дисперсии, находят дисперсию из соотношения 13 х .

4.Если известны хmax и хmin , то можно определить среднее квадра-

тическое отклонение в соответствии с правилом «трёх сигм»

16 (xmax xmin ) 16 R ,

где R – размах вариации.

Размах вариации при нормальном распределении примерно равен 6 (крайние значения отстоят в ту и другую сторону от средней на расстоянии

3 ).

Например, сколько операционистов нужно обследовать в банках региона, чтобы получить характеристику среднего уровня оплаты труда

этой категории работников банков в регионе?

 

Предположим, разница между наивысшим и наименьшим

уровнем

оплаты труда операциониста в регионе составляет 3 000

руб. Для

нормального распределения в промежутках х 3 включается 99,7% всех вариантов значений признака, а это означает применительно к

35

 

рассматриваемой задаче, что 3 000 руб. примерно 6

(3 000 6 ). Поэтому

примерная оценка среднеквадратического отклонения заработной платы в генеральной совокупности операциониста региона составит 500 руб. ( =3 000/6). Для дальнейших расчётов достаточно, чтобы с вероятностью 0,954 предельная ошибка выборки не превышала 100 руб.

Тогда, зная, что =500 руб., а t=2. Следовательно,

n t 2 2 22 5002 100 человек.2 1002

Таким образом, при заданных условиях нужно обследовать размер заработной платы у 100 операционистов региона.

5. Если распределение заведомо асимметричное, то 15 (хmax xmin ) .

6. Для относительной величины принимают максимальную величину дисперсии 2max pmax (1 pmax ) 0,5(1 0,5) =0,25,

где pmsx − максимальная доля альтернативного признака.

На практике величина допустимой ошибки выборки, как правило, устанавливается не в абсолютном, а в относительном выражении: она рассчитывается как отношение ошибки к исследуемому параметру:

 

отн

 

 

100 или отн

 

 

100.

 

 

 

 

 

 

 

 

х

р

 

 

 

 

 

 

 

 

 

отн

 

 

100 или отн

 

 

100.

 

 

~

w

 

 

 

 

х

 

 

 

 

Существует

градация

 

надёжности

 

результатов

выборочного

обследования:

1)повышенная надёжность допускает ошибку выборки до 3%;

2)обыкновенная 3 10%;

3)приближённая 10 20%;

4)ориентировочная 20 40%;

5)прикидочная более 40%.Выборка считается репрезентативной, если

отн 5% .

Формулу для определения необходимой численности выборки при собственно случайном повторном отборе можно представить следующим

образом: n t2 2 ,

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36

 

 

v2

(

 

)2

 

t2v2 (

 

 

)

 

t 2v2

так как 2

 

x

n

x

 

 

 

, то

 

 

 

 

 

 

 

.

 

2

2

 

 

 

 

 

2

 

(х)

 

 

100

 

 

отн

 

отн

Например. Для изучения товарооборота по выделенной товарной группе планируется провести обследование торговых предприятий региона. Сколько предприятий розничной торговли необходимо обследовать, если по данным предшествующего обследования известно, что коэффициент вариации товарооборота по данной группе товаров составляет 90%, а предельная относительная ошибка выборки с вероятностью 0,95 не должна превысить 5%?

При Р=0,95 коэффициент доверия t=1,96 (Приложение Г).

Следовательно, n

t2v2

 

1,962 902

1 2 4 ,5 то есть при повторном отборе

2отн

52

 

 

 

необходимо обследовать 1 245 торговых предприятий.

Предельная ошибка выборки при собственно-случайном или механическом бесповторном отборе рассчитывается по формуле

 

 

 

 

 

 

 

 

 

 

t

2

(1

n

),

поэтому необходимая для достижения заданной ошибки

n

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

Nt 2 2

численность выборки

 

.

N 2 t2 2

Если задана предельная относительная ошибка выборки и известен коэффициент вариации, то численность выборки определяется по формуле

 

 

2

 

2

~

 

2

 

 

 

 

 

 

2

v

2

 

 

 

 

 

 

n

 

Nt

v

(x )

 

 

 

 

 

 

Nt

 

 

 

 

.

 

 

2

~

 

2

t

2

N

2

~

2

2

 

t

2

v

2

 

 

 

N

отн (x )

 

 

 

 

(x )

 

 

N отн

 

 

 

 

 

При бесповторном

отборе

для

 

 

нахождения

 

доли

альтернативного

признака необходимая численность выборки

n

 

Nt 2 w2

 

,

 

 

2

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

t w

 

 

где w2 w(1 w) − дисперсия альтернативного признака в выборочной совокупности ( в генеральной 2p pq p(1 p) ).

Например. Исходя из условия предыдущего примера, но зная, что общее число торговых предприятий, осуществляющих продажу товаров изучаемой группы, составляет 15 тыс. единиц, объём выборки при бесповторном отборе рассчитывают следующим образом:

 

Nt 2v2

 

 

 

 

15 000 1,962 902

n

 

 

 

 

 

 

 

 

 

 

1150 единиц,

2

t

2

v

2

15 000 5

2

2

2

 

N отн

 

 

 

 

1,96

90

37

то есть выборка должна быть 8% (

n

100

 

1150

 

100 8 %).

N

15 000

 

 

 

Как правило, цель выборочного обследования – определить пределы, в которых находится в генеральной совокупности не один, а несколько показателей. В таком случае дисперсия для каждого из них будет различна, соответственно будет различаться и необходимая численность выборки. Число обследуемых единиц будет максимально при изучении показателя с максимальной дисперсией. Соответственно и необходимая численность выборки должна быть принята на максимальном уровне из всех рассчитанных.

В таблице 1.5.1 приведены формулы для нахождения необходимой численности выборки при разных способах отбора, где х2 , р2 средняя из групповых дисперсий для средней и для доли в генеральной совокупности;х2 , р2 − межсерийная дисперсия для средней и для доли в генеральной совокупности.

Задачи

6.1.Для определения средней длины детали необходимо провести выборочное обследование методом случайного повторного отбора. Какое количество деталей надо отобрать, чтобы ошибка выборки не превышала 2 мм с вероятностью 0,954 при среднем квадратическом отклонении 8 мм?

6.2.Определите численность выборки по следующим данным. Для определения средней цены говядины на рынках города предполагается произвести выборочную регистрацию цен. Известно, цены на говядину колеблются от 80 до 100 руб. за 1 кг. Сколько торговых точек необходимо обследовать, чтобы с вероятностью 0,954 ошибка выборки при определении средней цены не превышала 2 руб. за 1 кг?

6.3.Сколько рабочих завода нужно обследовать в порядке случайной выборки для определения средней заработной платы (по отрасли средняя заработная плата составляет 34 500 руб.), чтобы с вероятностью, равной 0,954, можно было гарантировать ошибку не более 0,1% при среднеквадратическом отклонении 20 рублей?

38

6.4.В порядке собственно-случайной выборки предлагается определить долю семей с числом детей три и более. Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,02, если на основе предыдущих обследований известно, что дисперсия равна

0,2?

6.5.Сколько фирм необходимо проверить налоговой инспекции района, чтобы ошибка доли фирм, несвоевременно уплачивающих налоги, не превысила 5%? По данным предыдущей проверки, доли таких фирм составила 32%. Доверительную вероятность принять равной 0,954 (0,997).

6.6.На предприятии с числом работающих 2 500 человек провели выборочный опрос о занятиях спортом в выходные дни. Из 500 опрошенных 100 человек регулярно занимаются спортом в выходные дни. Какова численность работников предприятия, занимающихся спортом? Ответ дайте с вероятностью 0,90.

6.7.На основе выборочного обследования в отделении связи города предполагается определить долю писем частных лиц в общем объёме отправляемой корреспонденции. Никаких предварительных данных об удельном весе этих писем в общей массе отправляемой корреспонденции не имеется. Требуется определить численность выборки, если результаты выборки нужно дать с точностью до 1% и гарантировать это с вероятностью 0,95.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]