Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Артамонов статистика.pdf
Скачиваний:
43
Добавлен:
23.03.2015
Размер:
1.69 Mб
Скачать

Задача 5.1

Пусть имеется следующее распределение 200 проб нити по крепости (табл. 5.4)

 

 

 

 

 

 

 

 

Таблица 5.4

Крепость

Число

Середина

x x

 

x x

= t

ϕ(t)

154 ϕ(t) f

интер-

 

 

нити, г

проб

вала

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

1

2

3

4

 

5

 

6

7

120–130

1

125

–36,4

 

–2,80

0,008

1

130–140

8

135

–26,4

 

–2,03

0,051

8

140–150

27

145

–16,4

 

–1,26

0,180

28

150–160

58

155

–6,4

 

–0,49

0,354

55

160–170

56

165

3,6

 

0,28

0,384

59

170–180

34

175

13,6

 

1,05

0,230

35

180–190

14

185

23,6

 

1,82

0,076

12

190–200

2

195

33,6

 

2,58

0,014

2

Итого

200

 

200

 

 

 

 

 

 

 

 

 

Исходя из гипотезы о нормальном распределении результатов испытаний, необходимо выровнять ряд по кривой нормального распределения (т.е. рассчитать теоретические частоты) и оценить близость эмпирических и теоретических частот с помощью критериев

согласия: Пирсона (χ2 ), Романовского и Колмогорова (λ).

Решение:

Для нахождения теоретических частот используем формулу

 

 

f ′ =

Nh

1

t 2

f ′ =

Nh

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x x

σ

2π e

 

2 или

σ

ϕ(t),

где t =

– нормированные отклонения от средней, т.е.

x

и σ

σ

 

 

 

 

 

 

 

 

 

 

 

основные параметры кривой нормального распределения.

С них и начинаем свои расчеты. Опуская вычисления, запишем результаты: x = 161,4; σ = 13.

Дальнейшие расчеты таковы:

1)находим отклонения отдельных вариантов от средней (гр. 4

табл. 5.4);

2)делим каждое отклонение на σ, т.е. находим нормированные отклонения:

t = x σx (гр. 5);

63

3)зная t (прил. 1), находим ϕ(t) (гр. 6);

4)рассчитываем постоянный множитель const = 2001310 =154;

5)умножая последовательно 154 на ϕ(t) и округляя результаты

до целых чисел, находим теоретические частоты (гр. 7).

Как видно из таблицы, теоретические частоты ( f ) близки к эмпирическим ( f ) , хотя отдельные расхождения имеют место.

Для суждения о случайности или существенности этих расхождений используем ряд критериев согласия:

1. Критерий Пирсона: χ2 = ( f f

2

) .

f

 

Расчет этого критерия рассмотрен в табл. 5.5.

Таблица 5.5

 

 

 

 

 

 

 

 

 

( f

f

2

f

f

f f

( f

f

2

)

 

 

 

 

 

 

 

)

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

0

 

 

0

 

 

 

0

 

8

 

8

0

 

 

0

 

 

 

0

 

27

28

–1

 

 

1

 

 

 

0,04

 

58

55

3

 

 

9

 

 

 

0,16

 

56

59

–3

 

 

9

 

 

 

0,15

 

34

35

–1

 

 

1

 

 

 

0,03

 

14

12

2

 

 

4

 

 

 

0,33

 

2

 

2

0

 

 

0

 

 

 

0

 

200

200

 

 

 

 

χ2 = 0,71

В рассматриваемом примере ряд имеет 8 групп (классов) вариантов, следовательно, и 8 групп частот. Поэтому число степеней свободы для последних (при выравнивании по кривой нормального распределения) k = 8 – 3 = 5. Примем наиболее часто используемый уровень значимости α = 0,05 и обратимся к таблице прил. 2.

По таблице значений χ2 (критерия Пирсона) для степеней свободы k = 5 и уровня значимости α = 0,05 определяем, что χ2 табл = 11,07. Так как полученное в задаче фактическое значение χ2 факт = 0,71, т.е.

меньше табличного, то, следовательно, можно считать случайными расхождения между эмпирическими и теоретическими частотами, т.е. выдвинутая гипотеза о близости эмпирического распределения к нормальному не опровергается.

2. Применим критерий Романовского:

64

χ2 k = 0,715 =1,4 .

2k 10

Поскольку 1,4 < 3, то можно считать расхождения между эмпирическими и теоретическими частотами случайными.

3. Попробуем проверить нашу гипотезу с помощью критерия

 

λ =

D

Колмогорова

. Для этого запишем накопленные частоты

 

 

N

эмпирического и теоретического распределений и найдем максимальный разрыв между ними (табл. 5.6).

 

 

 

 

Таблица 5.6

f

f

Накопленные частоты

 

 

s s

 

 

 

 

 

 

 

 

 

 

 

 

 

эмпирические (s)

теоретические (s )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

1

1

 

 

 

0

 

 

8

8

9

9

 

 

 

0

 

 

27

28

36

37

 

 

 

1

 

 

58

55

94

92

 

 

 

2

 

 

56

59

150

151

 

 

 

1

 

 

34

35

184

186

 

 

 

2

 

 

14

12

198

198

 

 

 

0

 

 

2

2

200

200

 

 

 

0

 

 

Определим максимальный разрыв D = 2, поэтому λ=

D

=

2

 

=

 

 

 

 

N

 

 

100

 

= 0,2.

По таблицам P(λ) (прил. 8) находим, что для λ = 0,2 P = 1,000. Следовательно, вполне можно полагать, что расхождения между f и f носят случайный характер и распределение является нормальным.

Задача 5.2

В течение рабочей недели производилось наблюдение за работой 50 станков и регистрировались неисправности, требовавшие остановку станков для их регулировки. Результаты наблюдений следующие:

Число неисправностей (x)

0

1

2

3

4

5

Число станков ( f )

14

16

10

7

2

1

Требуется: 1) вычислить вероятности и теоретические частоты числа неисправностей, считая, что распределение последних подчиняется закону Пуассона; 2) оценить близость эмпирических и теоретических частот с помощью критериев Пирсона, Романовского и Колмогорова.

65

Решение:

1.

Рассчитаем среднее число неисправностей:

 

 

 

 

x = a = 0 14 +1 16 + 2 10 +3 7 + 4 2 +5 1

= 70

=1,4.

 

14 +16 +10 + 7 + 2 +1

 

50

 

 

2.

Найдем по таблицам значение e1,4 = 0,2466 .

 

 

3.

Подставляя в формулу Px = axea =

1,4x 0,2466

значения

 

 

x!

x!

 

 

x= 0, 1, 2, 3, 4, 5, получимвероятностичисланеисправностейот0 до5.

4.Умножив последние на 50 (общее число единиц наблюдения),

получим теоретические частоты числа неисправностей, т.е. f ′ = NPx.

Значения Px и

f (округленные до целого числа) показаны в

приводимой ниже табл. 5.7.

 

 

 

Таблица 5.7

 

Px

 

f (теоретические частоты) = 50 · Px

 

 

0,2466

 

12

 

 

0,3452

 

17

 

 

0,2417

 

12

 

 

0,1128

 

6

 

 

0,0395

 

2

 

 

0,0111

 

1

 

 

Итого

 

50

 

Для оценки близости эмпирических и теоретических частот воспользуемся критериями Пирсона, Романовского и Колмогорова:

а) критерий Пирсона: χ2 = (f f f )2 .

Все расчеты показаны в табл. 5.8.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 5.8

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

2

 

 

 

x

 

 

f

f

 

f f

( f

f

 

 

( f f )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

 

 

f

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

14

12

 

2

 

 

4

 

 

 

 

0,33

 

 

 

1

 

 

16

17

 

–1

 

 

1

 

 

 

 

0,06

 

 

 

2

 

 

10

12

 

–2

 

 

4

 

 

 

 

0,33

 

 

 

3

 

 

7

6

 

1

 

 

1

 

 

 

 

0,17

 

 

 

4

 

 

2

2

 

0

 

 

0

 

 

 

 

0

 

 

 

5

 

 

1

1

 

0

 

 

0

 

 

 

 

0

 

 

 

Фактическое

значение χ2факт = 0,89.

 

 

 

 

 

 

 

 

 

Находим критическое (табличное) значение χ2 при k = 6 – 2 = 4

и α = 0,05,

χ2

табл =

9,49

(прил. 2). Так как

 

χ2

факт < χ2

табл , т.е.

66

0,89 < 9,49, то имеем все основания считать расхождения между эмпирическими и теоретическими частотами случайными, а следовательно, не опровергнутой гипотезу о том, что распределение числа неисправностей подчиняется закону Пуассона;

б) применим критерий Романовского: χ2 2kk = 184 < 3.

Следовательно, расхождения случайны;

в) и наконец, по критерию Колмогорова, λ = DN . Данные пока-

заны в табл. 5.9.

Таблица 5.9

 

Накопленные частоты

 

s s

 

 

 

 

 

эмпирические (s)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

теоретические (s )

 

 

 

 

14

 

 

 

 

12

2

 

 

30

 

 

 

 

29

1

 

 

40

 

 

 

 

41

1

 

 

47

 

 

 

 

47

0

 

 

49

 

 

 

 

49

0

 

 

50

 

 

 

 

50

0

 

Таким образом, λ =

2

=

2

0,3.

 

 

 

 

 

50

 

7,07

 

 

 

 

По таблице (прил. 8) находим P(λ ≈ 0,3) 1. Следует вывод о

случайности расхождений.

Итак, все три критерия оценивают расхождения между эмпирическими и теоретическими частотами как случайные, не опровергая тем самым выдвинутую гипотезу о том, что распределение станков по числу неисправностей подчиняется закону Пуассона.

Задача 5.3

Распределение населения РФ по размеру среднемесячного душевого денежного дохода в апреле 1993 г. характеризовалось данными, приведенными в табл. 5.10.

 

Таблица 5.10

Среднемесячныйдушевойдоход, тыс. р.

Численность населения, млн чел.

 

 

До 5

6,6

5–10

39,8

10–15

45,6

15–20

33,4

20–25

21,6

Свыше 25

1,7

Итого

148,7

67

Определить: 1) общий среднемесячный душевой доход; 2) среднее квадратическое отклонение; 3) исходя из гипотезы о нормальном распределении, рассчитать теоретические частоты в данном ряду;

4) с помощью критериев Пирсона (χ2 ) , Романовского и Колмогорова (λ) проверить, согласуется ли эмпирическое распределение с нор-

мальным распределением.

Ответ: 1) x = 13,465 тыс. р.; 2) σ = 5,74 тыс. р.; 3) f теор = (8,4; 30,2; 51,1; 40,6; 15,1; 2,6); 4) χ2 = 8,41; K Ром = 2,2; λ = 0,64.

Задача 5.4

Для контроля качества продукции у 200 рабочих, изготовляющих однотипную продукцию, проверено по 50 изделий у каждого

(табл. 5.11).

Таблица 5.11

Кол-во бракованных изделий

Число рабочих

из 50 проверенных

 

0

110

1

59

2

26

3

4

4

1

Определить: 1) среднее количество бракованных изделий на одного рабочего; 2) теоретические частоты, исходя из гипотезы о распределении Пуассона; 3) случайны или нет расхождения между эмпирическими и теоретическими частотами, используя для этого критерии Пирсона, Романовского, Колмогорова.

Ответ: x = 0,635; e0,635 = 0,5326; f теор = (106; 67; 21; 5; 1).

Тема 6. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ

Пусть требуется изучить совокупность однородных объектов относительно некоторого признака, характеризующего эти объекты. На практике обычно нельзя выполнить сплошное обследование всех объектов, когда, например, совокупность может содержать очень большое число объектов или обследование всей совокупности связано с их разрушением. В таком случае из всей совокупности случайным образом отбирают ограниченное число объектов для изучения.

Генеральной совокупностью называется совокупность объектов, из которой производится выборка. Выборочной совокупностью (вы-

68

боркой) называется совокупность случайно отобранных объектов из генеральной совокупности. Объемом совокупности называется число объектов в совокупности.

Например, если из 1000 деталей отобрано 100, то объем генеральной совокупности N = 1000, а объем выборки n = 100.

Повторная и бесповторная выборка

При составлении выборки можно поступать двумя способами: после обследования объект можно возвращать или не возвращать в генеральную совокупность. Выборка называется повторной, если отобранный объект возвращается в генеральную совокупность и бесповторной, если не возвращается. Если объем генеральной совокупности велик, а выборка составляет лишь небольшую ее долю, то различие между повторной и бесповторной выборками становится незначительным.

Для того чтобы по выборке можно было с достаточной уверенностью судить об интересующем нас признаке генеральной совокупности, надо, чтобы объекты выборки правильно его представляли.

Это требование называется представительностью или репрезентативностью выборки.

Выборка будет представительной, если объекты отбираются случайным образом, так, что все они имеют одинаковую вероятность попасть в выборку.

Способы отбора

Способы отбора объектов в выборку бывают двух видов:

1)отбор, не требующий расчленения генеральной совокупности на части, он называется простым случайным отбором. При этом объекты извлекаются из всей совокупности по одному. Простой случайный отбор может быть повторным и бесповторным;

2)отбор, при котором генеральная совокупность разбивается на части.

Разбиение на части можно выполнить несколькими методами: - при типическом отборе генеральная совокупность разбивает-

ся на типические части, и объекты отбираются не из всей совокупности, а из каждой ее типической части. Типический отбор используется, когда обследуемый признак заметно отличается в разных частях генеральной совокупности. Например, если детали изготавливаются на нескольких станках, то генеральная совокупность деталей разби-

69

вается на типические части, соответствующие разным станкам. Разновидностью типического отбора является районированная выборка, при которой отбор объектов производится из групп, представленных административно-территориальными образованиями;

-при механическом отборе генеральная совокупность разбивается на столько групп, сколько объектов должно войти в выборку, и из каждой группы произвольно отбирается один объект;

-при серийном отборе объекты отбираются из генеральной совокупности не по одному, а сериями, которые подвергаются сплошному обследованию. Такой способ отбора широко применяется при определении качества продукции, когда для проведения контроля вскрывается упаковка, содержащая определенное количество изделий, и все они проверяются;

-при использовании нескольких типов отбора одновременно имеем комбинированный отбор.

В целом ряде случаев средние и относительные величины ка- кой-либо совокупности рассчитываются на основе данных выборочного наблюдения. Для отобранных единиц рассчитываются обобщенные характеристики (средние или относительные показатели). Затем результаты выборочного обследования распространяются на всю генеральную совокупность. Основной задачей при этом является определение ошибок выборки. Различают среднюю и предельную ошибки выборки.

Средняя ошибка выборки (μ) характеризует среднюю величину

возможных расхождений выборочной и генеральной средней (или доли).

При случайном повторном отборе средняя ошибка выборочной средней определяется по формуле

μ = σn2 ,

где σ2 – дисперсия изучаемого показателя в генеральной совокупности, а n – численность (объем) выборки.

Средняя ошибка выборочной доли определяется по формуле

μ =

w(1 w)

,

 

n

 

где w – выборочная доля единиц, обладающих изучаемым признаком, а w(1 w) – дисперсия доли (альтернативного признака).

70

При бесповторном отборе в формулах под знаком радикала по-

 

n

 

 

является множитель 1

 

, где

N

– численность генеральной со-

 

 

 

N

 

 

вокупности.

Предельная ошибка выборки, обозначаемая через , рассчитывается по формуле

= tμ,

где μ – средняя ошибка выборки, t – коэффициент доверия (показа-

тель, определяющий размер ошибки в зависимости от того, с какой вероятностью она находится).

Значения t и P (вероятность допуска той или иной ошибки) даны в специальных таблицах (прил. 3), где P рассматривается как функция t и рассчитывается по формуле

 

 

 

 

 

+t

t 2

 

 

t

 

t 2

 

 

 

 

 

 

2 dt =

 

2 dt .

P = F(t) =

1

 

e

2 e

 

 

 

 

2π t

 

 

 

2π 0

 

 

 

 

Таким образом, общая формула предельной выборки = tμ для

средней приобретает вид

 

 

 

 

 

 

 

 

 

 

 

= t

σ 2

(для повторного отбора)

n

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= t

σ2

 

n

 

 

 

 

 

 

 

 

n

1

 

(для бесповторного),

 

 

 

N

 

 

 

 

 

 

 

 

а для доли, соответственно,

 

 

 

 

 

w(1w)

 

 

 

 

= t

w(1 w)

и

=t

 

 

 

n

 

n

 

 

 

n

1

.

 

 

 

 

 

 

 

 

 

 

 

N

Формулы предельной ошибки несколько конкретизируются и в зависимости от применяемого вида выборки. Например, указанные выше формулы применимы для собственно случайной и механической выборок. Для типической (районированной) выборки, т.е. когда генеральная совокупность делится на группы по какому-либо существенному признаку, а затем из каждой группы производится случайный отбор и общая средняя величина признака (или доля) определяется по групповым выборочным показателям, в формуле предельной ошиб-

ки выборки учитывается средняя изгрупповых дисперсий ( σ2 ), т.е.

= t

σ2

или

=t

w(1

w)

.

n

n

 

 

 

 

71

В этом случае ошибка выборки зависит от внутригрупповой вариации.

При серийной (гнездовой) выборке, когда из генеральной совокупности, разбитой на определенные равновеликие серии (гнезда), случайно отбираются серии, внутри которых проводится сплошное наблюдение, величина ошибки выборки зависит не от числа обследованных единиц, а от числа обследованных серий (s) и от величины

межгрупповой дисперсии δ

2

=

(xi x)2

. Серийная выборка в ос-

 

s

 

 

 

 

новном проводится как бесповторная, и формула ошибки выборки в этом случае имеет следующий вид:

=t δs2 1Ss ,

где δ2 – межсерийная дисперсия; s – число отобранных серий;

S – число серий в генеральной совокупности.

Все рассмотренные выше формулы используются при так называемой большой выборке. Если n < 20, то выборка именуется малой и при расчете ошибок выборки необходимо учитывать следующие моменты. Во-первых, в формуле средней ошибки в знаменателе применяется n – 1, т.е.

μ =

σ2

 

.

n

1

 

 

И во-вторых, при нахождении вероятности допуска той или иной ошибки либо определении доверительных интервалов исследуемого показателя в генеральной совокупности пользуются таблицами вероятности Стьюдента, где P = S (t, n) определяется в зависимости от объема выборки и t (прил. 4).

В статистике часто приходится сравнивать результаты двух (или более) выборок. И на основании сравнения двух выборочных средних (или долей) делается вывод о случайности или существенности их расхождений. Для этого абсолютная разность показателей ~x1 ~x2

сопоставляется со средней ошибкой разности μразн = μ12 22 = t.

Если при n > 20 результаты этого вычисления t < 3, то делается вывод о случайности расхождений. Если же объем выборки мал, т.е. n 20, то полученное значение t (фактическое) сравнивают с табличным, определяемым по таблицам t-распределения Стьюдента при

72

заданном числе степеней свободы и уровне значимости (число степеней свободы при этом определяется как n1 + n2 2).

Интервальное оценивание

Пусть в результате наблюдений получена выборочная совокупность x1, x2 ,..., xn. Затем по этим данным рассчитывается ~θn – харак-

теристика выборочной совокупности. Требования к ~θn :

1) несмещенность – ~n =

;

Q

MQ

2)состоятельность – lim P( Qn Q < ε при n → ∞) = 1;

3)эффективность – минимальная дисперсия.

ОПРЕДЕЛЕНИЕ. Доверительным интервалом называют интер-

~(1) ~(2) , который с вероятностью γ накрывает значение θ, вал (Qn ,Qn )

при этом γ называется доверительной вероятностью.

Довольно часто интервал делают симметричным (θ − ,θ + ) ,

где – наибольшее по модулю отклонение соответствующей характеристики выборочной совокупности от характеристики генеральной совокупности.

Существует два способа задания доверительных интервалов:

1)n – достаточно велико. В этом случае используется теорема из теории вероятности, называемая законом больших чисел;

2)n – мало. В этом случае определяются точные законы распределения.

ТЕОРЕМА. Для достаточно большой выборки (n > 30) для генерального среднего и генеральной доли справедливы выражения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

t

x2

 

p(

 

 

 

 

В

 

 

< ) = Φ(t) , где t =

σx , Φ(t) =

 

2 dx ;

 

 

 

 

 

 

 

 

 

 

 

X

X

Г

 

e

 

 

 

 

 

 

 

 

p(

 

ω− p

 

) = Φ(t) , где t =

σω .

2π 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X i

 

 

 

 

 

 

Доказательство.

 

В, ω представляет

i=1

 

, где

Xi – случай-

X

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ные величины с одинаковым законом распределения, конечным математическим ожиданием и дисперсией.

73

Воспользуемся центральной предельной теоремой (теоремой Ляпунова). Обозначим Y = xn1 + xn2 +... + xnn .

При n →∞ Y нормальному распределению.

Если выборка повторная, то

x1

,

x2

,...,

xn

– независимы.

 

n

 

 

 

 

 

 

 

 

 

n

 

n

Воспользуемся свойством нормального распределения: если X

случайная величина распределения

по

нормальному закону и

MX = a , то p(

 

x a

 

) = Φ(t) .

 

 

 

 

 

 

 

 

 

 

Теорема доказана.

 

 

 

 

Так как

N

 

< 1, то при одной и той же доверительной вероят-

n +

 

 

N

 

 

 

 

ности объем бесповторной выборки меньше объема повторной.

Оценка характеристик генеральной совокупности по малой выборке

Пусть x1, x2 ,..., xN – выборка.

 

0 – генеральное среднее, σ2

– ге-

X

неральная дисперсия, p – генеральная доля.

 

ОПРЕДЕЛЕНИЕ. Под малой выборкой понимают выборку типа

x1, x2 ,..., xn , n ≤ 30 (n (10, 20)).

 

 

 

 

 

 

 

 

 

 

Точечные оценки

 

0

 

 

, σ2 S 2 , p ω применять нельзя,

X

X

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т. к. нарушается условие

состоятельности lim (

 

X в

 

0

 

<

) =1

 

 

 

X

 

 

 

 

 

 

 

 

n → ∞

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n ≤ 30) и невозможно использовать центральную предельную теорему Ляпунова.

ТЕОРЕМА. Если X – случайная нормально распределенная величина с параметрами N (x0 , σ2 ) , то

n

xi

X В = i=1 , n

где x1, x2 ,..., xn – выборка из генеральной совокупности для конечного

n имеет нормальное распределение с характеристиками N (x0 , σ2 ) . n

Доказательство. В теории вероятности рассматривали случайную величину z = x + y. Если x и y имеют нормальное распределение, то z также имеет нормальное распределение.

74

Поэтому в нашей теореме

 

 

 

=

1 n Mx

=

1

 

0 n =

 

0 ,

MX

в

X

X

 

 

 

ni=1

i

 

n

 

 

в =

x1

+

x2

+

x3

+ ... +

xn

,

 

X

 

 

n

 

 

n

 

 

 

 

 

 

 

n n

 

 

 

 

 

σ2

 

 

 

 

 

 

 

1

n

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DXв

=

 

 

Dxi

=

 

nσ

 

=

.

 

 

n2

n2

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

в

 

0

 

Рассмотрим статистику

t следующего вида t =

X

X

n . Вы-

 

 

σ

числим ее математическое ожидание

 

 

 

 

 

 

 

 

 

Mt =

n

(M ( X

 

) MX 0 ) =

n

( X 0

 

0 ) = 0

 

в

X

 

 

 

 

 

σ

 

σ

 

 

 

 

 

 

и дисперсию

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

σ2

=1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Dt =

 

(DX

в

DX0 )

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2

 

 

 

 

 

 

 

σ2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( X

X

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S)2 =

 

 

n

 

 

 

 

 

Найдем величину

 

S 2 =

i=1

 

 

 

.

 

 

 

 

Рассчитаем

 

 

S 2 .

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

Обычно

 

0

и σ2 – не известны.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим статистику t1:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ → S S

 

 

 

 

( Xв X0 )

( Xв X0 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= ( Xв

X0 ) n n 1

= ( Xв X0 ) n 1 =

 

 

 

 

 

σ

n

 

 

 

 

σ

n

 

 

 

t

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

nS

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

n

1

 

2

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

n 1 S

 

σ2

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

σ

 

 

S 2

 

– имеет распределение χ2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Распределение χ2

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= Zi 2 , где Zi N (0, 1) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из результатов расчета видно, что t1 =

 

 

 

 

t

 

 

 

 

 

. Эта статистика

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

имеет t-распределение Стьюдента с k = n – 1 степенями свободы.

 

 

 

 

n

 

 

 

 

 

xi

 

 

 

 

=

i=1

снимает одну степень свободы.

X

в

 

n

 

 

 

 

 

 

 

 

 

75

= tγ
p( Xв X0
p( ( Xв X0 S
p( Xв X0

Для t-распределения справедлива следующая теорема.

ТЕОРЕМА МАЛОЙ ВЫБОРКИ (без доказательства)

n 1 tγ,n1) = γ = θ(t, n 1) ,

tγ, n 1 S ) = γ ,

n 1

) = γ = θ(γ, n 1) ,

,n1 S .

n 1

Пример 1. Для определения срока службы большой партии ламп было отобрано 17 ламп. В среднем они горели 980 часов ( X ), S = 18. Определить вероятность того, что средний срок службы ламп во всей совокупности отличается от среднего значения выборки по абсолютной величине не более, чем на 8 часов.

Решение:

Абсолютная ошибка = 8.

Наблюдаемая статистика tγ,n 1 =

n 1 =

32

= 1,78 , m = n – 1 =

 

S

 

18

 

= 16 – число степеней свободы.

Тогда p( X в X 0 8) = 0,906 (прил. 4), т. е. можно утверждать с

вероятностью, равной 0,906, что средний срок годности ламп по всей совокупности равен 980 часам.

Знание предшествующих формул позволяет строить довери-

тельные

интервалы

 

 

в − ≤

 

0

 

в +

с вероятностью γ

X

X

X

 

 

0 (

 

в

,

 

в + ) .

Подставив цифры,

получим с вероятностью

X

X

X

γ = 0,906 X 0 (972, 988).

Найдем границы, в которых с вероятностью 0,95 находится ге-

неральное среднее: γ = 0,95,

=

2,12 18

9,5 ,

 

0

(970,5; 989,5) с

X

 

 

4

 

 

 

 

вероятностью γ = 0,95.

Построение доверительного интервала для генеральной дисперсии

Пусть x1, x2 , ..., xN – генеральная совокупность. Проведем повторную выборку, результатом которой будут значения x1, x2 ,..., xn .

76

 

 

 

 

 

 

 

n

0 )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

( X i

X

 

 

 

 

 

 

 

 

 

Обозначим через

S

*

=

i =1

 

 

дисперсию для данной вы-

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

борки по отношению к

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 (генеральному среднему).

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( X i

 

0 )2

 

 

 

 

 

 

 

 

 

 

 

 

2

X

n

 

 

 

 

 

 

 

 

 

 

 

X 0

 

Рассмотрим статистику t = nS*

=

i =1

= (

X i

)2 .

 

 

 

 

 

 

 

 

 

 

σ2

 

 

σ2

i = 1

σ

Она имеет нормальное распределение. Найдем ее математическое ожидание:

 

 

n Xi2

2 Xi

 

0 +

 

02

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

X

X

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

Mt = M

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

[M ( Xi

)n 2 X0M ( Xi )n + nX0

]=

 

 

 

 

σ

2

 

 

 

 

 

 

σ

2

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

(M ( Xi )n nX0 )

= 0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

X i

 

 

0

 

 

 

 

n

 

 

 

 

 

 

Статистика имеет вид t

 

 

X

 

 

2

 

2

 

 

 

 

 

= ∑

(

 

 

 

 

 

 

 

)

 

=

ti .

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

i =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Можно показать, что Mti

= 0 ,

 

Dti

=1 , тогда t имеет χ2 распре-

деление с k = n степенями свободы:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ2 = Zi 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i =1

 

 

 

 

 

 

 

 

 

На практике

 

0 и σ2

обычно не известны, поэтому заменим в

X

данной статистике S* на S , т. е. t

 

= nS 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ2

 

 

 

 

 

 

 

 

χ2 распределение имеет следующий график:

S = γ

 

 

 

S1

 

 

 

 

S2

 

 

 

 

 

 

 

X12

X 22

 

 

 

 

 

Находим вероятность того, что

 

 

 

 

 

2

<

nS 2

<

2

p(χ

2

2

) + p(χ

2

2

− γ.

p( X1

σ2

X 2 ) = S = γ ,

 

< X1

 

> X 2 ) =1

 

 

 

 

 

 

 

 

 

 

 

X12 и X 22 обычно не симметричны относительно вершины.

77

Зададим условие их выборки следующим образом:

 

 

p(χ2 < X12 ) = p(χ2 > X 22 ) =

 

1 − γ

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 − γ

 

 

 

 

2

 

 

 

 

 

тогда p(χ2 > χ2кр ) p(χ2 > X

 

2 ) =

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

после подстановки

p(χ2 < X12 ) =

1 − γ

=1 p(χ2

> X12 )

мы получим,

 

что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nS 2

 

 

 

 

 

 

nS 2

 

p(χ

2

2

 

1

− γ

 

1 + γ

,

p(

 

 

 

2

 

 

) = γ,

 

> X1 )

=1

 

 

 

 

 

 

=

 

 

 

 

 

 

< σ

 

<

 

 

 

 

 

2

 

 

 

2

 

X 22

 

X12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p(χ2 > X 22 ) =

 

1 − γ

, p(χ2

> X12 ) =

1 + γ

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

Пример 2. В цехе изучена производительность труда 20 рабочих. Установлено S = 15 м/ч. Считая, что производительность имеет

нормальное распределение с вероятностью p = 0,9, найти σ2 и σ.

Решение:

p(χ2 > X 22 ) =

 

1 0,9

= 0,05 , p(χ2

> X12 ) =

1 + 0,9

= 0,95 .

2

 

 

 

2

 

Степени свободы в нашем случае m = n 1 =19 , а X 22 = 30,1,

X12 = 10,1.

 

 

 

 

 

 

20 152 < σ2 <

 

20 152 , 149,5< σ2

<445,6 ,

 

 

30,1

10,1

 

 

 

 

149,5 < σ < 445,6 , 88,46<σ <21,1 .

При n → ∞ χ2 и t – нормальные распределения.

Вопросы и задания

1.Что такое выборочное наблюдение и в каких случаях к нему прибегают?

2.Каковы теоретические основы выборочного метода?

3.Какие существуют способы отбора (виды выборки)?

4.От чего зависит точность выборки?

5.Что такое повторная и бесповторная выборки?

6.Как рассчитать среднюю и предельную ошибки выборки (для средней и для доли)?

78