Paly_I_A__Prikladnaya_statistika_Uchebnoe_po
.pdf«успеха» в n независимых испытаниях, где под «успехом» понимается попадание случайной величины Х в i-й интервал. Таким образом, вероятность «успеха» равна рi, а случайная величина ni имеет биномиальное распределение с параметрами n и рi. В частности, M(ni) = npi. Рассмотрим теперь случайную величину χ2, функцию от случайных величин n1, n2, …, nk, определяемую формулой
χ 2 |
k |
( n i |
− np i ) |
2 |
|
= ∑ |
|
. |
|||
|
np i |
|
|||
|
i =1 |
|
|
|
Еще раз подчеркнем, что в этой формуле n и рi – это числа, а ni – это случайные величины. Имея выборку, мы можем найти значения случайных величин ni, которые они приняли в результате n независимых испытаний, и вычислить затем значение χэксп – экспериментальное значение случайной величины χ2. Можно доказать, что если закон распределения генеральной совокупности Х подобран правильно, то с ростом n случайную величину χ2 можно считать распределенной по так называемому закону распределения χ2. Это непрерывное распределение, формулу функции плотности вероятности которого мы не будем здесь приводить. Распределение зависит от одного параметра r, который называется числом степеней свободы. В нашем случае
r = k-1-S,
где k – число интервалов;
S – число параметров закона распределения, вычисленных по выборке. Возникает естественный вопрос: каким должно быть число n, чтобы его можно было считать «достаточно большим» и пользоваться распределением χ2? Желательно, чтобы n было таким большим, чтобы все произведения npi были не меньше 5 (рекомендация всех учебников по статистике). На самом деле, как показывает практика, вполне достаточно
выполнения неравенств nрi ≥ 1, n ≥ 50.
Примерный график функции плотности вероятности случайной величины χ2 показан на рис. 6.2.
Рис.6.2
Если закон распределения генеральной совокупности Х подобран правильно, экспериментальное значение χэксп, вычисленное на основании выборки, не может быть слишком большим. Зададимся достаточно большой вероятностью β (β = 0,9; 0,95; 0,99), так что события с вероятностью α = 1 - β будем считать практически невозможными. Вероятность α называют уровнем значимости.
С точки зрения подтверждения выдвинутой нами гипотезы о законе распределения генеральной совокупности Х мы должны считать практически невозможными большие значения случайной величины χ2. Мы считаем практически невозможными значения случайной величины χ2
из интервала (χ2кр, ∞), где число χ2кр определяется из условия (см. рис.6.2) p(χ2 > χ2кр) = α .
Для распределения χ2 составлены специальные таблицы (приложение 3). По ним можно найти число χ2кр, зная α и число степеней свободы r. Число χ2кр сравнивают с числом χ2эксп. Если оказывается, что χ2эксп <χ2кр, то говорят, что с точки зрения принятия выдвинутой гипотезы о законе распределения генеральной совокупности Х произошло достоверное событие. Гипотеза считается не противоречащей опытным
данным и принимается. Если же оказывается, что χ2эксп > χ2кр, то выдвинутая гипотеза отвергается, считается, что она противоречит
опытным данным.
В нашем случае k = 11, r = 11 - 1- 1 = 9 (по выборке был определен один параметр - λ). Если положить β = 0,95 (α = 0,05 - наиболее употребительное значение уровня значимости), то по таблице
распределения χ2 находим, что χ2кр = 16,92. Между тем χ2эксп = 2,45 < χ2кр. Так что мы можем считать, что случайная величина Х имеет показательное
распределение с параметром λ = 0,00115. Если бы мы объединили три последних интервала в один, то имели бы: r = 9 - 1 - 1 = 7; χ2кр = 14,07;
χ2эксп = 2,33 < χ2кр.
Случайная величина χ2 называется критерием χ2. Критерий χ2 был предложен Карлом Пирсоном в 1900 г. До этого времени совпадение экспериментальных результатов с теоретическими оценивалось по тому, как они выглядят на графике.
Нам осталось ответить на вопросы, поставленные в пункте 6.1. Мы считаем справедливым показательный закон с параметром λ = 0,00115.
Следовательно, М(Х) =1/λ ≈ 870 (ч).
р(Х > 1000) = е-λ*1000 - е-∞ = е-1,15 ≈ 0,32; р(Х < 200) = е0 - е-λ*200 = 1 - е-0,23 ≈ 0,21.
1.3. ДРУГИЕ ПРИМЕРЫ
6.3.1. Проверка гипотезы о нормальном законе распределения
Заказчику необходимы валы с допустимым отклонением диаметра от номинального размера ±0,1 мкм. Прежде чем покупать партию из 1000 валов, он приобрел партию из 200 валов, чтобы оценить ожидаемую долю неподходящих ему изделий. Результаты измерений представлены в табл. 6.4.
Таблица 6.4
200 отклонений диаметра вала от номинального размера (мкм)
Середина интервала |
-0,14 |
-0,12 |
-0,10 |
-0,08 |
-0,06 |
-0,04 |
-0,02 |
Частота |
3 |
8 |
11 |
20 |
27 |
36 |
29 |
Середина интервала |
0,00 |
0,02 |
0,04 |
0,06 |
0,08 |
0,10 |
0,12 |
Частота |
18 |
17 |
17 |
8 |
4 |
1 |
1 |
Здесь h = 0,02 мкм; n = 200; nh = 4.
Гистограмма показана на рис.6.3. Высоты гистограммы таковы:
h1 = 0,75; h2 = 2; h3 = 2,75; h4 = 5; h5 = 6,75; h6 = 9; h7 = 7,25; h8 = 4,5; h9 = h10 = 4,25; h11 = 2; h12 = 1; h13 = h14 = 0,25.
Числовые характеристики: x = - 0,028 (мкм); S = 0,05 (мкм).
Судя по гистограмме, можно заключить, что случайная величина Х – отклонение диаметра вала от номинального – имеет нормальное распределение. Функция плотности нормального закона зависит от двух
параметров – а и σ : |
f (x) = |
1 |
|
e |
−(x−a)2 |
|
|
|
|
|
|
||
2π |
2 σ2 . |
|
|
|
|
|
|
||||||
|
|
|
|
σ |
|
|
|
|
|
|
|
|
|
9 hi, f(x) |
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
X |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
-0,15 |
-0,13 |
-0,11 -0,09 -0,07 |
-0,05 |
-0,03 |
-0,01 0,01 |
0,03 |
0,05 |
0,07 |
0,09 |
0,11 |
0,13 |
||
|
|
|
|
|
|
Рис. 6.3 |
|
|
|
|
|
|
Как известно, М(Х) = а, σ (Х) = σ. Для определения а и σ положим, что а = x , σ = S. Отсюда a = - 0,03; σ = 0,05 (значение x округлено, исходя из соображений здравого смысла). Тогда
|
1 |
−(x+0,03)2 |
=8 e−200(x+0,03) |
2 |
|
f (x) = |
0,05 |
2π e 2 0,0025 |
|
. |
Значения функции плотности вероятности на границах интервалов таковы (табл. 1.5):
|
|
|
|
|
|
|
|
Таблица 6.5 |
|
xi |
-0,15 |
-0,13 |
-0,11 |
-0,09 |
-0,07 |
-0,05 |
-0,03 |
|
-0,01 |
f(xi) |
0,45 |
1,08 |
2,22 |
3,89 |
5,81 |
7,38 |
8,00 |
|
7,38 |
хi |
0,01 |
0,03 |
0,05 |
0,07 |
0,09 |
0,11 |
0,13 |
|
– |
|
|
|
|
|
|
|
|
|
|
f(xi) |
5,81 |
3,89 |
2,22 |
1,08 |
0,45 |
0,16 |
0,05 |
|
– |
График функции плотности вероятности показан на рис. 6.3. Вычислим теоретические вероятности попадания в интервалы.
Формула вычисления вероятности попадания в интервал [xi-1; xi) нормально распределенной случайной величины Х такова:
p(xi−1< X <xi ) =Ф xi σ− a −Ф xi−1σ− a ,
где Ф(х) – функция Лапласа.
Значения функции Лапласа приведены в приложении 1. Отсюда:
p1 |
|
−0,13 + 0,03 |
|
−0,15 + 0,03 |
= −0,477 −(−0,492) = 0,015 ; |
||
(−0,15 <X<−0,13) = Ф |
0,05 |
|
−Ф |
0,05 |
|
||
|
|
|
|
|
|
||
p2 |
|
−0,11 + 0,03 |
|
−0,13 + 0,03 |
= −0,445 −(−0,477) = 0,032 . |
||
(−0,13 <X<−0,11) = Ф |
0,05 |
|
−Ф |
0,05 |
|
||
|
|
|
|
|
|
Дальнейшие вычисления приведены в табл.6.6.
Из-за того, что значение параметра a случайно совпало с одной из границ, значения вероятностей Рi оказались симметричны относительно интервала (-0,05; -0,01). Два последних интервала [0,09; 0,11) и [0,11; 0,13)
объединены ввиду их малочисленности.
Положим α = 0,05. Число степеней свободы r = 13 - 2 - 1 = 10, χ2кр = =18,3 > χ2эксп = 8,06. Нет оснований отвергнуть выдвинутую нами гипотезу о нормальном законе распределения отклонений диаметра вала от номинального значения.
Таблица 6.6
|
|
x |
i |
− a |
|
x |
i |
−a |
|
|
|
|
|
|
(n |
i |
− np |
)2 |
|
||||
|
[хi-1; xi) |
|
|
|
|
|
Ф |
|
|
|
|
pi |
npi |
ni |
ni -npi |
|
|
i |
|
|
|||
|
|
|
σ |
|
|
|
σ |
|
|
|
|
npi |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
− |
|
|
|
-2,4 |
|
-0,492 |
|
|
− |
− |
− |
− |
|
|
|
− |
|
|
[-0,15;-0,13) |
-2 |
-0,477 |
0,015 |
3 |
3 |
0 |
0 |
[-0,13;-0,11) |
-1,6 |
-0,445 |
0,032 |
6,4 |
8 |
1,6 |
0,4 |
[-0,11; -,09) |
-1,2 |
-0,387 |
0,058 |
11,6 |
11 |
-0,6 |
0,03 |
[0,09;-0,07) |
-0,8 |
-0,288 |
0,099 |
19,8 |
20 |
0,2 |
0,002 |
[-0,07,-0,05) |
-0,4 |
-0,155 |
0,133 |
26,6 |
27 |
0,4 |
0,006 |
[-0,05;-0,03) |
0 |
0,000 |
0,155 |
31 |
36 |
5 |
0,81 |
[-0,03;-0,01) |
0,4 |
0,155 |
0,155 |
31 |
29 |
-2 |
0,13 |
[-0,01;0,01) |
0,8 |
0,288 |
0,133 |
26,6 |
18 |
-8,6 |
2,78 |
[0,01;0,03) |
1,2 |
0,387 |
0,099 |
19,8 |
17 |
-2,8 |
0,4 |
[0,03;0,05) |
1,6 |
0,445 |
0,058 |
11,6 |
17 |
5,4 |
2,51 |
[0,05;0,07) |
2 |
0,477 |
0,032 |
6,4 |
8 |
1,6 |
0,4 |
[0,07;0,09) |
2,4 |
0,492 |
0,015 |
3 |
4 |
1 |
0,33 |
[0,09;0,10 |
2,8 |
0,497 |
0,005 |
1,0 |
1 |
|
|
[0,11;0,13) |
3,2 |
0,499 |
0,002 |
|
|
0,6 |
0,26 |
|
|
|
|
0,4 |
1 |
|
|
∑ |
– |
– |
0,991 |
198,2 |
200 |
– |
8,06 |
Оценим долю валов, подходящих заказчику. Вероятность того, что диаметр вала соответствует требованиям заказчика равна p(−0,1<X<0,1) =
|
0,1+0,03 |
|
−0,1+0,03 |
|
|
|||
=Ф |
|
|
−Ф |
|
|
=Ф(2,6) +Ф(1,4) |
=0,495+0,419 =0,914. |
|
0,05 |
0,05 |
|||||||
|
|
|
|
|
|
В среднем около 9 % валов окажутся непригодными для заказчика.
6.3.2. Проверка гипотезы о равномерном законе распределения
В течение 10 часов регистрировали время прибытия машин к бензоколонке (табл. 6.7).
Таблица 6.7
Время |
|
|
|
|
|
|
|
|
|
|
прибы- |
[8-9) |
[9-10) |
[10-11) |
[11-12) |
[12-13) |
[13-14) |
[14-15) |
[15-16) |
[16-17) |
[17-18) |
тия |
|
|
|
|
|
|
|
|
|
|
(часы) |
|
|
|
|
|
|
|
|
|
|
ni |
22 |
30 |
22 |
16 |
28 |
13 |
17 |
20 |
17 |
15 |
При уровне значимости α = 0,05 проверить гипотезу о том, что время прибытия машин – случайная величина, имеющая равномерное распределение.
Построим гистограмму. Так как n = 200, h = 1, то высоты гистограммы таковы:
h1 = 20022 = 0,11; h2 = 20030 = 0,15; h3 = 0,11; h4 = 0,08; h5 = 0,14; h6 = 0,065; h7 = 0,085; h8 = 0,1; h9 = 0,085; h10 = 0,075.
Гистограмма приведена на рис. 6.4.
Если мы считаем, что время прибытия машин имеет равномерное распределение, мы должны определить два параметра (a и b) равномерного закона. Как известно, функция плотности вероятности f(х) равномерного закона такова:
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
, a x b |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
f (x) = (b − a) |
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
0, x (a, b) |
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
0,16 |
|
|
hi, f(x) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,14 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
0,12 |
|
|
|
|
|
________________________________________________________ |
|
||||||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||||||
0,1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,08 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,06 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,04 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,02 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
|
8 |
9 |
10 |
|
11 |
|
|
12 |
|
|
|
|
13 |
14 |
|
15 |
16 |
17 |
18 |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
Рис.6.4 |
|
|
|
|
|
|
|
|
|
|
|||||
При этом M (x) = |
|
a + b |
; D(x) = |
(b − a)2 |
; σ(x) |
= |
b |
− a |
. |
|
|
|
|
||||||||||||||
|
2 |
12 |
|
|
|
2 |
|
3 |
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Так что для определения а и b можно записать два уравнения: |
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
a + b |
= x; |
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
b |
− a |
|
= S, |
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
откуда a = x − S 3 ; b = x + S |
3 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Но мы поступим проще и разумнее. Наша выборка расположена на интервале (8,18), поэтому положим: a = 8, b = 18, f(x) = 0,1 (x (8,18)).
|
График |
функции |
плотности |
вероятности |
f(x) также |
показан на |
||||||||
рис.6.4.Все теоретические вероятности рi одинаковы и равны |
|
h |
= 0,1. |
|||||||||||
(b − a) |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||
Дальнейшие расчеты представлены в табл.6.8. |
Таблица 6.8 |
|||||||||||||
|
|
|
|
|
|
|
||||||||
|
[хi-1; xi) |
pi |
|
npi |
|
ni |
ni - npi |
|
|
(ni − npi )2 |
|
|||
|
|
|
|
|
npi |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
[8;9) |
0,1 |
|
20 |
|
22 |
2 |
|
0,2 |
|
|
|
||
|
[9;10) |
0,1 |
|
20 |
|
30 |
10 |
|
5 |
|
|
|
||
|
[10;11) |
0,1 |
|
20 |
|
22 |
2 |
|
0,2 |
|
|
|
||
|
[11;12) |
0,1 |
|
20 |
|
16 |
-4 |
|
0,8 |
|
|
|
[12,13) |
0,1 |
20 |
28 |
8 |
3,2 |
[13;14) |
0,1 |
20 |
13 |
-7 |
2,45 |
[14;15) |
0,1 |
20 |
17 |
-3 |
0,45 |
[15,16) |
0,1 |
20 |
20 |
0 |
0 |
[16;17) |
0,1 |
20 |
17 |
-3 |
0,45 |
[17;18) |
0,1 |
20 |
15 |
-5 |
1,25 |
– |
∑pi = l |
∑npi = 200 |
∑ni = 200 |
– |
χ2эксп = 14 |
Итак, χ2эксп = 14. Найдем χ2кр. Мы не определяли по выборке параметров закона - время работы бензоколонки задано заранее. Поэтому
число степеней свободы r = 10 - 1 = 9. Тогда χ2кр = 16,9 > χ2эксп. Выдвинутую гипотезу можно принять.
6.3.3. Проверка гипотезы о биномиальном законе распределения
Семь монет подбрасывались 1536 раз. Каждый раз отмечалось число Х выпавших гербов (табл. 6.9).
|
|
|
|
|
|
|
|
Таблица 6.9 |
||
xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
|
7 |
|
ni |
12 |
78 |
270 |
456 |
386 |
252 |
69 |
|
13 |
|
При уровне значимости α = 0,05 проверить гипотезу о том, что монеты правильные.
Если все монеты правильные, то вероятность выпадения герба для каждой из них равна р = 0,5. Тогда случайная величина Х – число выпавших гербов при бросании семи монет – имеет биномиальное распределение с параметрами n = 7 и р = 0,5. Биномиальное распределение дискретно, поэтому нужно вычислить теоретические вероятности рi каждого из 8 возможных значений случайной величины X. Эти
вероятности считают по формуле Бернулли: |
|
|
|
|
||||
p(X = 0) = C70p0q7 |
= 0,57 = 0,0078; |
p(X = 1) = C71p1q6 |
= |
7*0,57 = 0,055; |
||||
p(X = 2) = C72p2q5 |
= 21*0,57 |
= 0,164; p(X = 3) |
= C73p3q4 |
= |
35*0,57 |
= 0,273; |
||
p(X = 4) = C74p4q3 |
= |
35*0,57 |
= 0,273; p(X = 5) |
= C75p5q2 |
= |
21*0,57 |
= 0,164; |
|
p(X = 6) = C76p6q1 |
= |
7*0,57 = 0,055; |
p(X = 7) |
= C77p7q0 |
= |
0,57 = 0,0078. |
Теперь можно вычислить математические ожидания чисел появлений каждого из значений случайной величины Х при 1536 бросаниях семи монет, сравнить их с экспериментальными данными и вычислить χ2эксп. Результаты сведены в табл. 6.10.
|
|
|
|
|
|
|
Таблица 6.10 |
||
|
хi |
pi |
npi |
ni |
ni - npi |
|
(ni − npi )2 |
|
|
|
|
npi |
|
||||||
|
|
|
|
|
|
|
|
||
0 |
0,0078 |
12 |
12 |
0 |
0 |
|
|
|
1 |
0,055 |
84 |
78 |
-6 |
0,43 |
|
2 |
0,164 |
252 |
270 |
18 |
1,29 |
|
3 |
0,273 |
420 |
456 |
36 |
3,09 |
|
4 |
0,273 |
420 |
386 |
-34 |
2,75 |
|
5 |
0,164 |
252 |
252 |
0 |
0 |
|
6 |
0,055 |
84 |
69 |
-15 |
2,68 |
|
7 |
0,0078 |
12 |
13 |
1 |
0,08 |
|
– |
∑pi = l |
∑npi = 1536 |
∑ni = 1536 |
– |
χ2эксп = 10,32 |
|
|
|
|
|
|
|
Найдем χ2кр. В случае дискретной случайной величины при подсчете r вместо числа интервалов берут число различных значений хi. В нашем случае r = 8 - 1 = 7, так как ни одного параметра по выборке мы не находим. Тогда χ2кр = 14,l > χ2эксп = 10,32. Нет оснований опровергнуть гипотезу о правильности монет.
6.3.4. Проверка гипотезы о законе распределения Пуассона
В таблице приведены числа ni участков равной площади (0,25 км2) южной части Лондона, на каждый из которых приходилось по хi попаданий самолетов-снарядов во время второй мировой войны
(табл. 6.11).
|
|
|
|
|
|
Таблица 6.11 |
|
хi |
0 |
1 |
2 |
3 |
4 |
5 и больше |
|
ni |
229 |
211 |
93 |
35 |
7 |
1 |
|
Всего n = 576 участков. При уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – число самолетов-снарядов, попавших на участок, имеет распределение Пуассона.
Вероятность того, что случайная величина X, имеющая распределение Пуассона, примет значение i, равна
p(X = i) = λi e−λ, i!
где λ > 0 - параметр закона, i = 0,1,2, ….
Оценим значение параметра λ по выборке. Так как М(Х) = λ, то
положим λ = x , x = 5761 (0 229 +1 211 + 2 93 + 3 35 + 4 7 + 5 1) = 0,93 .
Положим λ = 0,93. Теперь можно найти вероятности рi = р(Х = i),
i = 0,1,2,3,4,5. |
λ0 |
|
|
|
λ1 e−λ = 0,367 ; |
|
p0 = p(X = 0) = |
e−λ = 0,395; |
p1 |
= p(X =1) = |
|||
|
0! |
|
|
|
1! |
|
p2 = p(X = 2) = |
λ2 |
e−λ = 0,170 ; |
p3 |
= p(X =3) = |
λ3 |
e−λ = 0,053; |
|
2! |
|
|
|
3! |
|
p4 = p(X = 4) = 0,012 ; p5 = p(X ≥5) =1 − po − p1 − p2 − p3 − p4 = 0,003.
Остальные вычисления сведены в табл. 6.12.
|
|
|
|
|
|
Таблица 6.12 |
||
i |
pi |
npi |
|
ni |
ni - npi |
|
(ni − npi )2 |
|
|
|
npi |
||||||
|
|
|
|
|
|
|
||
0 |
0,395 |
227,5 |
|
229 |
1,5 |
0,01 |
|
|
1 |
0,367 |
211,4 |
|
211 |
-0,4 |
0,001 |
|
|
2 |
0,170 |
97,9 |
|
93 |
-4,9 |
0,25 |
|
|
3 |
0,053 |
30,5 |
|
35 |
4,5 |
0,66 |
|
|
4 |
0,012 |
6,9 |
7 |
-0,6 |
0,04 |
|
||
|
|
|
|
|
||||
≥5 |
0,003 |
|
||||||
|
|
1,7 |
1 |
|
|
|
|
|
– |
∑pi = 1 |
∑npi = 576 |
∑ni = 576 |
– |
χ2эксп = 0,96 |
Два последних значения n4 и n5, nр4 и nр5 объединены, чтобы обеспечить выполнение условия nрi ≥ 5. Таким образом, осталось 5 разных значений случайной величины: 0, 1, 2, 3 и все, что больше или равно 4. Число степеней свободы равно r = 5 - 1 - 1 = 3, так как по выборке было определено значение параметра λ. Тогда χ2кр = 7,8 > χ2эксп = 0,96. И в этом случае можно считать справедливой выдвинутую гипотезу.
6.3.5. Последний пример
Согласно закону Геллина, предложенному им в 1855 г., вероятности рождения двоен, троен и четверней есть соответственно р, р2, р3, где р – число, постоянное для данной группы населения. На основании приведенных ниже данных проверить, выполняется ли закон Геллина для многоплодных рождений среди японцев и белого населения США. В табл.6.13 через ν2, ν3, ν4 обозначены относительные частоты рождений двоен, троен и четверней соответственно за указанные периоды.
Таблица 6.13
Годы |
Население |
Число рождений |
ν2 |
ν3 |
ν4 |
|
Белые США |
|
0,01129 |
|
0,00000177 |
1922-1936 |
27939615 |
0,0001088 |
|||
1926-1931 |
Японцы |
1226106 |
0,00697 |
|
– |
0,0000473 |
Прежде всего оценим по нашим выборкам неизвестные значения р. Положим, что сумма частот ν2 + ν3 + ν4 равна сумме
p + p 2 + p3 = |
p(1 − p3 ) |
≈ |
p |
, так как ясно, что р – очень маленькое |
|
1 − p |
1 − p |
||||
|
|
|
число. Для белого населения США имеем:
p = 0,01129 + 0,0001088 + 0,00000177 = 0,01140057 ≈ 0,0114 ; 1 − p
p =1 +0,01140,0114 ≈ 0,0113; p2 ≈ 0,000128; p3 ≈ 0,000001.
Теперь можно воспользоваться критерием χ2. Нужно определить, извлечена ли выборка из генеральной совокупности X, имеющей такой закон распределения (табл. 6.14).
Таблица 6.14
xi |
1 |
2 |
3 |
4 |
pi |
1- p - p2 - p3 |
p |
p2 |
p3 |
Здесь р = 0,0113.
Все вычисления сведем в табл. 6.15. Частоты n1, n2, n3, n4 равны соответственно:
n1 = nν1 = 27939615* (1 - ν2 - ν3 - ν4) = 27621087,5;
n2 = nν2 = 27939615*0,01129 = 315438,25; n3 = nν3 = 3039,8; n4 = nν4 = =49,45.
|
|
|
|
|
|
Таблица 6.15 |
||
|
xi |
pi |
npi |
ni |
ni – npi |
|
(ni − npi )2 |
|
|
|
npi |
||||||
|
|
|
|
|
|
|
||
1 |
0,988571 |
27620293 |
27621088 |
795 |
0,02 |
|
||
|
2 |
0,0113 |
315717 |
315438 |
-279 |
0,25 |
|
|
3 |
0,000128 |
3576 |
3040 |
-536 |
80,34 |
|
||
4 |
0,000001 |
28 |
49 |
– |
15,75 |
|
||
|
– |
∑pi = l |
∑npi = 27939615 |
∑ni = 27939615 |
– |
χ2эксп = 96,4 |
Число степеней свободы r равно r = 4 - 1 - 1 = 2, χ2кр = 6,0 << χ2эксп. Расхождение велико, предложенный закон должен быть отвергнут.
Проделаем те же вычисления в случае с японцами.
ν2 + ν3 + ν4 ≈ 0,00702.
|
|
Тогда p = |
|
|
0,0070 |
|
≈ 0,00697 ; р2 |
= 0,0000486; р3 = 0,00000034; |
||||||||
|
|
1 |
+ 0,0070 |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
n1 = nν1 = 1226106*(1 - ν2 - ν3 - ν4) = 1217502; n2 = nν2 = 8545,96; |
||||||||||||||
|
|
n3 = nν3 = 57,99; n4 = nν4 = 0. |
|
|
|
|
|
|
||||||||
|
|
Найдем χ2эксп (табл. 6.16). |
|
|
Таблица 6.16 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
xi |
|
pi |
|
|
|
|
|
npi |
|
ni |
ni -npi |
|
|
(ni − npi )2 |
|
|
|
|
|
|
|
|
|
|
|
npi |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
0,993 |
|
|
|
|
|
|
1217502 |
|
|
0 |
|
|||
1 |
|
|
|
|
|
1217502 |
|
0 |
|
|
||||||
|
2 |
|
0,007 |
|
|
|
|
|
8544 |
|
9545,96 |
1,96 |
|
0 |
|
|
|
3 |
|
0,0000486 |
|
|
59,54 |
|
57,99 |
-1,96 |
|
0,06 |
|
||||
|
|
|
|
|
|
|
||||||||||
|
4 |
|
0,00000034 |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
0,41 |
|
0 |
|
|
|
|
|