Вариационная статистика
.pdfсоответствуют различные тела, расположенные в кубе. Вероятность вычJiс ляют как отношение объемов тел к объему куба.
Наибольший интерес представляет к л а с с и ч е с к о е о п р е д е л е н " е
в ер о я т н о с т и. С этим определением связаны основные теоремы теор11н
вероятностей, рассматриваемые ниже.
Вероятность здесь определяется априори, до испытаний, исходя из опре деленной структуры случайных событий, т. е. нз разбивки на равновозмож
ные исходы.
П р и м ер. Пусть при подбрасывании монеты появления герба или цифры будут изучаемыми событиями а и Ь. Причем, если при одном бросании про изойдет событие а, то не произойдет другого события Ь. Такие собь1тия назы вают н е с о в м е с т н ы м и. Каждое из событий называют 11 сход о м и с - п ы т а н и я. В силу равновозможности исходов в нашем испытании вероят
ность каждого события равна 1/2. При единичном бросании кубика с 6 гра
нями (имеющими, например, 1, 2, 3, 4, 5, 6 очков), вероятность появленвн любой одной грани р= 1/ 6•
Исходы испытания являются простейшими случайными событиями. Можно
рассматривать более сложные события, объединяющие неско.%ко исходов. Например, при бросании шрального кубика мы можем интересоваться таким событием, как выпадение числа очков больше 2. В таком случае говорят, что появлению события с выпадением больше двух очков, т. е. с 3, 4, 5 и 6 оч каr.ш, благоприятствуют четыре исхода из шести. Вероятность этого события
р=4/6. Таким образ·ом, мы подошли к классическому определению вероятности. В ер о я т н о с т ь ю с луч а й н о г о с о б ы т и я называется отношение
числа иатходов, благоприятствующих событию, к числу всех возможных
исходов.
§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕП
Если некоторое событие может произойти при n испытаниях и а - чис:ю исходов, которые благоприятствуют наступлению события, а Ь- не благопр11ятствуют, то вероятность того, что событие произойдет, может быть опреде
лена как p=a/n (II.2). Вероятность того, что событие не произойдет, будет
q=b/n (II.3).
Следует отметить, что слова «благоприятное» в «неблагоприятное» нспо.lь зуются в условном смысле. Подобно этому можно было бы сказать, что груп
па а содержит случаи, обладающие определенным признаком, а группа Ь
не обладающие. Сумма благоприятствующих и неблагоприятствующих случа~в
равна числу всех случаев, т. е. |
а+Ь =n. Разделив |
все члены этого равенства |
||||
на |
n получим: a!n+bfn= 1 или |
p+q= 1 (II.4), |
т. е. |
сумма вероятностей |
двух |
|
весовместных событий равна единице. |
|
|
|
|
||
|
Сложение вероятностей. Если в урне с 10 шарами 6 шаров черных, 3 белых |
|||||
и |
1 зеленый, вероятности этих |
событий будут |
равны, |
соответственно, |
6 / 10• |
|
3/ro и 1/ro. |
|
|
|
|
|
|
|
!(акова вероятность вынуть белый или зеленый шар? |
|
|
|||
|
Благоприятствует появлению белого шара |
3/1о |
всех |
исходов, а зеленого |
шара- 1/ro исходов. Появлению либо белого, :шбо зеленого шара соответ ствует р= 3/10+1/10 =4/10=0,25, т. е. вероятность суммы двух несовместных (взаимоисключающих случайных) событий равна сумме нх вероятностей.
Умножение вероятностей. Два события называются независимыми, когда
наступление одного не оказывает влияния на наступление другого. Так, резуль
тат одного метания кости не влияет на результат следующего метания.
Вероятность сложного события (т. е. наступления двух событий незави-
симых одно от другого) равна произведению вероятностей
о т д е л ь н ы х с о б ы т и й.
Например, вероятность выпадения очка, а затем двух очков, при двух
последовательных бросаниях кубиков, равна p= 1/sX 1/s= 1/з6·
Вычисление вероятностей. Часто возникает необходимость одновременно
складывать и умножать вероятности. Например, требуется определить вероят-
12
ность выпадения 5 очков при одновременном бросании 2 кубиков. |
Искомая |
||||||||||||||
сумма |
вероятностей может |
получиться |
как |
результат |
одной |
из |
следующих |
||||||||
4 ко~1бинаций исходов: |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
кубик а. |
|
|
|
|
. 1, |
2, |
3, |
4; |
|
|
|
|
|
|
|
|
ь. |
|
|
|
|
. 4, 3, 2, 1 |
|
|
|
|||
Вероятность |
получения |
одного |
очка |
на |
кубике |
а |
равна |
1/ 6 |
и |
получения |
|||||
четырех очков на кубике Ь- также |
1 |
Вероятность |
получения |
комбинации |
|||||||||||
/6. |
|||||||||||||||
этих |
очков |
равна 1/ 36• |
Аналогично |
и |
вероятность |
трех |
других |
комбинаций |
|||||||
равна |
1/ 36• |
Но |
Jtюбой |
из |
этих |
четырех |
результатов, |
дающий |
в сумме |
5 очков, будет считаться благоприятным исходом. Отсюда вероятность иско
мого исхода
р = 1/36 + 1/36 + 1/36 + lj36 = lj9.
Более общая форма вопроса о вероятности события является такой: како ва вероятность получения не менее, например, 8 очков при бросании 2 костей? Число очков, равное н более 8, рассматривается как блаГоприятный исход.
Рассчитаем вероятность каждого благоприятного результата:
Вероятность |
появления |
12 очков |
1/з6 |
-»- |
-»- |
11 -»- |
2/зб * |
-»- |
-»- |
10 -»- |
8/з6 |
-»- |
-»- |
9 -»- |
|
-»- |
-»- |
8 - » - |
|
Сумма |
вероятностей |
15f36 |
Вероятность выпадения по меньшей мере 8 очков при бросании 2 костей |
||
равна |
15 /36 или 5/12· |
|
§ 4. БИНОМИАЛЬНОЕ РАЗЛОЖЕНИЕ И ИЗМЕРЕНИЕ
ВЕРОЯТНОСТЕП
Изложенные примеры исчисления вероятностей можно обобщить ·на основе
с.1едующей н11же илтострации вывода.
Если по~брасьшаются одновременно 2 монеты (а, Ь), то существуют 4 воз ~южных случая выпадения герба Т и цифры Н:
аЬ |
аЬ |
аЬ |
аЬ |
тт |
тн |
нт |
нн |
В первом исходе имеем 2 герба. Принимая это за 2 бшiгопрнятных исхода,
получим вероятность каждого из них р, а сложного события (ТТ) рХр=р2•
В данном случае, при р= 1/2 р2 = 1/4.
Четвертый из возможных исходов НН представ.1яет 2 неблагаприятных исхода с вероятностью qXq=q2 = 1/ 4 •
Каждый из двух других исходов является комбинацией одного благо
nриятного и одного неблагоприятного случаев.
Вероятность каждого из этих исходов равна 1/4 = pq= 1/2Х 1/2, а обоих вме сте ТН и НТ равна их сумме, т. е. 2pq= 1/ 2•
Обобщенным выражением процесса получения вероятностей различных
сочетаний независимых событий, когда вероятности их известны, являются пос.1едовательные члены разложения бинома.
Д.1я рассматриваемого примера из двух событий имеем
(р + q)2 = р2 + 2pq + q~.
Прп р= 1/2 получим (1/2+ 1/2)2= 1/4+ 1/2+ 1/4.
* Так как возможно получить 6 очков на кости а и 5 - на Ь, или 5 очков
на кости а и 6 на кости Ь.
13
Если 3 монеты а, Ь, с подбрасываются одновременно, получим 8 возмож~
ных комбинаций: |
|
|
|
|
|
|
|
|
аЬс |
аЬс |
аЬс |
аЬс |
аЬс |
аЬс |
аЬс |
аЬс |
|
ттт |
ттн |
тнн |
тнт нтт нтн ннт ннн |
|
||||
Вероятность выпадения 3 -гербов составит 1/s, |
2 гербов |
(в сочетании с |
од |
|||||
ним случаем |
цифры) |
равна 3/s, |
одного |
герба и 2 |
цифр- 3/s, |
ни одного |
гер |
ба- 1/ 8 • При 3 независимых событиях степень бинома равна 3.
Вероятности отдельных возможных исходов даются последовательными
членами раз.JJоження
(р + q)З = рз + 3p2q + 3pq2 + qз.
При p=q= 1/ 2 имеем (1/2 + 1/2)3 = 1/8 + 3(8 + 3/8 + 1/8,
т. е. то же, что и непосредственным подсчетом.
Если число независимых случайных событий n, то вероятность n, n-1, n-2 и т. д. благоприятных исходов равна последовательным членам раз.1о
жения
(!1.5)
Если желаем получить вероятные численности разных исходов при дан
ном числе испытаний N, применяем выражение
|
|
|
|
|
|
|
|
|
|
|
|
|
(!1.6) |
|
Например, при числе испытаю;й |
|
N =200 и двух независимых |
событиях n |
|||||||||
в |
каждом |
испытании |
вероятные |
численности |
бу~дут |
равны |
200(p+q) 2 = |
||||||
=200(p2+2pq+q |
2 |
). Если |
|
1 |
имеем |
последовательные вероятные чис |
|||||||
|
p=q= f2, |
||||||||||||
ленности: |
50+ 100+50. |
|
200 |
|
(N =200) выпадения герба следует |
||||||||
|
При |
подбрасывании |
монеты |
раз |
|||||||||
ожидать |
в |
50 случаях, |
герба |
или |
цифры - в |
100 |
случаях |
и цифры - |
|||||
50 |
случаях. |
|
|
|
|
|
|
|
|
|
|
|
|
|
При тех же р и N, но n=3 получим последовате.%ные вероятные числен |
ности: 25+75+75+25, которые означают 3, 2, 1 наступление события и нена ступление его, причем сумма всех численностей равна N.
При 200 бросаниях трех монет ожидаем в 25 случаях выпадения 3 гербов (ТТТ), в 75 случаях выпадения 2 гербов и одной цифры (ТТН), в 75 слу чаях выпадения 2 цифр и одного герба (ННТ) и в 25 случаях - 3 цифр.
Итак, когда вероятности независимых событий известны априори, то
можно определить вероятные численности любого данного числа n, n-1, n-2 ,... наступления события и ненаступления его. При этом неважно, равны
или не равны р и q, лишь бы они оставались при испытаниях постоянными.
Этот факт имее:г большое значение в теории статистики и используется ниже.
При изучении природных явлений выделение элементарных событий и во
обще расчленения причинного процесса, в результате которого происходят случайные события, обычно невозможно. Классический подход к определению
вероятности здесь бессилен. Проблему определения вероятностей таких собы
тий решают на основе статистическог.о подхода.
Однако классический подход к определению вероятностей событий лежит
в основе теории анализа случайных событий и теоретических (модельных)
распределений исходов испытаний. В свою очередь теория математического
анализа случайных событий и модели распределений исходов испытаний явля
ются базой статистических методов, в частности, базой статистических заклю
чений.
Основы теории статистических заключений рассмотрены в главе V. Основ
ные модели распределения логично рассмотреть уже здесь.
В основе теории статистических заключений лежат 3 основных модели
теоретических распределений: биномиального, нормального и редких
событий.
14
§5.БИНОМИАЛЬНОЕРАСПРЕДЕЛЕНИЕ
Альтернативные, дискретно варьирующие признаки, как было показано в предыдущем параграфе, распределяются так, что вероятные численности
их появления могут быть найдены по формуле бинома Ньютона:
|
|
'n(n - 1) |
pn-2q2 + |
|
|||
N(p + q)n = N ( pn + npn-lq + |
1 |
• |
2 |
|
|||
|
|
|
|
|
|
||
+ |
n (п- 1) (n- 2) |
рn-Зqз +·.. + qn |
) |
|
|||
1.2 .3 |
, |
(11.7) |
где n -число независимых исходов в одном испытании; р- вероятность баз
гоnриятного исхода одного случая; q -вероятность неблагоriриятного исхода;
N- общее число испытаний (исходов).
При n=6 возможны 26 =64 исходов. При |
равной |
вероятности альтерна |
||
тив, т. е. при условии p=q=0,5, получим следующий |
ряд вероятных |
числен |
||
!IОстей: |
|
|
|
|
64 (0,5 + 0,5)6 = 64 [1/64 +6j64 + 15/64 + 20/64 + 15/64 + 6/64 + 1/64] = |
||||
= 1 |
+ 6 + 15 + 20 + 15 |
+ 6 + 1. |
|
|
Откладывая значения |
числа наступления |
благоприятных исходов т по |
||
оси абсцисс, а значения вероятных численностей -по |
оси ординат, |
получим |
многоугольник численностей распределения (рис. 2). Ломаная линия, соединяющая точки на графике, на
зывается |
крив ой |
р а сп ре д е л е |
п |
||||
н и я. |
|
|
|
|
|
||
|
|
|
|
|
20 |
||
Найденные по |
формуле бинома чис |
||||||
|
|||||||
.1енности пли биномиальные коэффици |
15 |
||||||
енты |
(при |
p=q=0,5) |
можно. получить |
||||
также при помощи треугольника Паска |
|
||||||
.1я (табл. 1). Числовые |
значения |
коэф |
10 |
||||
фициентов построены так, что любой из |
|
||||||
них |
получается |
суммированием |
двух |
5 |
|||
стоящих над ним |
строкой выше |
значе |
|||||
|
ний, справа и слева. |
. |
Значения коэффициентов, начина11
сединицы, закономерно возрастают >IO
определенного уровня, а заrем в той же последовательности уменьшаются. Кри-
вые, изображающие биномиальные рас-
т
о 1 2 J " 5 5
Рис. 2. Биномиальное распределевне вероятных чис-
ленностей
nределения с p=q=0,5, симметрич-
ны. При любой степени бинома n число коэффициентов равно п+1. например
при n= 1 оно равно 2 и т. |
д. |
Сумма |
биномиальных |
коэффициентов |
равна 2n, |
||||||||||||
как в нашем примере, n=6; N=26=64. |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
1. |
Треугольник |
Паскаля |
|
|
|
|||||||||
n |
|
|
Биномиальные коэффициенты |
|
|
|
|
||||||||||
о |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
2 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
4 |
3 |
|
|
|
|
|
|
|
3 |
|
3 |
|
|
|
|
|
8 |
|
4 |
|
|
|
|
|
|
4 |
|
6 |
|
4 |
|
1 |
|
|
|
16 |
5 |
|
|
|
|
|
5 |
10 |
|
10 |
|
5 |
1 |
|
|
|
32 |
|
б |
|
|
|
7 |
6 |
15 |
20 |
|
15 |
|
6 |
|
|
|
64 |
||
7 |
1 |
1 |
8 |
|
21 |
35 |
35 |
21 |
7 |
8 |
|
|
128 |
||||
8 |
|
28 |
56 |
70 |
56 |
28 |
|
|
256 |
||||||||
9 |
1 |
9 |
36 |
|
84 |
126 |
126 |
84 |
36 |
|
9 |
1 |
512 |
||||
10 |
10 |
45 |
120 210 |
252 210 |
120 |
45 |
|
10 |
1024 |
15
Если р н q не равны, распределение будет асимметрично, причем те~
в большей степени, чем меньше n. При большом n, например 30 И' бо.1ее, онф
симметрично н мало ступенчато. Характер распределения остается тем же,
независимо от того, выражено оно в значениях вероятности (т. е. по форму.1е
.1!.8) илн в значениях частоты т ожидаемого события.
Для вычисления вероятностей у события (ПО!!Виться т раз в n независи
мых испыташrй) наряду с формулой бинома применяют также формулу Якоба
Бернуллн:
у= С'; pm qn-m = [n!fт! (п- т)!] pmqn-m. |
(1!.8) |
Здесь С~'- число сочетаний из n элементов по т, и.1и биномиальный
коэффициент; р- вероятность ожидаемого события (благоприятного исхода);
q= 1-р- вероятность ·противоположного |
события; |
т- частота |
появления |
|||||||||||||||
ожидаемого события; n - число испытаний; n! и т! -факториалы, |
т. е. |
|||||||||||||||||
1·2·3 · ... · n н 1·2·3 · ... ·т. |
|
|
|
|
т= 1, |
2, 3, |
..., n |
|
|
|
· |
|
||||||
|
Совокупность |
вероятностей |
при |
называется б и н о м и |
||||||||||||||
а л ь н ы м р а сп р е д е л е н и е м в е р о я т н о с т ей. |
|
|
|
|
|
|||||||||||||
|
Так, для предыдущего примера, при p=q=0,5, n=6 и т=О, 1, 2, ..., 6 |
|||||||||||||||||
вероятностн будут: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
1·2·3·4·5·6 |
|
|
|
|
|
|
|
|||||||
|
m=O у=---:-:(1_)..,..,(6,-·"'"5-:·4-:·3".--·"""2-:·1,.,....) ·0,50·0,5U= 1/64*; |
|
|
|
||||||||||||||
|
m= 1 |
у= |
1·2·3·4·5·6 |
|
|
|
|
|
|
|
||||||||
|
(1) (5·4·3·2·1) |
·0,51·0,55 = |
6/64; |
|
|
|
||||||||||||
|
т= 2 |
у= |
1·2·3·4·5·6 |
.о,5~-о.51 = |
15;64: |
|
|
|
||||||||||
|
< · |
2 |
>< . |
3 |
. |
2 |
. ) |
|
|
|
||||||||
|
|
|
|
1 |
|
4 |
|
1 |
|
|
|
|
|
|
|
|||
при |
nz=З, 4, 5, |
6 вероятности |
|
соответственно |
будут |
равны |
20/&4; |
15/s•: |
6/s4: |
|||||||||
1/ 64 , |
т. е. такие, |
какие |
получены |
по |
|
формуле |
бинома |
(см. в |
этой |
формуле |
||||||||
взятое в квадратные скобки). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
Биномиальное распределение |
определяется |
двумя |
параметрами: средней |
..:~е:rичиной !l=np (11.9) и дисперсией cr2=npq (11.10) или квадратическим
отклонением а= i npq (II |
11). |
|
|
Для рассматриваемого |
примера имеем среднюю частоту ожидаемого слу |
||
. чайного событня fJ-=np=6·0,5=3 и дисперсию а2 = npq = 6·0,5·0,5 = 1,5. |
|||
|
§б. НОРМАЛЬНОЕРАСПРЕДЕЛЕНИЕ |
||
Показаивый |
на рис. 2 многоугольник |
имеет 6 сторон** ( при 6 независи |
|
мых событнях). |
Если число событий и |
соответственно чнсло сторон возра |
стает, график, представляющий разложение бинома (p+q) n, все более при б.lнжается к плавной кривой. Это приближение имеет место для p=q и pc:/=q.
В последнем случае скошенность кривой при возрастании n уменьшается. При
прнближешш n к бесконечности график кривой приближается к симметричной
J{рнвой. Пределом такого приближения биномиального распределения является
нормальное распределение, выраженное формулой 11.12 и графически изобр_а
женное на рис. 3***).
*0!=1.
**Не считая основания.
***В случае редких собьiтий, когда р nриближается к нулю, а. n к бес
конечности (npconst), nредельное распределение не является нормальным,
а представ.1яет тин, называемый расnределеннем Пуассона.
16
X<I1-3CJ (или 't<-3) и для Х>11+3а (или 't>3) ординаты уже неэначk
тельно отличаются от нуля. Это означает, что наиболее вероятны те зна'fе
ния Х, которые близки к 11· По мере ~даления от 11 значения Х становятся все
менее вероятными. Причем одинаковые по абсолютному значению, но проти воположные по знаку· отклонения значений переменной Х от 11 равновероятиы.
Вточках 11-а и tx+cr кривая нормального распределения вю1 кривая
плотности нормального распределения вероятностей имеет перегибы. '
При определении ординат для какого-либо конкретного частного распре
деления ординаты, полученные по формуле (11.13) или по табл. 6 прил., умно жают на N/s, где N- общий объем численностей, s - выборочное квадратиче
ское отклонение в единицах измерения распределенной величины Х. Техника
вычисления ординат для экспериментальных распределений приведена в гла
ве VIII.
При изучении распределений как теоретической базы статистических заключений наибольший интерес представляет площадь под нормальной кри
вой. Эту площадь можно представить как интеграл от функции (11.13). Если интегрирование провести от начала координат, т. е. от нуля до любого зна
чения 't, получим значение площади, заключенной между Уо и значением у, соответствующим избранному 't. Математически функция площади от норми
рованного отклонения (обозначим ее F('t) при указанных пределах имеет
выражение:
F(-c) = (1/У~)'s е- ~dx. |
(11.14) |
о |
|
В прил. 5 приведена четырехзначная таблица площади под нормальноii кривой в долях единицы, за которую принята вся площадь под кривой.
Пользование таблицей рассмотрим на примере данных табл. 3. Для этих
данных средняя арифметическая оказалась равной 30,1 см, среднее квадрати
ческое отклонение 6,11 см (см. гл. V, §§ 3 и 4). При данном рассмотрении
мы можем nРинять, что в совокупности, из которой была получена выборка,.
J1=30 СМ И CJ=6 СМ.
При таком предположении и нормальном распределении. в совокупности,
выражаемом формулой 11.13, можно определить вероятности встретить деревья
любых размеров, т. е. получить сумму вероятностей по (11.14) или
табл. 5 прил.
Пр и м е р. Найдем теоретическую относительную численность, т. е. веро
ятность деревьев, имеющих диаметр от 12 до 22 см. Стандартизованные
отклонения двух указанных значений Х будут: 1: 1 = |
(Х1 - |
fL)fa = |
( 1230)/6- |
|||||||||
=- 3, |
1:2 = (2230)/6 = - 1,33. . |
|
|
|
|
|
|
|
||||
По табл. 5 прил. |
F(-3) =0,4986, |
F(-1,33) =0,4080. |
Отметим, |
|
что |
знак т |
||||||
не имеет значения. |
|
|
|
|
|
|
|
|
|
|
||
. Разность |
F('t1)-F(т2) =0,0904 |
означает |
вероятность |
встретить |
деревья |
|||||||
указанного интервала Х в общей совокупности, т. е. 9 деревьев из |
100. |
В нашей |
||||||||||
выборке из 94 деревьев (табл. |
9 н |
10) имеется |
11 |
деревьев |
в |
указанно)! |
||||||
интервале Х. |
|
|
|
|
|
|
|
|
|
|
|
|
Установим, пользуясь этим приемом и табл. 5 прнл., вероятности трех |
||||||||||||
важных событий в теории выборок: |
|
|
|
|
|
|
|
|
||||
а) |
нормальная |
случайная |
переменная |
примет |
значение |
в |
интерва.1е |
|||||
(J.t-CJ, 11+а); |
|
|
|
в интервале (J,t-20", J.t+2a); |
|
|||||||
б) |
переменпая |
примет значение |
|
|||||||||
в) |
она |
примет значение |
в |
интервале (J.t-30", ~.t+3a). |
Так как |
|||||||
нормальная совокупность характеризуется J.t=O и а= 1, значения |
нормирован |
ного отклонения 't будут: для а) -1, +1; для б) -2; +2 и для в) -3, +3.
По таблице находим F(+1)=0,3413, F(-1)=0,3413, откуда вероятность
события а, равная F(+I)+F(-·1), составит 0,6826.
F(+2)=0,4772, F(-2)=0,4772, вероятность события б равна 0,9544. F (+3) =0,4986, F(-3) =0,4986, вероятность события в равна 0,9972.
Эти результаты дают возможность утверждать, что в случае нормального
распределения N (О; 1) 68% наблюдаемых значений отклоняются от сред-
18
него значения l.t не более чем на величину квадратического отклонения cr, 95%- значений не выйдут из nределов ~.t±2cr и nрактически все значения уместятся в nределы ~.t±3cr. Вероятность отклонения ~а nределы 3cr равна 0,0026 ~ 0,003, т. е. такое событие настуnит только в среднем в 3 случаях из 1000 испытаний.
§ 7. РАСПРЕДЕЛЕНИЕ РЕДКИХ СОБЫТИй (ПУАССОНА)
Когда вероятности альтернатив неравны, т. е. p=/=q, биномиальное рас предедение асимметрично. При очень малой вероятности ожидаемого события, псчисляемой сотыми или тысячными долями единицы, по сравнению с веро ятностью q противоположного события расnределение вероятности или частоты
таких событий описывается формулой С. Пуассона.
Модель такого распределения получают на основе независимых испыта IШЙ nри nостоянной вероятности р настуnления некоторого случайного собы тпя Х, например, при возвратном случайном извлеченин шаров из урны.
Как известно из гл. II, вероятность того, что в n испытаниях случайное событие наступит равно т раз, определяется формулой (II.8), выражающей функцию распределения вероятностей для биномиального распределения.
Примем теперь дополнительные условия, а именно, что вероятность р наступления случайного события в единичном исnытании весьма мала, но число испытаний n весьма велико, n-+oo, а произведение пр (обозначим его Л)- чис.1о постоянное и не очень большое.
При таких доnолнительных условиях на основе формулы (II.8) получим
с.1едующее выражение д.1я распределения вероятностей случайной перемен
ной Х:
у=Ст |
р |
т |
п-т= n(n-1) ... (n-m+1) |
.-"-(1 |
-_л_)п-т, (II. 1S) |
11 |
q |
т! |
пт |
n |
где Л=пр; р=Л/n.
Так как числитель nервой дроби имеет т сомножителей, а в знаменателе стоит пm, каждый из сомножителей можно разделить на n. Получим:
(1 т-;; 1 ) ·
(1- 1-/n) есть 1,
=е-Л- При этих условиях у= (Лm/ml) е -л.
);: (1-+)n-m. (11.16)
а предел (1 _ ),fn)n-m =
(11. 17)
Выражение |
(11.17) |
называется |
функцией распределения' |
вероятностей |
|
в распределении |
Пуассона. Существуют таблицы |
этих вероятностей с вхо |
|||
дами по Л и т (см. табл. 11 прил.). |
|
|
n испытаниях, |
||
В этом выражении |
т- частота |
ожидаемого |
события в |
е=2,7183; параметр Л=пр равен математическому ожиданию или наивероят нейшей частоте события, т. е. ,..., а также дисперсии cr. Доказательство этого равенства здесь опускаем. Оно содержится во многих книгах по статистике.
Для практических расчетов, когда находят теоретические ординаты рас
пределения n, т. е. численности распределения случайного события Х, выра
жение (II.17) умножают на N- общее число наблюдений, вместо 1.t nрини мают экспериментальное среднее число наблюдаемых случаев. Формула для n будет:
(11.18)
Расnределение Пуассона с возрастанием средней Л приближается к бино
миальному. Распределение Пуассона оnисывает многие явления в технике
11 биологии. В техинке оно находит широкое применение nри контроле качества
продукции, для аппроксимации распределения дефектных изделий. В биологии оно применяется как модель распределения числа семян сорняков - примесей
в пробных навесках nри анализе семян, поврежденных вредителем. Оно оnи-
19
сывает также распределение чисденностп возобновления, когда размер э.J('
ментарвых учетных площадок очень мал илн условия заселения площадн
неблагоприятны, так что вероятность благоприятного исхода р мала.
В главе VIII модель распределения Пуассона прн~tенена для оценки рас
пределения численности семян сосны прн аэросеве.
Глава 111
ВАРИАЦИОННЫЕ РЯДЬI
§1.ТИПЫ ВАРЬИРОВАНИЯ
Получаемые в результате наблюдений значения наблюдае мого признака называют в а р и а н т а м и. Варианты в био.'Iо гических объектах обнаруживают разнообразие (или в_арьирова ние) изучаемого свойства. Например, они отличаются друг от
друга по размеру, массе, объему, состоянию. Это связано с Деit
ствием различных факторов, в том числе и со случайной ошиб
кой наблюдения.
В зависимости от характера изучаемого признака различают
варьирование непрерывное и прерывистое, или дискретное и ат
рибутивное. Непрерывное и дискретное варьирование присуще
количественным признакам, а атрибутивноекачественным.
При н е пр еры в н о м варьировании отдельные значения
признака выражают мерой протяженности, объема и т. д. От
дельные варианты могут иметь любое, но изменяющееся в опре деленных пределах значение меры. Толщина деревьев в древо
стое, например, от самого тонкого до самого толстого может
принимать самые различные значения меры протяженности.
Только в зависимости от цели исследования (измерения) выра
жают ее в классах толщины: в несколько сантиметров, в целых
сантиметрах, в десятых или сотых долях сантиметра.
При д и с к ре т н о м варьировании отдельные значения
признака выражают отвлеченными числами, чаще всего целыми
(например, число растений на учетной площадке, число семян
в навеске и т. д.).
При а три б у т и в н о м варьирован и и значения при
знака выражают определенной степенью окраски, консистенции, поврежденности или устойчивости, а также формой, видом
и т. д. Количественно признаки выражают в абсолютных числах,
долях единицы, процентах, баллах и т. д.
Частным случаем атрибутивного варьирования является
альтернативное, при котором значения признака рассматривают
в альтернативной форме, т. е. противопоставляя здоровые боль
ным, сильныеслабым, окрашенные-неокрашенным и т. д.
В альтернативной форме можно представить и количественные
признаки, противопоставляя, например, высокие индивиды низ
ким, тяжелыелегким. Однако при рассмотрении количествен
ных признаков в альтернативной форме получают менее содер жательную статистическую информацию.
20
§ 2. ГРУППИРОВКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИИ
Обработку первичных данных наблюдения, представляемых
обычно в виде списка, начинают с их группировки. Результаты наблюдений сводят в статистические таблицы. Таблицы быва
ют простые и сложные. Если материал группируют по двум
и более признакам получают сложные таблицы. В основу груп пировки должен быть положен признак (или ряд признаков),
правильно характеризующий изучаемое или определяющее свой
ство объекта и его изменение от группы к группе.
Глубокие теоретические положения о группировке статисти
ческого материала развиты В. И. Лениным в работе «Развитие
капитализма в России», на основе анализа статистического мате риала о величине арендуемой земли _разными по социальному
положению группами крестьян к началу ХХ в. В. И. Ленин пока
зал, что «экономическая статистика необходимо должна поло
жить в основание группировки размеры и типы хозяйства»*,
а не величину надела земли и не выводить по волостям и общи
нам «средних» цифр, которые часто оказываются фиктивными.
В лесоводстве вопросы групnировки материала бывают часто
\также сложными.
При изучении скорости роста древостоев, например, в преде
лах одного вида растительности приходится группировать мате
риал по условиям произрастания. Причем признак «условия» не является достаточно четким и определяемым однозначно. При
характеристике урожая лесана единице площади последнюю
подразделяют по заселяющим древесным породам, возрасту дре
востоев и т. д. Средние характеристики, получаемые для таких групп, более точны. В рамках образованных крупных групп ста
тистический материал в целях извлечения содержащейся в нем
информации располагают по величине изучаемого признака. При небольшом числе наблюдений (до 15-20) общие пред
ставления о распределении признака можно получить, разме
стив данные в порядке их возрастания или убывания. Получают ранжированный ряд. Для десяти значений измеренного признака
3, |
4, |
6, |
9, |
6, 6, 7, 5, 8, 6 ранжированным рядом будет: 3, 4, 5, |
||
6, |
6, |
6, |
6, |
7, |
8, |
9. |
При большом числе наблюдений ранжированный ряд не об ладает наглядностью. Значения признака в таком случае распо лагают в виде двойного ряда. В верхней строке или в 1-м столб це (если ряд записывают в вертикальном направлении) записы вают значения признака, во 2-й строке или во 2-м столбце
указывают число повторяющихся значений.
Для приведеиного примера из 1О наблюдений получим:
Значения признака Х . |
3 |
4 5 6 7 8 9 |
|
Повторяемость |
значений n |
|
4 |
* Ленин В. |
И. Полн. собр. соч. |
Изд. 5-е, т. 3, с. |
96. |
21