Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Вариационная статистика

.pdf
Скачиваний:
50
Добавлен:
11.03.2016
Размер:
6.2 Mб
Скачать

соответствуют различные тела, расположенные в кубе. Вероятность вычJiс­ ляют как отношение объемов тел к объему куба.

Наибольший интерес представляет к л а с с и ч е с к о е о п р е д е л е н " е

в ер о я т н о с т и. С этим определением связаны основные теоремы теор11н

вероятностей, рассматриваемые ниже.

Вероятность здесь определяется априори, до испытаний, исходя из опре­ деленной структуры случайных событий, т. е. нз разбивки на равновозмож­

ные исходы.

П р и м ер. Пусть при подбрасывании монеты появления герба или цифры будут изучаемыми событиями а и Ь. Причем, если при одном бросании про­ изойдет событие а, то не произойдет другого события Ь. Такие собь1тия назы­ вают н е с о в м е с т н ы м и. Каждое из событий называют 11 сход о м и с - п ы т а н и я. В силу равновозможности исходов в нашем испытании вероят­

ность каждого события равна 1/2. При единичном бросании кубика с 6 гра­

нями (имеющими, например, 1, 2, 3, 4, 5, 6 очков), вероятность появленвн любой одной грани р= 1/ 6•

Исходы испытания являются простейшими случайными событиями. Можно

рассматривать более сложные события, объединяющие неско.%ко исходов. Например, при бросании шрального кубика мы можем интересоваться таким событием, как выпадение числа очков больше 2. В таком случае говорят, что появлению события с выпадением больше двух очков, т. е. с 3, 4, 5 и 6 оч­ каr.ш, благоприятствуют четыре исхода из шести. Вероятность этого события

р=4/6. Таким образ·ом, мы подошли к классическому определению вероятности. В ер о я т н о с т ь ю с луч а й н о г о с о б ы т и я называется отношение

числа иатходов, благоприятствующих событию, к числу всех возможных

исходов.

§ 3. ОСНОВНЫЕ ТЕОРЕМЫ ТЕОРИИ ВЕРОЯТНОСТЕП

Если некоторое событие может произойти при n испытаниях и а - чис:ю исходов, которые благоприятствуют наступлению события, а Ь- не благопр11ятствуют, то вероятность того, что событие произойдет, может быть опреде­

лена как p=a/n (II.2). Вероятность того, что событие не произойдет, будет

q=b/n (II.3).

Следует отметить, что слова «благоприятное» в «неблагоприятное» нспо.lь­ зуются в условном смысле. Подобно этому можно было бы сказать, что груп­

па а содержит случаи, обладающие определенным признаком, а группа Ь­

не обладающие. Сумма благоприятствующих и неблагоприятствующих случа~в

равна числу всех случаев, т. е.

а+Ь =n. Разделив

все члены этого равенства

на

n получим: a!n+bfn= 1 или

p+q= 1 (II.4),

т. е.

сумма вероятностей

двух

весовместных событий равна единице.

 

 

 

 

 

Сложение вероятностей. Если в урне с 10 шарами 6 шаров черных, 3 белых

и

1 зеленый, вероятности этих

событий будут

равны,

соответственно,

6 / 10•

3/ro и 1/ro.

 

 

 

 

 

 

!(акова вероятность вынуть белый или зеленый шар?

 

 

 

Благоприятствует появлению белого шара

3/1о

всех

исходов, а зеленого

шара- 1/ro исходов. Появлению либо белого, :шбо зеленого шара соответ­ ствует р= 3/10+1/10 =4/10=0,25, т. е. вероятность суммы двух несовместных (взаимоисключающих случайных) событий равна сумме нх вероятностей.

Умножение вероятностей. Два события называются независимыми, когда

наступление одного не оказывает влияния на наступление другого. Так, резуль­

тат одного метания кости не влияет на результат следующего метания.

Вероятность сложного события (т. е. наступления двух событий незави-

симых одно от другого) равна произведению вероятностей

о т д е л ь н ы х с о б ы т и й.

Например, вероятность выпадения очка, а затем двух очков, при двух

последовательных бросаниях кубиков, равна p= 1/sX 1/s= 1/з6·

Вычисление вероятностей. Часто возникает необходимость одновременно

складывать и умножать вероятности. Например, требуется определить вероят-

12

ность выпадения 5 очков при одновременном бросании 2 кубиков.

Искомая

сумма

вероятностей может

получиться

как

результат

одной

из

следующих

4 ко~1бинаций исходов:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

кубик а.

 

 

 

 

. 1,

2,

3,

4;

 

 

 

 

 

 

 

ь.

 

 

 

 

. 4, 3, 2, 1

 

 

 

Вероятность

получения

одного

очка

на

кубике

а

равна

1/ 6

и

получения

четырех очков на кубике Ь- также

1

Вероятность

получения

комбинации

/6.

этих

очков

равна 1/ 36•

Аналогично

и

вероятность

трех

других

комбинаций

равна

1/ 36•

Но

Jtюбой

из

этих

четырех

результатов,

дающий

в сумме

5 очков, будет считаться благоприятным исходом. Отсюда вероятность иско­

мого исхода

р = 1/36 + 1/36 + 1/36 + lj36 = lj9.

Более общая форма вопроса о вероятности события является такой: како­ ва вероятность получения не менее, например, 8 очков при бросании 2 костей? Число очков, равное н более 8, рассматривается как блаГоприятный исход.

Рассчитаем вероятность каждого благоприятного результата:

Вероятность

появления

12 очков

1/з6

-»-

-»-

11 -»-

2/зб *

-»-

-»-

10 -»-

8/з6

-»-

-»-

9 -»-

 

-»-

-»-

8 - » -

 

Сумма

вероятностей

15f36

Вероятность выпадения по меньшей мере 8 очков при бросании 2 костей

равна

15 /36 или 5/12·

 

§ 4. БИНОМИАЛЬНОЕ РАЗЛОЖЕНИЕ И ИЗМЕРЕНИЕ

ВЕРОЯТНОСТЕП

Изложенные примеры исчисления вероятностей можно обобщить ·на основе

с.1едующей н11же илтострации вывода.

Если по~брасьшаются одновременно 2 монеты (а, Ь), то существуют 4 воз­ ~южных случая выпадения герба Т и цифры Н:

аЬ

аЬ

аЬ

аЬ

тт

тн

нт

нн

В первом исходе имеем 2 герба. Принимая это за 2 бшiгопрнятных исхода,

получим вероятность каждого из них р, а сложного события (ТТ) рХр=р2

В данном случае, при р= 1/2 р2 = 1/4.

Четвертый из возможных исходов НН представ.1яет 2 неблагаприятных исхода с вероятностью qXq=q2 = 1/ 4 •

Каждый из двух других исходов является комбинацией одного благо­

nриятного и одного неблагоприятного случаев.

Вероятность каждого из этих исходов равна 1/4 = pq= 1/2Х 1/2, а обоих вме­ сте ТН и НТ равна их сумме, т. е. 2pq= 1/ 2•

Обобщенным выражением процесса получения вероятностей различных

сочетаний независимых событий, когда вероятности их известны, являются пос.1едовательные члены разложения бинома.

Д.1я рассматриваемого примера из двух событий имеем

+ q)2 = р2 + 2pq + q~.

Прп р= 1/2 получим (1/2+ 1/2)2= 1/4+ 1/2+ 1/4.

* Так как возможно получить 6 очков на кости а и 5 - на Ь, или 5 очков

на кости а и 6 на кости Ь.

13

Если 3 монеты а, Ь, с подбрасываются одновременно, получим 8 возмож~

ных комбинаций:

 

 

 

 

 

 

 

аЬс

аЬс

аЬс

аЬс

аЬс

аЬс

аЬс

аЬс

 

ттт

ттн

тнн

тнт нтт нтн ннт ннн

 

Вероятность выпадения 3 -гербов составит 1/s,

2 гербов

(в сочетании с

од­

ним случаем

цифры)

равна 3/s,

одного

герба и 2

цифр- 3/s,

ни одного

гер­

ба- 1/ 8 • При 3 независимых событиях степень бинома равна 3.

Вероятности отдельных возможных исходов даются последовательными

членами раз.JJоження

+ q)З = рз + 3p2q + 3pq2 + qз.

При p=q= 1/ 2 имеем (1/2 + 1/2)3 = 1/8 + 3(8 + 3/8 + 1/8,

т. е. то же, что и непосредственным подсчетом.

Если число независимых случайных событий n, то вероятность n, n-1, n-2 и т. д. благоприятных исходов равна последовательным членам раз.1о­

жения

(!1.5)

Если желаем получить вероятные численности разных исходов при дан­

ном числе испытаний N, применяем выражение

 

 

 

 

 

 

 

 

 

 

 

 

 

(!1.6)

 

Например, при числе испытаю;й

 

N =200 и двух независимых

событиях n

в

каждом

испытании

вероятные

численности

бу~дут

равны

200(p+q) 2 =

=200(p2+2pq+q

2

). Если

 

1

имеем

последовательные вероятные чис­

 

p=q= f2,

ленности:

50+ 100+50.

 

200

 

(N =200) выпадения герба следует

 

При

подбрасывании

монеты

раз

ожидать

в

50 случаях,

герба

или

цифры - в

100

случаях

и цифры -

50

случаях.

 

 

 

 

 

 

 

 

 

 

 

 

При тех же р и N, но n=3 получим последовате.%ные вероятные числен­

ности: 25+75+75+25, которые означают 3, 2, 1 наступление события и нена­ ступление его, причем сумма всех численностей равна N.

При 200 бросаниях трех монет ожидаем в 25 случаях выпадения 3 гербов (ТТТ), в 75 случаях выпадения 2 гербов и одной цифры (ТТН), в 75 слу­ чаях выпадения 2 цифр и одного герба (ННТ) и в 25 случаях - 3 цифр.

Итак, когда вероятности независимых событий известны априори, то

можно определить вероятные численности любого данного числа n, n-1, n-2 ,... наступления события и ненаступления его. При этом неважно, равны

или не равны р и q, лишь бы они оставались при испытаниях постоянными.

Этот факт имее:г большое значение в теории статистики и используется ниже.

При изучении природных явлений выделение элементарных событий и во­

обще расчленения причинного процесса, в результате которого происходят случайные события, обычно невозможно. Классический подход к определению

вероятности здесь бессилен. Проблему определения вероятностей таких собы­

тий решают на основе статистическог.о подхода.

Однако классический подход к определению вероятностей событий лежит

в основе теории анализа случайных событий и теоретических (модельных)

распределений исходов испытаний. В свою очередь теория математического

анализа случайных событий и модели распределений исходов испытаний явля­

ются базой статистических методов, в частности, базой статистических заклю­

чений.

Основы теории статистических заключений рассмотрены в главе V. Основ­

ные модели распределения логично рассмотреть уже здесь.

В основе теории статистических заключений лежат 3 основных модели

теоретических распределений: биномиального, нормального и редких

событий.

14

§5.БИНОМИАЛЬНОЕРАСПРЕДЕЛЕНИЕ

Альтернативные, дискретно варьирующие признаки, как было показано в предыдущем параграфе, распределяются так, что вероятные численности

их появления могут быть найдены по формуле бинома Ньютона:

 

 

'n(n - 1)

pn-2q2 +

 

N(p + q)n = N ( pn + npn-lq +

1

2

 

 

 

 

 

 

 

+

n (п- 1) (n- 2)

рn-Зqз +·.. + qn

)

 

1.2 .3

,

(11.7)

где n -число независимых исходов в одном испытании; р- вероятность баз­

гоnриятного исхода одного случая; q -вероятность неблагоriриятного исхода;

N- общее число испытаний (исходов).

При n=6 возможны 26 =64 исходов. При

равной

вероятности альтерна­

тив, т. е. при условии p=q=0,5, получим следующий

ряд вероятных

числен­

!IОстей:

 

 

 

 

64 (0,5 + 0,5)6 = 64 [1/64 +6j64 + 15/64 + 20/64 + 15/64 + 6/64 + 1/64] =

= 1

+ 6 + 15 + 20 + 15

+ 6 + 1.

 

 

Откладывая значения

числа наступления

благоприятных исходов т по

оси абсцисс, а значения вероятных численностей -по

оси ординат,

получим

многоугольник численностей распределения (рис. 2). Ломаная линия, соединяющая точки на графике, на­

зывается

крив ой

р а сп ре д е л е­

п

н и я.

 

 

 

 

 

 

 

 

 

 

20

Найденные по

формуле бинома чис­

 

.1енности пли биномиальные коэффици­

15

енты

(при

p=q=0,5)

можно. получить

также при помощи треугольника Паска­

 

.1я (табл. 1). Числовые

значения

коэф­

10

фициентов построены так, что любой из

 

них

получается

суммированием

двух

5

стоящих над ним

строкой выше

значе­

 

ний, справа и слева.

.

Значения коэффициентов, начина11

сединицы, закономерно возрастают >IO

определенного уровня, а заrем в той же последовательности уменьшаются. Кри-

вые, изображающие биномиальные рас-

т

о 1 2 J " 5 5

Рис. 2. Биномиальное распределевне вероятных чис-

ленностей

nределения с p=q=0,5, симметрич-

ны. При любой степени бинома n число коэффициентов равно п+1. например

при n= 1 оно равно 2 и т.

д.

Сумма

биномиальных

коэффициентов

равна 2n,

как в нашем примере, n=6; N=26=64.

 

 

 

 

 

 

 

 

 

 

 

 

1.

Треугольник

Паскаля

 

 

 

n

 

 

Биномиальные коэффициенты

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

4

3

 

 

 

 

 

 

 

3

 

3

 

 

 

 

 

8

4

 

 

 

 

 

 

4

 

6

 

4

 

1

 

 

 

16

5

 

 

 

 

 

5

10

 

10

 

5

1

 

 

 

32

б

 

 

 

7

6

15

20

 

15

 

6

 

 

 

64

7

1

1

8

 

21

35

35

21

7

8

 

 

128

8

 

28

56

70

56

28

 

 

256

9

1

9

36

 

84

126

126

84

36

 

9

1

512

10

10

45

120 210

252 210

120

45

 

10

1024

15

Если р н q не равны, распределение будет асимметрично, причем те~

в большей степени, чем меньше n. При большом n, например 30 И' бо.1ее, онф

симметрично н мало ступенчато. Характер распределения остается тем же,

независимо от того, выражено оно в значениях вероятности (т. е. по форму.1е

.1!.8) илн в значениях частоты т ожидаемого события.

Для вычисления вероятностей у события (ПО!!Виться т раз в n независи­

мых испыташrй) наряду с формулой бинома применяют также формулу Якоба

Бернуллн:

у= С'; pm qn-m = [n!fт! (п- т)!] pmqn-m.

(1!.8)

Здесь С~'- число сочетаний из n элементов по т, и.1и биномиальный

коэффициент; р- вероятность ожидаемого события (благоприятного исхода);

q= 1-р- вероятность ·противоположного

события;

т- частота

появления

ожидаемого события; n - число испытаний; n! и т! -факториалы,

т. е.

1·2·3 · ... · n н 1·2·3 · ... ·т.

 

 

 

 

т= 1,

2, 3,

..., n

 

 

 

·

 

 

Совокупность

вероятностей

при

называется б и н о м и­

а л ь н ы м р а сп р е д е л е н и е м в е р о я т н о с т ей.

 

 

 

 

 

 

Так, для предыдущего примера, при p=q=0,5, n=6 и т=О, 1, 2, ..., 6

вероятностн будут:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1·2·3·4·5·6

 

 

 

 

 

 

 

 

m=O у=---:-:(1_)..,..,(6,-·"'"5-:·4-:·3".--·"""2-:·1,.,....) ·0,50·0,5U= 1/64*;

 

 

 

 

m= 1

у=

1·2·3·4·5·6

 

 

 

 

 

 

 

 

(1) (5·4·3·2·1)

·0,51·0,55 =

6/64;

 

 

 

 

т= 2

у=

1·2·3·4·5·6

.о,5~-о.51 =

15;64:

 

 

 

 

< ·

2

>< .

3

.

2

. )

 

 

 

 

 

 

 

1

 

4

 

1

 

 

 

 

 

 

 

при

nz=З, 4, 5,

6 вероятности

 

соответственно

будут

равны

20/&4;

15/s•:

6/s4:

1/ 64 ,

т. е. такие,

какие

получены

по

 

формуле

бинома

(см. в

этой

формуле

взятое в квадратные скобки).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Биномиальное распределение

определяется

двумя

параметрами: средней

..:~е:rичиной !l=np (11.9) и дисперсией cr2=npq (11.10) или квадратическим

отклонением а= i npq (II

11).

 

Для рассматриваемого

примера имеем среднюю частоту ожидаемого слу­

. чайного событня fJ-=np=6·0,5=3 и дисперсию а2 = npq = 6·0,5·0,5 = 1,5.

 

§б. НОРМАЛЬНОЕРАСПРЕДЕЛЕНИЕ

Показаивый

на рис. 2 многоугольник

имеет 6 сторон** ( при 6 независи­

мых событнях).

Если число событий и

соответственно чнсло сторон возра­

стает, график, представляющий разложение бинома (p+q) n, все более при­ б.lнжается к плавной кривой. Это приближение имеет место для p=q и pc:/=q.

В последнем случае скошенность кривой при возрастании n уменьшается. При

прнближешш n к бесконечности график кривой приближается к симметричной

J{рнвой. Пределом такого приближения биномиального распределения является

нормальное распределение, выраженное формулой 11.12 и графически изобр_а­

женное на рис. 3***).

*0!=1.

**Не считая основания.

***В случае редких собьiтий, когда р nриближается к нулю, а. n к бес­

конечности (npconst), nредельное распределение не является нормальным,

а представ.1яет тин, называемый расnределеннем Пуассона.

16

X<I1-3CJ (или 't<-3) и для Х>11+3а (или 't>3) ординаты уже неэначk­

тельно отличаются от нуля. Это означает, что наиболее вероятны те зна'fе­

ния Х, которые близки к 11· По мере ~даления от 11 значения Х становятся все

менее вероятными. Причем одинаковые по абсолютному значению, но проти­ воположные по знаку· отклонения значений переменной Х от 11 равновероятиы.

Вточках 11-а и tx+cr кривая нормального распределения вю1 кривая

плотности нормального распределения вероятностей имеет перегибы. '

При определении ординат для какого-либо конкретного частного распре­

деления ординаты, полученные по формуле (11.13) или по табл. 6 прил., умно­ жают на N/s, где N- общий объем численностей, s - выборочное квадратиче­

ское отклонение в единицах измерения распределенной величины Х. Техника

вычисления ординат для экспериментальных распределений приведена в гла­

ве VIII.

При изучении распределений как теоретической базы статистических заключений наибольший интерес представляет площадь под нормальной кри­

вой. Эту площадь можно представить как интеграл от функции (11.13). Если интегрирование провести от начала координат, т. е. от нуля до любого зна­

чения 't, получим значение площади, заключенной между Уо и значением у, соответствующим избранному 't. Математически функция площади от норми­

рованного отклонения (обозначим ее F('t) при указанных пределах имеет

выражение:

F(-c) = (1/У~)'s е- ~dx.

(11.14)

о

 

В прил. 5 приведена четырехзначная таблица площади под нормальноii кривой в долях единицы, за которую принята вся площадь под кривой.

Пользование таблицей рассмотрим на примере данных табл. 3. Для этих

данных средняя арифметическая оказалась равной 30,1 см, среднее квадрати­

ческое отклонение 6,11 см (см. гл. V, §§ 3 и 4). При данном рассмотрении

мы можем nРинять, что в совокупности, из которой была получена выборка,.

J1=30 СМ И CJ=6 СМ.

При таком предположении и нормальном распределении. в совокупности,

выражаемом формулой 11.13, можно определить вероятности встретить деревья

любых размеров, т. е. получить сумму вероятностей по (11.14) или

табл. 5 прил.

Пр и м е р. Найдем теоретическую относительную численность, т. е. веро­

ятность деревьев, имеющих диаметр от 12 до 22 см. Стандартизованные

отклонения двух указанных значений Х будут: 1: 1 =

1 -

fL)fa =

( 1230)/6-

=- 3,

1:2 = (2230)/6 = - 1,33. .

 

 

 

 

 

 

 

По табл. 5 прил.

F(-3) =0,4986,

F(-1,33) =0,4080.

Отметим,

 

что

знак т

не имеет значения.

 

 

 

 

 

 

 

 

 

 

. Разность

F('t1)-F(т2) =0,0904

означает

вероятность

встретить

деревья

указанного интервала Х в общей совокупности, т. е. 9 деревьев из

100.

В нашей

выборке из 94 деревьев (табл.

9 н

10) имеется

11

деревьев

в

указанно)!

интервале Х.

 

 

 

 

 

 

 

 

 

 

 

Установим, пользуясь этим приемом и табл. 5 прнл., вероятности трех

важных событий в теории выборок:

 

 

 

 

 

 

 

 

а)

нормальная

случайная

переменная

примет

значение

в

интерва.1е

(J.t-CJ, 11+а);

 

 

 

в интервале (J,t-20", J.t+2a);

 

б)

переменпая

примет значение

 

в)

она

примет значение

в

интервале (J.t-30", ~.t+3a).

Так как

нормальная совокупность характеризуется J.t=O и а= 1, значения

нормирован­

ного отклонения 't будут: для а) -1, +1; для б) -2; +2 и для в) -3, +3.

По таблице находим F(+1)=0,3413, F(-1)=0,3413, откуда вероятность

события а, равная F(+I)+F(-·1), составит 0,6826.

F(+2)=0,4772, F(-2)=0,4772, вероятность события б равна 0,9544. F (+3) =0,4986, F(-3) =0,4986, вероятность события в равна 0,9972.

Эти результаты дают возможность утверждать, что в случае нормального

распределения N (О; 1) 68% наблюдаемых значений отклоняются от сред-

18

У=(1-~)(1-~) .•.
При п-... оо предел любой дроби

него значения l.t не более чем на величину квадратического отклонения cr, 95%- значений не выйдут из nределов ~.t±2cr и nрактически все значения уместятся в nределы ~.t±3cr. Вероятность отклонения ~а nределы 3cr равна 0,0026 ~ 0,003, т. е. такое событие настуnит только в среднем в 3 случаях из 1000 испытаний.

§ 7. РАСПРЕДЕЛЕНИЕ РЕДКИХ СОБЫТИй (ПУАССОНА)

Когда вероятности альтернатив неравны, т. е. p=/=q, биномиальное рас­ предедение асимметрично. При очень малой вероятности ожидаемого события, псчисляемой сотыми или тысячными долями единицы, по сравнению с веро­ ятностью q противоположного события расnределение вероятности или частоты

таких событий описывается формулой С. Пуассона.

Модель такого распределения получают на основе независимых испыта­ IШЙ nри nостоянной вероятности р настуnления некоторого случайного собы­ тпя Х, например, при возвратном случайном извлеченин шаров из урны.

Как известно из гл. II, вероятность того, что в n испытаниях случайное событие наступит равно т раз, определяется формулой (II.8), выражающей функцию распределения вероятностей для биномиального распределения.

Примем теперь дополнительные условия, а именно, что вероятность р наступления случайного события в единичном исnытании весьма мала, но число испытаний n весьма велико, n-+oo, а произведение пр (обозначим его Л)- чис.1о постоянное и не очень большое.

При таких доnолнительных условиях на основе формулы (II.8) получим

с.1едующее выражение д.1я распределения вероятностей случайной перемен­

ной Х:

у=Ст

р

т

п-т= n(n-1) ... (n-m+1)

.-"-(1

-_л_)п-т, (II. 1S)

11

q

т!

пт

n

где Л=пр; р=Л/n.

Так как числитель nервой дроби имеет т сомножителей, а в знаменателе стоит пm, каждый из сомножителей можно разделить на n. Получим:

(1 т-;; 1 ) ·

(1- 1-/n) есть 1,

=е-Л- При этих условиях у= (Лm/ml) е -л.

);: (1-+)n-m. (11.16)

а предел (1 _ ),fn)n-m =

(11. 17)

Выражение

(11.17)

называется

функцией распределения'

вероятностей

в распределении

Пуассона. Существуют таблицы

этих вероятностей с вхо­

дами по Л и т (см. табл. 11 прил.).

 

 

n испытаниях,

В этом выражении

т- частота

ожидаемого

события в

е=2,7183; параметр Л=пр равен математическому ожиданию или наивероят­ нейшей частоте события, т. е. ,..., а также дисперсии cr. Доказательство этого равенства здесь опускаем. Оно содержится во многих книгах по статистике.

Для практических расчетов, когда находят теоретические ординаты рас­

пределения n, т. е. численности распределения случайного события Х, выра­

жение (II.17) умножают на N- общее число наблюдений, вместо 1.t nрини­ мают экспериментальное среднее число наблюдаемых случаев. Формула для n будет:

(11.18)

Расnределение Пуассона с возрастанием средней Л приближается к бино­

миальному. Распределение Пуассона оnисывает многие явления в технике

11 биологии. В техинке оно находит широкое применение nри контроле качества

продукции, для аппроксимации распределения дефектных изделий. В биологии оно применяется как модель распределения числа семян сорняков - примесей

в пробных навесках nри анализе семян, поврежденных вредителем. Оно оnи-

19

сывает также распределение чисденностп возобновления, когда размер э.J('­

ментарвых учетных площадок очень мал илн условия заселения площадн

неблагоприятны, так что вероятность благоприятного исхода р мала.

В главе VIII модель распределения Пуассона прн~tенена для оценки рас­

пределения численности семян сосны прн аэросеве.

Глава 111

ВАРИАЦИОННЫЕ РЯДЬI

§1.ТИПЫ ВАРЬИРОВАНИЯ

Получаемые в результате наблюдений значения наблюдае­ мого признака называют в а р и а н т а м и. Варианты в био.'Iо­ гических объектах обнаруживают разнообразие (или в_арьирова­ ние) изучаемого свойства. Например, они отличаются друг от

друга по размеру, массе, объему, состоянию. Это связано с Деit­

ствием различных факторов, в том числе и со случайной ошиб­

кой наблюдения.

В зависимости от характера изучаемого признака различают

варьирование непрерывное и прерывистое, или дискретное и ат­

рибутивное. Непрерывное и дискретное варьирование присуще

количественным признакам, а атрибутивноекачественным.

При н е пр еры в н о м варьировании отдельные значения

признака выражают мерой протяженности, объема и т. д. От­

дельные варианты могут иметь любое, но изменяющееся в опре­ деленных пределах значение меры. Толщина деревьев в древо­

стое, например, от самого тонкого до самого толстого может

принимать самые различные значения меры протяженности.

Только в зависимости от цели исследования (измерения) выра­

жают ее в классах толщины: в несколько сантиметров, в целых

сантиметрах, в десятых или сотых долях сантиметра.

При д и с к ре т н о м варьировании отдельные значения

признака выражают отвлеченными числами, чаще всего целыми

(например, число растений на учетной площадке, число семян

в навеске и т. д.).

При а три б у т и в н о м варьирован и и значения при­

знака выражают определенной степенью окраски, консистенции, поврежденности или устойчивости, а также формой, видом

и т. д. Количественно признаки выражают в абсолютных числах,

долях единицы, процентах, баллах и т. д.

Частным случаем атрибутивного варьирования является

альтернативное, при котором значения признака рассматривают

в альтернативной форме, т. е. противопоставляя здоровые боль­

ным, сильныеслабым, окрашенные-неокрашенным и т. д.

В альтернативной форме можно представить и количественные

признаки, противопоставляя, например, высокие индивиды низ­

ким, тяжелыелегким. Однако при рассмотрении количествен­

ных признаков в альтернативной форме получают менее содер­ жательную статистическую информацию.

20

§ 2. ГРУППИРОВКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИИ

Обработку первичных данных наблюдения, представляемых

обычно в виде списка, начинают с их группировки. Результаты наблюдений сводят в статистические таблицы. Таблицы быва­

ют простые и сложные. Если материал группируют по двум

и более признакам получают сложные таблицы. В основу груп­ пировки должен быть положен признак (или ряд признаков),

правильно характеризующий изучаемое или определяющее свой­

ство объекта и его изменение от группы к группе.

Глубокие теоретические положения о группировке статисти­

ческого материала развиты В. И. Лениным в работе «Развитие

капитализма в России», на основе анализа статистического мате­ риала о величине арендуемой земли _разными по социальному

положению группами крестьян к началу ХХ в. В. И. Ленин пока­

зал, что «экономическая статистика необходимо должна поло­

жить в основание группировки размеры и типы хозяйства»*,

а не величину надела земли и не выводить по волостям и общи­

нам «средних» цифр, которые часто оказываются фиктивными.

В лесоводстве вопросы групnировки материала бывают часто

\также сложными.

При изучении скорости роста древостоев, например, в преде­

лах одного вида растительности приходится группировать мате­

риал по условиям произрастания. Причем признак «условия» не является достаточно четким и определяемым однозначно. При

характеристике урожая лесана единице площади последнюю

подразделяют по заселяющим древесным породам, возрасту дре­

востоев и т. д. Средние характеристики, получаемые для таких групп, более точны. В рамках образованных крупных групп ста­

тистический материал в целях извлечения содержащейся в нем

информации располагают по величине изучаемого признака. При небольшом числе наблюдений (до 15-20) общие пред­

ставления о распределении признака можно получить, разме­

стив данные в порядке их возрастания или убывания. Получают ранжированный ряд. Для десяти значений измеренного признака

3,

4,

6,

9,

6, 6, 7, 5, 8, 6 ранжированным рядом будет: 3, 4, 5,

6,

6,

6,

6,

7,

8,

9.

При большом числе наблюдений ранжированный ряд не об­ ладает наглядностью. Значения признака в таком случае распо­ лагают в виде двойного ряда. В верхней строке или в 1-м столб­ це (если ряд записывают в вертикальном направлении) записы­ вают значения признака, во 2-й строке или во 2-м столбце

указывают число повторяющихся значений.

Для приведеиного примера из 1О наблюдений получим:

Значения признака Х .

3

4 5 6 7 8 9

Повторяемость

значений n

 

4

* Ленин В.

И. Полн. собр. соч.

Изд. 5-е, т. 3, с.

96.

21