Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Mashkovsky_Lesnaya_biometria

.pdf
Скачиваний:
42
Добавлен:
26.03.2015
Размер:
1.95 Mб
Скачать

приведено распределение деревьев по диаметру на высоте груди. Половина объема данной выборки составит

n2 = 2182 =109.

Первым интервалом, чья накопленная частота превышает это значение (медианным интервалом), будет интервал 21,95–24,65. Подставляя необходимые значения в формулу (91), получим

 

n

j1

 

218

 

 

 

fi

 

77

 

Me = xнMe + λ

2

i=1

= 22,0 + 2,7

2

 

=

 

f j

40

 

 

 

 

= 22,0 + 2,7 3240 = 24,16.

Квантили. Медиана делит вариационный ряд на две равные части. В более общем случае мы можем разделить вариационный ряд на две неравные части в любом соотношении. Статистики, которые отделяют от вариационного ряда определенную часть его членов, называются квантилями.

Квантили, которые отделяют от вариационного ряда 1, 2, ..., 99 % его членов, называются перцентилями. С помощью 99 перцентилей P1, P2 , ..., P99 вариационный ряд делится на 100 равных

частей. Девять статистик, которые делят вариационный ряд на десять одинаковых частей, называются децилями. Квартилями называют три квантиля (Q1 , Q2 и Q3 ), которые делят вариационный ряд на четыре

равные части. Они соответствуют перцентилям, отделяющим от ранжированного ряда наблюдений 25, 50 и 75% вариант соответственно:

Q1 = P25 ;

Q1 = P50 ;

Q1 = P75.

Кроме того, квартиль и перцентиль, делящие вариационный ряд на две равные части, соответствуют медиане ряда наблюдений:

Q2 = P50 = Me.

На практике чаще всего используют перцентили P3 , P10 , P25 , P50 , P75 , P90 и P97 . Определяют квантили аналогично тому, как определяют медиану вариационного ряда. В том случае, если

82

анализируется

интервальный

вариационный

ряд,

можно

воспользоваться формулой

 

 

 

 

 

 

 

 

 

L n

j1

 

 

 

 

 

 

 

 

 

 

fi

 

 

 

 

 

L

 

100

 

 

 

P

= x

 

 

i=1

 

 

 

(92)

 

+ λ

 

 

 

 

,

 

 

 

 

 

fL

 

 

L

 

н

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где PL – квантиль, отделяющий от ранжированного ряда L процентов наблюдений; xнL – нижняя граница интервала, в который попадает квантиль PL ; j – номер интервала, в который попадает квантиль PL ; L

– процент наблюдений в выборке, которые меньше, чем квантиль PL ;

j1

fi – накопленная частота интервала, предшествующего интервалу,

i=1

в котором находится квантиль PL . Для того чтобы определить, в каком

интервале находится квантиль, следует воспользоваться накопленными частотами ряда распределения. Первый интервал, у которого накопленная частота окажется больше, чем величина L n100 , и будет таким классом.

В качестве примера найдем квартили распределения деревьев по диаметру на высоте груди (табл. 11). Квартиль Q1 попадает в интервал

19,25–21,95, так как это первый интервал, чья накопленная частота (77) оказалась больше величины:

100L n = 25100218 =54,5.

Подставляя необходимые значения в формулу (92), получим

 

 

25 218

 

 

 

 

 

 

 

48

 

 

100

 

 

Q = P

=19,3 + 2,7

 

 

 

 

=19,91.

 

29

 

 

1 25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогичным образом определяем значения остальных двух квартилей распределения:

 

 

 

50 218

 

 

 

 

 

 

 

 

77

 

 

 

100

 

 

Q

= P

= 22,0 + 2,7

 

 

 

 

= 24,16 = Me

 

40

 

 

2

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

83

и

 

 

75 218

 

 

 

 

 

 

 

156

 

 

100

 

 

Q = P

= 27,4 + 2,7

 

 

 

 

= 28,12.

 

28

 

3 75

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

84

3. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН

Лесная биометрия имеет дело с признаками, характеризующими различным образом лес в целом или отдельные его элементы. Для природных объектов свойственна изменчивость, т. е. признаки, которые их характеризуют, изменяются от объекта к объекту. Значение таких признаков определяется влиянием на объект множества различных, как правило, неизвестных случайных причин. В связи с этим признаки, характеризующие природные объекты, сами являются случайными величинами.

3.1.Функция распределения

Любая случайная величина подчинена какому-либо закону распределения, который может быть описан с помощью функции, определяемой соотношением

FX (x) = P( X < x)

и называемой функцией распределения величины X. Функция распределения обладает рядом свойств.

7. Функция распределения может принимать значения в интервале от 0 до 1 включительно:

0F(x) 1.

8.Функция распределения является неубывающей функцией, т. е. для любых x1 и x2 таких, что x1 x2 , справедливо неравенство

F (x1) F (x2 ),

так как вероятность того, что случайная величина попадет на отрезок ] −∞; x2[ не меньше, чем вероятность попадания этой случайной

величины на отрезок ] −∞; x1[ , если x2 x1 .

9.При x, стремящемся к −∞, функция распределения стремится к нулю:

lim F(x) = 0,

x→−∞

а при x, стремящемся к +∞, функция распределения стремится к единице:

lim F (x) =1.

x→+∞

85

Кроме того, следует заметить, что величина F(b) F(a)

представляет собой вероятность того, что случайная величина X примет значение, принадлежащее интервалу a X < b . Если верхняя граница b такого интервала равна +∞, то событие, состоящее в том, что случайная величина попадает в интервал [a; +∞[ есть не что иное,

как событие, состоящее в том, что случайная величина окажется больше или равной величине a. Вероятность такого события равна

P(X x) = F(+∞) F(x),

или с учетом свойства 3 функции распределения

P(X x) =1F(x).

3.2.Дискретные случайные величины

Случайные величины могут быть дискретными или непрерывными.

Дискретными называются случайные величины, принимающие конечное или счетное множество2 значений. В качестве примера возьмем число порослевин от основания усохших после пожара берез или число яиц в кладках соснового пилильщика и т. д.

Известно много законов распределения дискретных случайных величин. В качестве примера рассмотрим биномиальное распределение.

3.2.1.Биномиальное распределение

Представим себе такую ситуацию: создаются лесные культуры дуба черешчатого строчно-луночным посевом желудей. Желуди высеваются в лунки, расположенные строчками через 0,7 м с расстоянием между строчками 1,2 м. В каждую лунку кладется по пять желудей. Часть из них взойдет, а другая часть не даст всходов. Предположим, что для высеваемой партии желудей была определена всхожесть семян. Всхожесть – это отношение числа семян, которые дали всходы, к общему количеству высеяных семян, выраженное в процентах. Обозначим символом p всхожесть, деленную на 100, т. е. p

– это отношение числа семян, которые дали всходы, к общему количеству высеяных семян или, другими словами, p – это

2 Множество называется счетным, если можно установить взаимно однозначное

соответствие между ним и множеством натуральных чисел.

86

вероятность того, что желудь взойдет. Попробуем определить вероятность того, что в лунке взойдет 5 желудей, 4, 3, 2, 1 или не взойдет ни одного. Для удобства пронумеруем все желуди, высаженные в лунку, номерами с 1-го по 5-й. Теперь рассмотрим, какие могут быть варианты прорастания семян в лунке (табл. 25). Как видим, вероятность того, что в лунке не прорастет ни одного желудя,

составляет q5 , где q =1p – вероятность того, что желудь не

прорастет. Может произойти 5 различных событий, в результате которых в лунке будет только один всход. Эти события состоят в том, что в лунке прорастет 1, 2, 3, 4 или 5-й желудь, а остальные не взойдут. Вероятность каждого из этих событий, согласно правилу

умножения вероятностей, равна p q4 . Таким образом, лунка, где есть только один росток, может встретиться с вероятностью 5 p q4 . Аналогичным образом, пользуясь данными табл. 25, получаем, что вероятность встретить лунку с двумя всходами будет равна 10 p2 q3 , с тремя всходами – 10 p3 q2 , с четырьмя – 5 p4 q и с пятью – p5

Таблица. 25. Возможные варианты прорастания желудей в лунке

Число взошедших

Номера

Номера

Вероятность

желудей

взошедших

невзошедших

события

 

желудей

желудей

 

0

1,2,3,4,5

q5

1

1

2,3,4,5

p q4

1

2

1,3,4,5

p q4

1

3

1,2,4,5

p q4

1

4

1,2,3,5

p q4

1

5

1,2,3,4

p q4

2

1,2

3,4,5

p2 q3

2

1,3

2,4,5

p2 q3

2

1,4

2,3,5

p2 q3

2

1,5

2,3,4

p2 q3

2

2,3

1,4,5

p2 q3

2

2,4

1,3,5

p2 q3

87

 

 

 

Окончание табл. 25

 

 

 

 

Число взошедших

Номера

Номера

Вероятность

 

желудей

взошедших

невзошедших

события

 

желудей

желудей

 

 

2

2,5

1,3,4

p2 q3

2

3,4

1,2,5

p2 q3

2

3,5

1,2,4

p2 q3

2

4,5

1,2,3

p2 q3

3

1,2,3

4,5

p3 q2

3

1,2,4

3,5

p3 q2

3

1,2,5

3,4

p3 q2

3

1,3,4

2,5

p3 q2

3

1,3,5

2,4

p3 q2

3

1,4,5

2,3

p3 q2

3

2,3,4

1,5

p3 q2

3

2,3,5

1,4

p3 q2

3

2,4,5

1,3

p3 q2

3

3,4,5

1,2

p3 q2

4

1,2,3,4

5

p4 q

4

1,2,3,5

4

p4 q

4

1,2,4,5

3

p4 q

4

1,3,4,5

2

p4 q

4

2,3,4,5

1

p4 q

5

1,2,3,4,5

p5

 

Число событий, в которых имеется 0, 1, 2, 3, 4 или 5 взошедших желудей, есть не что иное, как биномиальные коэффициенты (число сочетаний из 5 по 0, 1, 2, 3, 4 или 5):

C5i =

5!

 

,

i = 0,1,K, 5.

i!(5 i)!

 

 

 

Учитывая последнюю формулу, вероятность того, что в лунке окажется m всходов, будет равна

88

C5m pm q5m .

Если бы в каждую лунку высевали не 5, а n желудей, то вероятность того, что в лунке окажется m всходов, составила бы величину

Cnm pm qnm.

(93)

Это выражение называется формулой Бернулли. В общем случае рассматриваемую выше ситуацию можно представить как n-кратное повторение эксперимента. Причем в результате каждого случайного эксперимента событие A может произойти с вероятностью p или не произойти с вероятностью q =1p . Таким образом, мы получаем

случайную величину, представляющую собой число появлений события A в описываемой серии, состоящей из n независимых экспериментов. Эта случайная величина может принимать значения 0, 1, ..., n. Распределение, которому подчинена данная случайная величина, называется биномиальным, а вероятность того, что эта случайная величина будет равна m, определяется выражением (93).

3.3.Непрерывные случайные величины

Непрерывными называются случайные величины, которые могут принимать любые значения в каком-либо конечном или бесконечном интервале. Непрерывными случайными величинами являются такие параметры, как высота дерева, объем ствола и т. д.

3.3.1.Плотность распределения вероятностей

Плотностью распределения вероятностей P(x) непрерывной случайной величины X называется предел, если он существует, отношения вероятности попадания случайной величины X на интервал ]x, x + x[, примыкающий к точке x, к длине этого интервала, когда последняя стремится к нулю:

P(x) = lim P(x X < x + x) .

x0

x

Кривая, изображающая плотность распределения вероятностей (плотность вероятности) непрерывной случайной величины,

называется кривой распределения.

Плотность вероятности обладает следующими свойствами.P(x) 0 для любого x, принадлежащего интервалу ]–;+[.

89

+∞

11. P(x)dx =1, так как вероятность того, что непрерывная

−∞

случайная величина принимает значения из интервала ]–;+[, т.е. вероятность достоверного события равна единице.

12.P(x) – непрерывна или кусочно-непрерывна.

3.4.Нормальное распределение

Вкачестве примера для непрерывной случайной величины рассмотрим нормальное распределение. Это распределение имеет важное значение в биометрии. На практике очень часто изучаемые случайные величины следуют этому закону.Функция плотности вероятностей нормально распределенной случайной величины X имеет вид

( xm)2

=1 e 2 σ2 ,

σ 2 π

где m – математическое ожидание, а σ – среднее квадратическое отклонение случайной величины X. Эта функция называется кривой Гаусса. Она симметрична относительно прямой x = m и имеет колоколообразную форму.

При изменении величины m кривая будет смещаться влево или вправо, не меняя своей формы. Параметр m характеризует положение кривой на оси абсцисс, в связи с этим его иногда называют

параметром сдвига.

Стандартное отклонение σ определяет форму кривой Гаусса. При малых значениях этого параметра кривая имеет узкую и высокую вершину, а при больших значениях выглядит плосковершинной (рис. 12). Этот параметр иногда называют параметром масштаба.

Кривая Гаусса имеет максимум (т. max) в точке x = m , равный

P(m) =

1

,

σ 2 π

и две точки перегиба (т. перегиба) с абсциссами m − σ и m + σ и ординатой

P(m − σ) = P(m + σ) =

1

σ 2 π e

(рис. 13).

90

 

0,6

 

 

 

σ =

 

 

 

 

σ =

 

 

 

 

 

 

0,5

 

 

 

 

 

0,4

 

 

 

σ =

 

 

 

 

 

 

0,3

 

 

 

 

 

0,2

 

 

 

 

 

0,1

 

 

 

 

 

0

 

 

 

 

 

 

-4 -4 -3 -3 -2 -2 -2 -1 -1 0 0 0 1 1 2 2 2 3 3 4 4

Рис 12. Нормальные кривые с разными значениями параметра формы

 

1

 

 

т. max

 

σ

2 π

 

 

 

 

 

1

т. перегиба

 

 

т. перегиба

σ

2 π e

 

 

 

 

 

 

 

 

0

− σ

m

m+ σ

 

 

m

 

 

Рис. 13. Характерные точки кривой Гаусса

Площадь, ограниченная кривой Гаусса (как, впрочем, и любой другой кривой плотности распределения вероятностей) и осью абсцисс, равна 1. Причем основная площадь сосредоточена вблизи абсциссы, равной m. Так, например, площадь фигуры, ограниченной сверху кривой Гаусса, снизу – осью абсцисс, слева – вертикальной прямой, пересекающей ось абсцисс в точке m σ, а справа – вертикальной прямой, пересекающей ось абсцисс в точке m + σ, равна 0,6827 (больше половины всей площади под кривой). Если слева и справа фигуру ограничить вертикальными прямыми, пересекающими

91