Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Mashkovsky_Lesnaya_biometria

.pdf
Скачиваний:
42
Добавлен:
26.03.2015
Размер:
1.95 Mб
Скачать

следующим образом:

 

 

n

(xi

 

 

)2

 

 

n

 

n

 

 

 

 

 

n

(

 

)2

 

 

 

 

 

 

S 2 =

 

 

x

 

 

xi2 2

xi

x

+

x

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

=

i=1

i=1

 

 

 

 

i=1

 

 

 

=

 

 

 

 

 

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi2

 

 

 

 

 

 

xi

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

2

 

 

i=1

 

+

n (x)

 

=

x2

2 (

 

)2 + (

 

)2 =

x2

(

 

)2 ,

 

x

 

x

x

x

n

 

 

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

что и требовалось доказать.

Используя (53) и (18), первое слагаемое в выражении (52) можно преобразовать следующим образом:

S 2

 

+ S 2

 

 

 

 

 

 

 

 

 

 

+

 

 

 

 

 

(

 

)2

 

(

 

 

)2 n

 

 

n

n

 

 

 

x2

n

x2

n

 

n

 

 

 

2

 

 

2

x

x

2

2

 

 

1

1

2

 

 

=

1

1

2

 

 

 

1

 

 

1

 

 

 

=

 

 

 

n1 + n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 + n2

 

 

 

 

 

 

 

 

 

n

n +n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 xi2 + 12 xi2 (

 

)2 n1 (

 

 

)2 n2

 

 

 

 

 

 

 

 

x1

x2

 

 

 

 

 

 

 

=

 

i=1

i=n1 +1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 + n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n +n

 

(

 

)2 n1 (

 

 

)2 n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12 xi2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

x2

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 + n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выражение (25) (5 свойство среднего арифметического) можно преобразовать к виду

 

(n1 + n2 ) =

 

n1 +

 

n2 .

(54)

x

x1

x2

Далее, используя (54), преобразуем второе слагаемое из выражения (52) следующим образом:

(x1 x)2 n1 + (x2 x)2 n2 = n1 + n2

= (x1 )2 n1 2 x1 x n1 +(x)2 n1 +(x2 )2 n2 2 x2 x n2 +(x)2 n2 = n1 +n2

= (x1 )2 n1 + (x2 )2 n2 + (x)2 (n1 + n2 ) 2 x (x1 n1 + x2 n2 ) =

n1 + n2

= (x1 )2 n1 + (x2 )2 n2 + (x)2 (n1 + n2 ) 2 (x)2 (n1 + n2 ) =

n1 + n2

62

= (x1 )2 n1 + (x2 )2 n2 (x)2 (n1 + n2 ) .

n1 + n2

Подставляя найденные выражения для слагаемых в выражение (52) и учитывая (53), получим

 

 

 

 

S 2

n

+ S 2

n

 

 

 

 

(

 

 

 

)2 n

+(

 

 

 

)2 n

 

 

 

 

 

 

2 =

 

2

 

 

 

x

x

x

 

x

 

 

 

 

 

S

 

1

 

1

2

 

 

 

+

1

1

 

 

2

 

 

 

 

 

2

=

 

 

 

 

 

 

 

 

 

 

n1 + n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 + n2

 

 

 

 

 

 

 

 

 

 

 

 

n1+n2 xi2 (

 

 

 

)2 n1 (

 

 

)2 n2 +(

 

)2 n1 +(

 

)2 n2 (

 

)2 (n1 +n2 )

 

x1

x2

x1

x2

x

=

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1 +n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n +n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12 x12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

i=1

 

 

 

(

 

)2 =

x2

 

(

 

)2 = S 2 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n + n

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

что и требовалось доказать.

Данное свойство можно обобщить на случай, когда выборка состоит из k групп наблюдений. Чтобы сделать такое обобщение, целесообразно ввести понятия межгрупповой и внутригрупповой дисперсии.

Межгрупповой дисперсией мы будем называть среднюю арифметическую квадратов отклонений групповых средних xi от

средней для всей выборки x (причем в качестве весов при вычислении этой дисперсии используются объемы групп ni ). Эту

дисперсию можно вычислить по формуле

 

k

ni (

 

 

)2

 

 

δ2 =

xi

x

 

 

i=1

 

 

 

 

 

.

(55)

 

k

 

 

ni

 

 

i=1

Внутригрупповой дисперсией, или средней групповых дисперсий,

Si2 мы будем называть среднюю арифметическую групповых дисперсий Si2 . В качестве весов в данном случае используются объемы групп ni :

63

k

ni Si2

S 2

=

i=1

.

(56)

k

i

 

 

 

 

 

ni

 

 

i=1

Сиспользованием понятий межгрупповой и внутригрупповой дисперсий данное свойство в случае, когда выборка состоит из K групп наблюдений, будет звучать следующим образом: дисперсия выборки, состоящей из K групп наблюдений, равна сумме внутригрупповой и межгрупповой дисперсий, т. е.

 

 

 

 

S 2 = Si2 + δ2 .

(57)

Среднеквадратическое отклонение. Дисперсия является очень важной характеристикой выборки, однако в некоторых случаях для характеристики изменчивости анализируемых данных удобнее использовать среднеквадратическое отклонение, которое является квадратным корнем из дисперсии:

Sx =

n (xi x)2

 

i=1

– смещенная оценка;

 

n

 

Sx =

n (xi x)2

 

i=1

– несмещенная оценка.

 

n 1

 

Или для сгруппированного набора данных:

Sx =

k

fi (xi x)2

 

i=1

n

– смещенная оценка;

 

 

 

Sx =

k

fi (xi x)2

 

i=1

n 1

– несмещенная оценка.

 

 

 

(58)

(59)

(60)

В отличие от дисперсии, среднеквадратическое отклонение выражается в тех же единицах измерения, что и анализируемый признак. В связи с этим данный показатель является более естественным и легче поддается анализу.

Коэффициент вариации. Дисперсия и среднеквадратическое отклонение довольно полно характеризуют вариацию признака,

64

однако в некоторых случаях удобнее иметь показатель, который оценивает разброс данных не в абсолютных величинах, а в относительных. Таким показателем является коэффициент вариации, который показывает, сколько процентов составляет среднеквадратическое отклонение от среднего арифметического:

V =

Sx

100%.

(61)

 

 

x

 

В биометрии этот показатель часто оказывается весьма полезным. Дело в том, что анализу подвергаются, как правило, объекты живой природы, а они с течением времени изменяют свои размеры: растут. В связи с этим часто необходимо анализировать выборки, сделанные для объектов с разным средним возрастом, а следовательно, и разными средними размерами. Если в таких случаях необходимо сравнить степень изменчивости признака в разных выборках, то удобнее оперировать коэффициентом вариации, так как он дает нам величину вариации по отношению к среднему значению.

Коэффициент асимметрии. Рассмотренные выше показатели довольно полно характеризуют анализируемые признаки, однако ни один из них не отражает степень симметричности распределения наблюдений относительно среднего значения. Ведь на практике довольно часто отклонения признака от среднего арифметического в меньшую и большую стороны носят неодинаковый характер.

Для того чтобы оценить степень такой неравномерности распределения наблюдений относительно среднего арифметического, используют коэффициент асимметрии, который можно вычислить по формуле

n

(xi x)3

A =

i=1

 

,

 

n Sx3

 

 

 

или для сгруппированного набора данных:

k

fi (xi x)3

A =

i=1

 

.

(62)

 

n Sx3

 

 

 

 

Коэффициент асимметрии может принимать как положительные, так и отрицательные значения. В том случае, если левая ветвь распределения более пологая и длинная, а вершина кривой смещена вправо относительно среднего арифметического, то

65

коэффициент асимметрии для такого распределения имеет отрицательное значение. Такая асимметрия называется левосторонней, или отрицательной (рис. 8).

Рис. 8. Левосторонняя, или отрицательная, асимметрия кривой распределения

Если распределение имеет более длинную и пологую правую ветвь, а его вершина смещена влево относительно среднего арифметического, то в таком случае имеет место правосторонняя, или положительная, асимметрия (рис. 9). Коэффициент асимметрии в таком случае будет положительным.

Рис. 9. Правосторонняя, или положительная, асимметрия кривой распределения

Эмпирический коэффициент эксцесса. Кроме того, что распределения наблюдений могут отличаться друг от друга по степени асимметричности, они могут иметь разную крутизну: быть островершинными и плосковершинными. В случае островершинной кривой, когда большое число наблюдений группируется в

66

непосредственной близости от центра распределения, говорят о наличии положительного эксцесса. Кривая распределения имеет отрицательный эксцесс, если она является плосковершинной. Для оценки степени крутизны кривой распределения используется коэффициент эксцесса, который вычисляется по формуле

n

(xi x)4

E =

i=1

 

3,

 

n Sx4

 

 

 

или для сгруппированного набора данных:

k

fi (xi x)4

E =

i=1

 

3.

(63)

 

n Sx4

 

 

 

 

Этот коэффициент построен таким образом, что его значение для нормального распределения1, как для наиболее изученного и часто используемого, равен нулю. В том случае, если коэффициент эксцесса принимает положительное значение (положительный эксцесс), распределение вариант будет более крутым, чем нормальное распределение (рис. 10).

Рис. 10. Положительный эксцесс, островершинная кривая

Когда этот показатель меньше нуля (отрицательный эксцесс), наблюдения будут образовывать более плосковершинную кривую, чем нормальное распределение (рис. 11).

1 Нормальное распределение будет рассматриваться в следующей главе.

67

Рис. 11. Отрицательный эксцесс, плосковершинная кривая

Эмпирические моменты. Кроме перечисленных выше показателей, для характеристики эмпирических распределений используется система статистик, называемых моментами. Эмпирический момент порядка q определяется как средняя арифметическая величина из q-тых степеней наблюдаемых значений признака:

n

xiq

m

=

i=1

,

(64)

 

q

 

n

 

 

 

 

 

 

или в случае сгруппированного набора данных:

k

fi xiq

m

=

i=1

 

.

 

 

q

 

 

n

 

 

 

 

 

Такие моменты иногда называют начальными.

Эмпирический начальный момент нулевого порядка всегда равен 1:

 

 

n

 

n

 

 

 

 

xi0

 

1

n

 

m

=

i=1

=

i=1

=

=1.

 

 

 

0

 

n

 

n n

 

 

 

 

 

Эмпирический начальный момент первого порядка – это не что иное, как средняя арифметическая величина. Действительно, если в формулу (64) подставить значение q =1, то мы получим формулу, выражающую среднее арифметическое значение:

68

 

 

 

n

 

n

 

 

 

 

xi1

 

x1

 

m =

i=1

=

i=1

= x.

 

 

 

 

 

 

1

 

n

 

n

 

 

 

 

 

 

Если c – константа, то выражением

 

 

 

n

 

 

 

 

 

 

 

(xi

c)q

 

b

=

i=1

 

 

 

 

(65)

 

 

 

 

 

i

 

 

n

 

 

 

 

 

задается момент относительно точки c порядка q.

В случае, когда c = 0 , получаем начальные моменты. Моменты относительно средней арифметической ( c = x ) называются центральными:

n

(xi x)q

μk =

i=1

 

,

 

n

 

 

 

или для сгруппированного набора данных:

k

fi (xi x)q

μk =

i=1

 

.

(66)

 

n

 

 

 

 

В силу свойства 1 средней арифметической величины, гласящего, что сумма отклонений вариант от средней арифметической величины равна нулю, эмпирический центральный момент первого порядка также равен нулю:

n

(xi x)

μ1 =

i=1

 

= 0.

 

n

 

 

 

Эмпирический центральный момент второго порядка – это не что иное, как выборочная дисперсия:

n

(xi x)2

μ2 =

i=1

 

= Sx2 .

 

n

 

 

 

Эмпирические центральные моменты всех порядков обладают двумя свойствами.

1. Если все наблюдения в анализируемой выборке изменить на постоянную величину c (c [−∞;+∞]) , то центральный момент q-того

порядка не изменится. Действительно, учитывая свойство 2 средней

69

арифметической величины (x + c = x + c) , имеем:

 

 

 

 

n

 

 

 

 

 

n

 

 

 

 

 

((x c)

x c

)q

 

(x c

x

+ c)q

 

μ

q,xc

=

i=1

 

 

 

 

=

i=1

=

 

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x

x

)q

 

 

 

 

 

 

 

 

 

=

i=1

 

 

 

 

= μq,x .

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Если все наблюдения в анализируемой выборке умножить на константу c (c [−∞;+∞]) , то центральный момент q-того порядка

увеличится в cq раз. Действительно, учитывая свойство 3 средней арифметической (x c = x c) , получим

 

 

 

 

n

 

 

 

 

n

 

 

 

 

 

((x c)

x c

)q (x c

x

c)q

 

μ

q,x c

=

i=1

 

 

 

=

i=1

=

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

= cq

(x

x

)q

= cq μq,x .

 

i=1

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

Если известны моменты q--того порядка и ниже относительно точки a, то на основании этих величин можно определить момент q-того порядка относительно любой другой точки c.

С учетом формулы бинома имеем

 

 

 

 

q

 

(x c)q = ((x a) +(a c))q = Cqj (x a)qj (a c) j ,

(67)

 

 

 

 

j=0

 

где Cqj – биномиальный коэффициент:

 

 

q!

, 0 j q,

 

 

 

 

 

 

 

 

 

 

Cqj = j!(q j)!

 

 

 

 

 

0 q < j.

 

0,

 

 

 

Используя выражение (67), получим

 

 

n

 

n

 

 

 

(x c)q

 

Cqj (x a)qj (a c) j

 

b

(c) =

i=1

=

i=1

=

 

 

q

 

n

 

n

 

 

 

 

 

70

 

n

q

(x a)qj

= Cqj (a c) j

i=1

n

j=0

q

 

= Cqj (a c) j bqj (a).

(68)

j=0

Для первых четырех моментов выражение (68) выглядит следующим образом:

b1 (c) = (a c) + b1 (a);

b2 (c) = (a c)2 + 2 (a c) b1 (a) + b2 (a);

b (c) = (a c)3

+ 3 (a c)2 b (a) + 3 (a c) b (a) + b (a);

3

1

2

3

b (c) = (a c)4

+ 4 (a c)3 b (a) + 6 (a c)2

b (a) +

 

4

1

2

 

+4 (a c) b3 (a) +b4 (a).

Втом случае, если величина c равна среднему арифметическому, и учитывая, что

 

n

 

n

n

 

n

 

 

 

n a xi

 

a

xi

 

(xi

a)

a x =

i=1

=

i=1

i=1

= −

i=1

 

= −b (a),

 

 

 

 

 

 

n

 

n

 

 

n

1

 

 

 

 

 

 

получаем

μ1 = 0;

μ2 = b2 (a) (b1 (a))2 ;

μ3 = b3 (a) 3 b1 (a) b2 (a) + 2 (b1 (a))3 ;

μ4 = b4 (a) 4 b1 (a) b3 (a) + 6 (b1 (a))2 b2 (a) 3 (b1 (a))4 .

Вычислим рассмотренные выше показатели вариации для диаметров и высот 200 деревьев, приведенных в последних четырех столбцах табл. 1 приложения с номерами 17 ,18, 19 и 20.

Проще всего определить размах вариации. Для этого достаточно найти минимальное и максимальное значения и подставить их в формулу (44):

R = xmax xmin = 56,6 17,7 = 38,9 – для диаметров; R = xmax xmin = 29,6 17,5 =12,1 – для высот.

Для того чтобы определить остальные показатели вариации, составим по данным вариационных рядов диаметров и высот вспомогательные табл. 22 и 23.

Таблица 22. Вычисление показателей вариации (диаметры)

71

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]