Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

лесная биометрия

.pdf
Скачиваний:
190
Добавлен:
26.03.2015
Размер:
640.17 Кб
Скачать

Наиболее выразительными графики получаются, если при их построении соблюдать правило золотого сечения, согласно которому основание графика должно относиться к его высоте как 8:5 = 1:0,625.

границы классовых интервалов

35

30

25

20

15

10

5

0

0

50

100

150

200

250

накопленные частоты

Рис. 4. Огива распределения сосновых стволов по высотам

Составление таблицы распределения

Наряду с простой группировкой данных в интервальные вариационные ряды в некоторых случаях целесообразно сгруппировать данные сразу по двум параметрам. Эта потребность, как правило, возникает в том случае, если необходимо проанализировать связь между двумя случайными величинами. В таких случаях составляют так называемые таблицы распределения (корреляционные таблицы, корреляционные решетки).

Для примера составим таблицу распределения 200 деревьев по интервалам диаметра и высоты в чистом сосновом древостое по данным, приведенным в последних четырех столбцах табл. 1 приложения с номерами 17, 18, 19 и 20. Для этого воспользуемся интервалами рядов распределения деревьев по диаметрам (табл. 4) и высотам (табл. 5). Впишем границы интервалов вариационного ряда по диаметрам в первую строку таблицы 6, а границы вариационного ряда по высотам – в первую колонку. Затем, распределяя наблюдения одно-

10

временно по интервалам диаметров и высот и регистрируя их методом конвертов, определим частоты каждой клетки корреляционной решетки (табл. 6).

Составление статистического ряда с помощью ПЭВМ

Существует множество пакетов программ, предназначенных для статистического анализа данных. С их помощью можно выполнить группировку исходных данных. Рассмотрим последовательность действий при выполнении этой работы с помощью пакета Statistica 6.0.

1.Запустить программу Statistica, нажав кнопку «Пуск» и вы-

брав следующие опции: «Программы», «Statistica 6.0», «Statistica».

2.Создать файл для исходных данных, активизировав опцию «Новый …» из меню «Файл».

3.В открывшемся диалоговом окне на вкладке «Крупноформатная таблица» надо установить необходимое количество переменных – 2 (высота и диаметр) и число регистров (наблюдений) – 200. После этого достаточно нажать кнопку «OK» в диалоговом окне создания нового документа и файл будет создан.

4.Присвоить переменным имена «D» и «H», открыв двойным щелчком левой кнопкой мыши по заголовку переменной диалоговое окно редактирования ее свойств и внеся необходимые изменения.

Рис. 5. Диалоговое окно, заполняемое при составлении вариационного ряда

11

12

Табл. 6. Распределение наблюдений по интервалам диаметра и высоты

D

16,1–19,2 19,3–22,4 22,5–25,6 25,7–28,8 28,9–32,0 32,1–35,2 35,3–38,4 38,5–41,6 41,7–44,8 44,9–48,0 48,1–51,2 51,3–54,4 54,5–57,6

Все

H

 

 

 

 

 

 

 

 

 

 

 

 

 

 

го

29,0–29,9

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

28,0–28,9

 

 

 

1

 

3

1

2

1

 

 

1

 

 

9

27,0–27,9

 

 

1

 

 

2

3

3

2

2

1

2

 

1

17

26,0–26,9

 

 

 

1

 

3

5

8

5

3

2

 

 

2

29

25,0–25,9

 

 

1

11

 

5

14

7

1

4

 

1

 

 

44

24,0–24,9

 

 

6

7

 

11

8

2

1

 

 

 

 

1

36

23,0–23,9

 

 

3

10

 

6

1

1

 

 

 

 

 

 

21

22,0–22,9

 

1

13

5

 

2

1

 

 

 

 

 

 

 

22

21,0–21,9

 

3

2

2

 

 

 

 

 

 

 

 

 

 

7

20,0–20,9

 

5

1

 

 

 

 

 

 

 

 

 

 

 

6

19,0–19,9

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

18,0–18,9

 

1

1

 

 

 

 

 

 

 

 

 

 

 

2

17,0–17,9

 

2

1

 

 

 

 

 

 

 

 

 

 

 

3

Итого

3

11

29

39

32

33

23

10

9

 

3

4

2

2

218

Рис. 6. Результат группировки данных, выполненной с помощью программы

Statistica

5.Ввести исходные данные и сохранить файл с ними с помощью опции «Сохранить» из меню «Файл», введя подходящее имя файла.

6.Выбрав опцию «Основная статистика / таблицы» из меню «Статистика», открыть диалоговое окно, содержащее локальное меню. Из данного меню выбрать опцию «Frequency tables», которая открыва-

ет диалоговое окно «Frequency Tables».

7.В открывшемся диалоговом окне нажать кнопку «Variables». После этого на экране появится еще одно диалоговое окно, содержащее список переменных. Выбрать какую-нибудь переменную, например D, щелкая по ней левой кнопкой мыши. Завершить выбор переменной нажатием кнопки «OK».

8.В диалоговом окне «Frequency Tables» надо выбрать вкладку «advanced». Затем с помощью мыши выбрать метод группировки данных с явным заданием интервалов «Step size». Ввести в поле «Step size» величину интервала 3,2 вариационного ряда по диаметрам. Щелкнув мышью, убрать флаг «at minimum» и ввести в поле «starting at» нижнюю границу самого первого интервала. Так как при выбранном нами варианте записи границ интервалов между верхней границей интервала и нижней границей следующего интервала есть промежуток, имеющий величину, соответствующую точности представле-

13

ния анализируемых данных, то фактическая граница между двумя интервалами будет находиться в середине данного промежутка. Это связано с округлением экспериментальных данных. В связи с этим в поле «starting at» для составления вариационного ряда по диаметрам ввести величину 16,05, которая на 0,05 меньше, чем нижняя граница первого интервала, записанная в табл. 4. На рис. 5 приведен вид диалогового окна «Frequency Tables» после того, как все необходимые поля были заполнены описанным выше образом.

9.Теперь остается только нажать кнопку «Summary: frequency tables», и группировка данных будет выполнена. Полученный результат приведен на рис. 6. Рассматриваемая таблица содержит границы интервалов в колонке «From to». В колонке «Count» записаны частоты вариационного ряда. Колонка «Cumulative count» содержит накоплен-

ные частоты, а колонки «Percent» и «Cumulative percent» – частоты и накопленные частоты полученного вариационного ряда, выраженные

впроцентах к общему количеству наблюдений.

10.Аналогичным образом может быть получен вариационный ряд и по высотам.

ВЫЧИСЛЕНИЕ ОСНОВНЫХ СТАТИСТИК

Для того чтобы можно было всесторонне проанализировать исследуемый признак, необходимо вычислить целый ряд статистических показателей, характеризующих объект исследования. Основные из них – следующие.

Средние величины

Среднее арифметическое значение. Этот показатель вычисляет-

ся по формуле

k

 

 

 

(xi f i )

(1)

x = i=1

n

,

где k – количество классов; xi – значение i-го класса (середина интервала, если ряд интервальный); f i – частота i-го класса. Средняя

арифметическая величина, вычисленная по формуле (1), называется

взвешенной.

Средняя арифметическая величина используется для оценки математического ожидания исследуемой случайной величины.

Среднее квадратическое значение. В том случае, если исходные данные сгруппированы в статистический ряд, среднее квадратическое значение можно вычислить следующим образом:

 

2 = 2

n (xi2 fi )

 

 

x

i=1

.

(2)

 

 

n

 

 

Среднее квадратическое значение используется лесоводами в качестве таксационного среднего диаметра древостоя. Это вызвано тем, что, согласно определяющему свойству, при замене всех элементов выборки на среднее квадратическое остается постоянной сумма квадратов элементов выборки. А эта величина позволяет вычислить сумму площадей сечений древостоя, являющуюся важнейшим таксационным показателем:

n

n

2

 

 

n

 

 

n

G = gi = π di

=

π

di2

=

π

 

 

2 ,

d

i=1

i=1

4

 

4

i=1

 

4

i=1

где G – сумма площадей сечения древостоя; gi – площадь сечения i-го

дерева; di – диаметр i-го дерева, π = 3,14; d – среднеквадратический диаметр древостоя.

15

Рассмотрим порядок вычисления средних величин на примере вариационных рядов по диаметрам и высотам (табл. 4 и 5). Для выполнения вычислений составим вспомогательную табл. 7.

Таблица 7. Вычисление средних значений (диаметры)

xi

fi

xi.fi

xi2

xi2.fi

gi

gi.fi

17,65

3

52,95

311,52

934,56

0,0245

0,0735

20,85

11

229,35

434,72

4781,92

0,0341

0,3751

24,05

29

697,45

578,40

16773,60

0,0454

1,3166

27,25

39

1062,75

742,56

28959,84

0,0583

2,2737

30,45

32

974,40

927,20

29670,40

0,0728

2,3296

33,65

33

1110,45

1132,32

37366,56

0,0889

2,9337

36,85

23

847,55

1357,92

31232,16

0,1067

2,4541

40,05

10

400,50

1604,00

16040,00

0,1260

1,2600

43,25

9

389,25

1870,56

16835,04

0,1469

1,3221

46,45

3

139,35

2157,60

6472,80

0,1695

0,5085

49,65

4

198,60

2465,12

9860,48

0,1936

0,7744

52,85

2

105,70

2793,12

5586,24

0,2194

0,4388

56,05

2

112,10

3141,60

6283,20

0,2467

0,4934

Сумма

200

6320,40

 

210796,80

 

16,5535

Теперь, пользуясь формулами (1) и (2), вычислим среднее арифметическое значение:

 

 

 

 

k

(x

 

f

 

)

 

 

 

 

 

 

 

 

i

i

6320,40

 

 

 

 

x

=

i=1

 

 

 

=

= 31,60 см

(3)

 

 

n

 

 

 

200

 

 

 

 

 

 

 

 

 

 

 

 

и среднее квадратическое:

 

 

 

 

 

 

 

 

n (xi2 fi )

 

 

 

 

 

2 = 2

i=1

 

 

 

 

= 2 210796,80

= 32,47

см.

 

x

n

 

 

 

 

 

 

 

 

 

 

 

 

200

 

 

Теперь на основе полученной средней квадратической вычислим сумму площадей сечений древостоя. Для этого определим площадь сечения, соответствующую среднеквадратическому диаметру:

g =

π d 2

=

3,14 32,472

= 827,63 см2 = 0,082763 м2 .

4

4

 

 

 

Умножив

полученную

величину на число стволов, получим

сумму площадей сечений древостоя:

G = g n = 0,082763 200 =16,5526 м2.

16

Сравнивая полученную величину с площадью сечения, вычисленной по данным ряда диаметров (табл. 7), видим, что среднее квадратическое значение позволяет очень точно определять важнейший таксационный показатель – сумму площадей сечений древостоя.

Аналогичным образом определим средние значения для ряда высот. Сначала составим вспомогательную табл. 8.

Таблица 8. Вычисление средних значений (высоты)

 

 

 

 

 

 

xi

fi

xi.fi

xi2

xi2.fi

17,45

3

52,35

304,50

913,50

18,45

2

36,90

340,40

680,80

19,45

2

38,90

378,30

756,60

20,45

6

122,70

418,20

2509,20

21,45

7

150,15

460,10

3220,70

22,45

22

493,90

504,00

11088,00

23,45

21

492,45

549,90

11547,90

24,45

36

880,20

597,80

21520,80

25,45

44

1119,80

647,70

28498,80

26,45

29

767,05

699,60

20288,40

27,45

17

466,65

753,50

12809,50

28,45

9

256,05

809,40

7284,60

29,45

2

58,90

867,30

1734,60

Сумма

200

4936,00

 

122853,40

Далее, подставляя полученные суммы в

формулы (1) и (2), вы-

числяем среднее арифметическое значение:

 

 

 

 

 

k

(x

 

f

 

)

 

 

 

 

 

 

 

 

i

i

4936,00

 

 

 

 

 

x

=

i=1

 

 

 

=

= 24,68 м

 

(4)

 

 

n

 

 

 

 

 

 

 

 

 

 

 

200

 

 

 

 

и среднее квадратическое:

 

 

 

 

 

 

 

 

n (xi2 fi )

 

 

 

 

 

 

2 = 2

i=1

 

 

= 2 122853,40

= 24,78

м.

 

 

x

n

 

 

 

 

 

 

 

 

 

 

200

 

 

 

Показатели вариации

Средние величины указывают на то значение признака, вокруг которого группируются анализируемые наблюдения. Однако вокруг

17

одного и того же значения признака наблюдения могут располагаться совершенно по-разному. Для того чтобы отразить характер расположения наблюдений вокруг среднего, и служат показатели вариации. Рассмотрим некоторые из них.

Размах вариации. Это наиболее простой показатель, характеризующий распределение вариант вокруг среднего. Он вычисляется как разность между максимальным и минимальным значениями признака, которые в биометрии называют также лимитами (от латинского слова limes – предел) и обозначают символом lim:

R = xmax xmin .

Если наблюдения плотно группируются вокруг среднего, то лимиты располагаются близко друг к другу и размах вариации оказывается небольшим. Если же разброс данных велик, то, как правило, минимальная и максимальная варианты располагаются далеко друг от друга и размах вариации получается большим.

Однако размах вариации является ненадежным показателем, так как он вычисляется на основании значений лимитов, а последние, в свою очередь, являются очень неустойчивыми статистиками и могут значительно варьировать от выборки к выборке. Кроме того, так как при вычислении размаха вариации используются только две крайние варианты, то он не дает нам никакой информации о характере распределения всех остальных вариант, располагающихся ближе к среднему.

Эмпирическая дисперсия. Этот показатель получил свое название от латинского слова dispersio – рассеяние. Это не что иное, как средний квадрат отклонений вариант от среднего арифметического. Вычисляется дисперсия так:

 

k

 

 

Sx2 =

fi (xi

x

)2

 

 

i=1

.

(5)

n

 

 

 

Выборочная дисперсия, рассчитанная по формуле (5), дает смещенную оценку генеральной дисперсии. Для того чтобы получить несмещенную оценку, в формулу необходимо добавить сомножитель

n

 

, называемый поправкой Бесселя:

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

k

 

 

 

 

σ2x = Sx2

n

 

 

fi (xi

x

)2

 

 

n

 

 

fi (xi

x

)2

 

 

 

 

=

i=1

 

 

 

 

 

=

i=1

.

(6)

 

 

n 1

n

 

 

 

n 1

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18

 

 

 

 

 

 

 

 

Величина n 1 из формулы (6) называется числом степеней свободы. Она показывает, сколько в данном случае имеется независимых наблюдений.

Среднеквадратическое отклонение. Дисперсия часто применя-

ется для оценки вариации данных, однако иногда для характеристики изменчивости признака удобнее использовать среднеквадратическое отклонение, которое является квадратным корнем из дисперсии:

 

k

 

 

Sx =

fi (xi x)2

 

 

i =1

– смещенная оценка;

(7)

 

n

 

 

 

k

 

 

σx =

fi (xi x)2

 

 

i =1

– несмещенная оценка.

(8)

 

n 1

 

 

В отличие от дисперсии, среднеквадратическое отклонение выражается в тех же единицах измерения, что и анализируемый признак. В связи с этим данный показатель является более естественным и легче поддается анализу.

Коэффициент вариации. Дисперсия и среднеквадратическое отклонение довольно полно характеризуют вариацию, однако часто удобнее иметь показатель, оценивающий разброс данных не в абсолютных величинах, а в относительных. Таким показателем является коэффициент вариации. Он показывает, сколько процентов составляет среднеквадратическое отклонение от среднего арифметического:

V =

σx 100%.

(9)

 

x

 

В биометрии этот показатель часто оказывается весьма полезным. Дело в том, что анализу подвергаются, как правило, объекты живой природы, а они с течением времени изменяют свои размеры, растут. В связи с этим часто необходимо анализировать выборки, сделанные для объектов с разным средним возрастом, а следовательно, и с разными средними размерами. Если в таких случаях необходимо сравнить степень изменчивости признака в разных выборках, то удобнее оперировать коэффициентом вариации, так как он дает нам величину вариации по отношению к среднему значению.

Коэффициент асимметрии. Рассмотренные выше показатели довольно полно характеризуют анализируемые признаки, однако ни один из них не отражает степень симметричности распределения на-

19