лесная биометрия
.pdf
Наиболее выразительными графики получаются, если при их построении соблюдать правило золотого сечения, согласно которому основание графика должно относиться к его высоте как 8:5 = 1:0,625.
границы классовых интервалов
35
30
25
20
15
10
5
0
0 |
50 |
100 |
150 |
200 |
250 |
накопленные частоты
Рис. 4. Огива распределения сосновых стволов по высотам
Составление таблицы распределения
Наряду с простой группировкой данных в интервальные вариационные ряды в некоторых случаях целесообразно сгруппировать данные сразу по двум параметрам. Эта потребность, как правило, возникает в том случае, если необходимо проанализировать связь между двумя случайными величинами. В таких случаях составляют так называемые таблицы распределения (корреляционные таблицы, корреляционные решетки).
Для примера составим таблицу распределения 200 деревьев по интервалам диаметра и высоты в чистом сосновом древостое по данным, приведенным в последних четырех столбцах табл. 1 приложения с номерами 17, 18, 19 и 20. Для этого воспользуемся интервалами рядов распределения деревьев по диаметрам (табл. 4) и высотам (табл. 5). Впишем границы интервалов вариационного ряда по диаметрам в первую строку таблицы 6, а границы вариационного ряда по высотам – в первую колонку. Затем, распределяя наблюдения одно-
10
временно по интервалам диаметров и высот и регистрируя их методом конвертов, определим частоты каждой клетки корреляционной решетки (табл. 6).
Составление статистического ряда с помощью ПЭВМ
Существует множество пакетов программ, предназначенных для статистического анализа данных. С их помощью можно выполнить группировку исходных данных. Рассмотрим последовательность действий при выполнении этой работы с помощью пакета Statistica 6.0.
1.Запустить программу Statistica, нажав кнопку «Пуск» и вы-
брав следующие опции: «Программы», «Statistica 6.0», «Statistica».
2.Создать файл для исходных данных, активизировав опцию «Новый …» из меню «Файл».
3.В открывшемся диалоговом окне на вкладке «Крупноформатная таблица» надо установить необходимое количество переменных – 2 (высота и диаметр) и число регистров (наблюдений) – 200. После этого достаточно нажать кнопку «OK» в диалоговом окне создания нового документа и файл будет создан.
4.Присвоить переменным имена «D» и «H», открыв двойным щелчком левой кнопкой мыши по заголовку переменной диалоговое окно редактирования ее свойств и внеся необходимые изменения.
Рис. 5. Диалоговое окно, заполняемое при составлении вариационного ряда
11
12
Табл. 6. Распределение наблюдений по интервалам диаметра и высоты
D |
16,1–19,2 19,3–22,4 22,5–25,6 25,7–28,8 28,9–32,0 32,1–35,2 35,3–38,4 38,5–41,6 41,7–44,8 44,9–48,0 48,1–51,2 51,3–54,4 54,5–57,6 |
Все |
|||||||||||||
H |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
го |
29,0–29,9 |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
2 |
28,0–28,9 |
|
|
|
1 |
|
3 |
1 |
2 |
1 |
|
|
1 |
|
|
9 |
27,0–27,9 |
|
|
1 |
|
|
2 |
3 |
3 |
2 |
2 |
1 |
2 |
|
1 |
17 |
26,0–26,9 |
|
|
|
1 |
|
3 |
5 |
8 |
5 |
3 |
2 |
|
|
2 |
29 |
25,0–25,9 |
|
|
1 |
11 |
|
5 |
14 |
7 |
1 |
4 |
|
1 |
|
|
44 |
24,0–24,9 |
|
|
6 |
7 |
|
11 |
8 |
2 |
1 |
|
|
|
|
1 |
36 |
23,0–23,9 |
|
|
3 |
10 |
|
6 |
1 |
1 |
|
|
|
|
|
|
21 |
22,0–22,9 |
|
1 |
13 |
5 |
|
2 |
1 |
|
|
|
|
|
|
|
22 |
21,0–21,9 |
|
3 |
2 |
2 |
|
|
|
|
|
|
|
|
|
|
7 |
20,0–20,9 |
|
5 |
1 |
|
|
|
|
|
|
|
|
|
|
|
6 |
19,0–19,9 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
18,0–18,9 |
|
1 |
1 |
|
|
|
|
|
|
|
|
|
|
|
2 |
17,0–17,9 |
|
2 |
1 |
|
|
|
|
|
|
|
|
|
|
|
3 |
Итого |
3 |
11 |
29 |
39 |
32 |
33 |
23 |
10 |
9 |
|
3 |
4 |
2 |
2 |
218 |
Рис. 6. Результат группировки данных, выполненной с помощью программы
Statistica
5.Ввести исходные данные и сохранить файл с ними с помощью опции «Сохранить» из меню «Файл», введя подходящее имя файла.
6.Выбрав опцию «Основная статистика / таблицы» из меню «Статистика», открыть диалоговое окно, содержащее локальное меню. Из данного меню выбрать опцию «Frequency tables», которая открыва-
ет диалоговое окно «Frequency Tables».
7.В открывшемся диалоговом окне нажать кнопку «Variables». После этого на экране появится еще одно диалоговое окно, содержащее список переменных. Выбрать какую-нибудь переменную, например D, щелкая по ней левой кнопкой мыши. Завершить выбор переменной нажатием кнопки «OK».
8.В диалоговом окне «Frequency Tables» надо выбрать вкладку «advanced». Затем с помощью мыши выбрать метод группировки данных с явным заданием интервалов «Step size». Ввести в поле «Step size» величину интервала 3,2 вариационного ряда по диаметрам. Щелкнув мышью, убрать флаг «at minimum» и ввести в поле «starting at» нижнюю границу самого первого интервала. Так как при выбранном нами варианте записи границ интервалов между верхней границей интервала и нижней границей следующего интервала есть промежуток, имеющий величину, соответствующую точности представле-
13
ния анализируемых данных, то фактическая граница между двумя интервалами будет находиться в середине данного промежутка. Это связано с округлением экспериментальных данных. В связи с этим в поле «starting at» для составления вариационного ряда по диаметрам ввести величину 16,05, которая на 0,05 меньше, чем нижняя граница первого интервала, записанная в табл. 4. На рис. 5 приведен вид диалогового окна «Frequency Tables» после того, как все необходимые поля были заполнены описанным выше образом.
9.Теперь остается только нажать кнопку «Summary: frequency tables», и группировка данных будет выполнена. Полученный результат приведен на рис. 6. Рассматриваемая таблица содержит границы интервалов в колонке «From to». В колонке «Count» записаны частоты вариационного ряда. Колонка «Cumulative count» содержит накоплен-
ные частоты, а колонки «Percent» и «Cumulative percent» – частоты и накопленные частоты полученного вариационного ряда, выраженные
впроцентах к общему количеству наблюдений.
10.Аналогичным образом может быть получен вариационный ряд и по высотам.
ВЫЧИСЛЕНИЕ ОСНОВНЫХ СТАТИСТИК
Для того чтобы можно было всесторонне проанализировать исследуемый признак, необходимо вычислить целый ряд статистических показателей, характеризующих объект исследования. Основные из них – следующие.
Средние величины
Среднее арифметическое значение. Этот показатель вычисляет-
ся по формуле
k |
|
|
|
∑(xi f i ) |
(1) |
||
x = i=1 |
n |
, |
|
где k – количество классов; xi – значение i-го класса (середина интервала, если ряд интервальный); f i – частота i-го класса. Средняя
арифметическая величина, вычисленная по формуле (1), называется
взвешенной.
Средняя арифметическая величина используется для оценки математического ожидания исследуемой случайной величины.
Среднее квадратическое значение. В том случае, если исходные данные сгруппированы в статистический ряд, среднее квадратическое значение можно вычислить следующим образом:
|
2 = 2 |
∑n (xi2 fi ) |
|
|
x |
i=1 |
. |
(2) |
|
|
|
n |
|
|
Среднее квадратическое значение используется лесоводами в качестве таксационного среднего диаметра древостоя. Это вызвано тем, что, согласно определяющему свойству, при замене всех элементов выборки на среднее квадратическое остается постоянной сумма квадратов элементов выборки. А эта величина позволяет вычислить сумму площадей сечений древостоя, являющуюся важнейшим таксационным показателем:
n |
n |
2 |
|
|
n |
|
|
n |
||
G = ∑gi = ∑π di |
= |
π |
∑di2 |
= |
π |
|
|
2 , |
||
∑d |
||||||||||
i=1 |
i=1 |
4 |
|
4 |
i=1 |
|
4 |
i=1 |
||
где G – сумма площадей сечения древостоя; gi – площадь сечения i-го
дерева; di – диаметр i-го дерева, π = 3,14; d – среднеквадратический диаметр древостоя.
15
Рассмотрим порядок вычисления средних величин на примере вариационных рядов по диаметрам и высотам (табл. 4 и 5). Для выполнения вычислений составим вспомогательную табл. 7.
Таблица 7. Вычисление средних значений (диаметры)
xi |
fi |
xi.fi |
xi2 |
xi2.fi |
gi |
gi.fi |
17,65 |
3 |
52,95 |
311,52 |
934,56 |
0,0245 |
0,0735 |
20,85 |
11 |
229,35 |
434,72 |
4781,92 |
0,0341 |
0,3751 |
24,05 |
29 |
697,45 |
578,40 |
16773,60 |
0,0454 |
1,3166 |
27,25 |
39 |
1062,75 |
742,56 |
28959,84 |
0,0583 |
2,2737 |
30,45 |
32 |
974,40 |
927,20 |
29670,40 |
0,0728 |
2,3296 |
33,65 |
33 |
1110,45 |
1132,32 |
37366,56 |
0,0889 |
2,9337 |
36,85 |
23 |
847,55 |
1357,92 |
31232,16 |
0,1067 |
2,4541 |
40,05 |
10 |
400,50 |
1604,00 |
16040,00 |
0,1260 |
1,2600 |
43,25 |
9 |
389,25 |
1870,56 |
16835,04 |
0,1469 |
1,3221 |
46,45 |
3 |
139,35 |
2157,60 |
6472,80 |
0,1695 |
0,5085 |
49,65 |
4 |
198,60 |
2465,12 |
9860,48 |
0,1936 |
0,7744 |
52,85 |
2 |
105,70 |
2793,12 |
5586,24 |
0,2194 |
0,4388 |
56,05 |
2 |
112,10 |
3141,60 |
6283,20 |
0,2467 |
0,4934 |
Сумма |
200 |
6320,40 |
|
210796,80 |
|
16,5535 |
Теперь, пользуясь формулами (1) и (2), вычислим среднее арифметическое значение:
|
|
|
|
k |
(x |
|
f |
|
) |
|
|
|
|
|
|
|
|
|
∑ |
i |
i |
6320,40 |
|
|
|
||||
|
x |
= |
i=1 |
|
|
|
= |
= 31,60 см |
(3) |
|||||
|
|
n |
|
|
|
200 |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||
и среднее квадратическое: |
|
|
|
|||||||||||
|
|
|
|
|
∑n (xi2 fi ) |
|
|
|
||||||
|
|
2 = 2 |
i=1 |
|
|
|
|
= 2 210796,80 |
= 32,47 |
см. |
||||
|
x |
n |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
200 |
|
|
||
Теперь на основе полученной средней квадратической вычислим сумму площадей сечений древостоя. Для этого определим площадь сечения, соответствующую среднеквадратическому диаметру:
g = |
π d 2 |
= |
3,14 32,472 |
= 827,63 см2 = 0,082763 м2 . |
|
4 |
4 |
||||
|
|
|
|||
Умножив |
полученную |
величину на число стволов, получим |
|||
сумму площадей сечений древостоя:
G = g n = 0,082763 200 =16,5526 м2.
16
Сравнивая полученную величину с площадью сечения, вычисленной по данным ряда диаметров (табл. 7), видим, что среднее квадратическое значение позволяет очень точно определять важнейший таксационный показатель – сумму площадей сечений древостоя.
Аналогичным образом определим средние значения для ряда высот. Сначала составим вспомогательную табл. 8.
Таблица 8. Вычисление средних значений (высоты) |
|
|||
|
|
|
|
|
xi |
fi |
xi.fi |
xi2 |
xi2.fi |
17,45 |
3 |
52,35 |
304,50 |
913,50 |
18,45 |
2 |
36,90 |
340,40 |
680,80 |
19,45 |
2 |
38,90 |
378,30 |
756,60 |
20,45 |
6 |
122,70 |
418,20 |
2509,20 |
21,45 |
7 |
150,15 |
460,10 |
3220,70 |
22,45 |
22 |
493,90 |
504,00 |
11088,00 |
23,45 |
21 |
492,45 |
549,90 |
11547,90 |
24,45 |
36 |
880,20 |
597,80 |
21520,80 |
25,45 |
44 |
1119,80 |
647,70 |
28498,80 |
26,45 |
29 |
767,05 |
699,60 |
20288,40 |
27,45 |
17 |
466,65 |
753,50 |
12809,50 |
28,45 |
9 |
256,05 |
809,40 |
7284,60 |
29,45 |
2 |
58,90 |
867,30 |
1734,60 |
Сумма |
200 |
4936,00 |
|
122853,40 |
Далее, подставляя полученные суммы в |
формулы (1) и (2), вы- |
|||||||||||||
числяем среднее арифметическое значение: |
|
|
||||||||||||
|
|
|
k |
(x |
|
f |
|
) |
|
|
|
|
|
|
|
|
|
∑ |
i |
i |
4936,00 |
|
|
|
|
||||
|
x |
= |
i=1 |
|
|
|
= |
= 24,68 м |
|
(4) |
||||
|
|
n |
|
|
|
|
|
|||||||
|
|
|
|
|
|
200 |
|
|
|
|
||||
и среднее квадратическое: |
|
|
|
|
||||||||||
|
|
|
|
∑n (xi2 fi ) |
|
|
|
|
||||||
|
|
2 = 2 |
i=1 |
|
|
= 2 122853,40 |
= 24,78 |
м. |
|
|||||
|
x |
n |
|
|||||||||||
|
|
|
|
|
|
|
|
|
200 |
|
|
|
||
Показатели вариации
Средние величины указывают на то значение признака, вокруг которого группируются анализируемые наблюдения. Однако вокруг
17
одного и того же значения признака наблюдения могут располагаться совершенно по-разному. Для того чтобы отразить характер расположения наблюдений вокруг среднего, и служат показатели вариации. Рассмотрим некоторые из них.
Размах вариации. Это наиболее простой показатель, характеризующий распределение вариант вокруг среднего. Он вычисляется как разность между максимальным и минимальным значениями признака, которые в биометрии называют также лимитами (от латинского слова limes – предел) и обозначают символом lim:
R = xmax − xmin .
Если наблюдения плотно группируются вокруг среднего, то лимиты располагаются близко друг к другу и размах вариации оказывается небольшим. Если же разброс данных велик, то, как правило, минимальная и максимальная варианты располагаются далеко друг от друга и размах вариации получается большим.
Однако размах вариации является ненадежным показателем, так как он вычисляется на основании значений лимитов, а последние, в свою очередь, являются очень неустойчивыми статистиками и могут значительно варьировать от выборки к выборке. Кроме того, так как при вычислении размаха вариации используются только две крайние варианты, то он не дает нам никакой информации о характере распределения всех остальных вариант, располагающихся ближе к среднему.
Эмпирическая дисперсия. Этот показатель получил свое название от латинского слова dispersio – рассеяние. Это не что иное, как средний квадрат отклонений вариант от среднего арифметического. Вычисляется дисперсия так:
|
k |
|
|
|||
Sx2 = |
∑ fi (xi − |
x |
)2 |
|
|
|
i=1 |
. |
(5) |
||||
n |
||||||
|
|
|
||||
Выборочная дисперсия, рассчитанная по формуле (5), дает смещенную оценку генеральной дисперсии. Для того чтобы получить несмещенную оценку, в формулу необходимо добавить сомножитель
n |
|
, называемый поправкой Бесселя: |
|
|
|
|
|
|
|||||||||||
n −1 |
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
k |
|
|
||
|
|
σ2x = Sx2 |
n |
|
|
∑ fi (xi |
− |
x |
)2 |
|
|
n |
|
|
∑ fi (xi − |
x |
)2 |
|
|
|
|
= |
i=1 |
|
|
|
|
|
= |
i=1 |
. |
(6) |
|||||||
|
|
n −1 |
n |
|
|
|
n −1 |
n −1 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
18 |
|
|
|
|
|
|
|
|
||||
Величина n −1 из формулы (6) называется числом степеней свободы. Она показывает, сколько в данном случае имеется независимых наблюдений.
Среднеквадратическое отклонение. Дисперсия часто применя-
ется для оценки вариации данных, однако иногда для характеристики изменчивости признака удобнее использовать среднеквадратическое отклонение, которое является квадратным корнем из дисперсии:
|
k |
|
|
Sx = |
∑ fi (xi − x)2 |
|
|
i =1 |
– смещенная оценка; |
(7) |
|
|
n |
|
|
|
k |
|
|
σx = |
∑ fi (xi − x)2 |
|
|
i =1 |
– несмещенная оценка. |
(8) |
|
|
n −1 |
|
|
В отличие от дисперсии, среднеквадратическое отклонение выражается в тех же единицах измерения, что и анализируемый признак. В связи с этим данный показатель является более естественным и легче поддается анализу.
Коэффициент вариации. Дисперсия и среднеквадратическое отклонение довольно полно характеризуют вариацию, однако часто удобнее иметь показатель, оценивающий разброс данных не в абсолютных величинах, а в относительных. Таким показателем является коэффициент вариации. Он показывает, сколько процентов составляет среднеквадратическое отклонение от среднего арифметического:
V = |
σx 100%. |
(9) |
|
x |
|
В биометрии этот показатель часто оказывается весьма полезным. Дело в том, что анализу подвергаются, как правило, объекты живой природы, а они с течением времени изменяют свои размеры, растут. В связи с этим часто необходимо анализировать выборки, сделанные для объектов с разным средним возрастом, а следовательно, и с разными средними размерами. Если в таких случаях необходимо сравнить степень изменчивости признака в разных выборках, то удобнее оперировать коэффициентом вариации, так как он дает нам величину вариации по отношению к среднему значению.
Коэффициент асимметрии. Рассмотренные выше показатели довольно полно характеризуют анализируемые признаки, однако ни один из них не отражает степень симметричности распределения на-
19
