
лесная биометрия
.pdf
|
|
|
25 200 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
− |
42 |
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
+1,0 |
|
|
|
|
|
|
|
|
= |
23,45 − 0,5 +1,0 0,3810 = 23,33; |
||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
21 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
50 n |
|
j−1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
− ∑ fi |
|
||||
|
|
|
|
|
|
|
|
|
|
− λ |
|
100 |
1,0 + |
|||||||||||
Me =Q |
= P |
= x |
50 |
|
+ λ |
|
i=1 |
|
= 25,45 − |
|||||||||||||||
|
|
|
|
|
|
|||||||||||||||||||
|
|
2 |
|
50 |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
f50 |
|
|
2 |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
50 200 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
−99 |
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
+1,0 |
|
|
|
|
|
|
|
|
= |
25,45 − 0,5 +1,0 0,0227 = 24,97 ; |
||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
44 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
75 n |
|
j−1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
− ∑ fi |
|
|
|
||||
|
|
|
|
|
|
|
|
λ |
|
|
|
|
100 |
|
26,45 −1,0 + |
|
||||||||
Q |
= P |
|
|
= x |
75 |
− |
+ λ |
|
i=1 |
|
= |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
3 |
75 |
|
|
|
2 |
|
|
|
|
|
|
|
|
f75 |
|
|
2 |
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
75 200 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
−143 |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
+1,0 |
|
|
|
|
|
|
|
|
= 26,45 − 0,5 +1,0 0,2414 = 26,19 . |
|||||||||||||||
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
29 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вычисление основных статистик с помощью ПЭВМ
Вычисление основных статистик с помощью пакета Statistica 6.0 можно выполнить следующим образом.
1.Запустить программу Statistica, нажав кнопку «Пуск» и вы-
брав следующие опции: «Программы», «Statistica 6.0», «Statistica».
2.Открыть созданный ранее файл с исходными данными, активизировав опцию «Открыть …» из меню «Файл».
3.Выбрав опцию «Основная статистика/таблицы» из меню «Статистика», открыть диалоговое окно, содержащее локальное меню. Из данного меню выбрать опцию «Descriptive statistics», активизировав ее кнопкой «OK».
4.В открывшемся диалоговом окне «Descriptive Statistics» нажмем кнопку «Variables». После этого на экране появится еще одно
30

диалоговое окно, содержащее список переменных. Выбрать какуюнибудь переменную, или сразу все, нажав кнопку «Select All». Завершить выбор переменных нажатием кнопки «OK».
5.Далее в диалоговом окне «Descriptive Statistics» надо выбрать вкладку «advanced». Затем с помощью мыши установить флажки против тех статистик, которые следует вычислить, или выбрать все параметры, нажав кнопку «Advanced».
6.Для выполнения вычислений следует нажать кнопку «Summary». На экране появится таблица, содержащая вычисленные основные статистики для выбранных переменных (рис. 7). Полученные результаты сведены в табл. 11, где, кроме статистик, приведены английские названия вычисленных показателей, используемые в программе Statistica, и их русские эквиваленты.
Рис. 7. Результаты вычисления основных статистик с помощью программы Statistica
Построение доверительных интервалов
Доверительным интервалом для параметра θ называется интервал ]Θ€ −ε;Θ€ + ε[, который с заданной доверительной вероятностью
p = 1–α накрывает этот параметр. Построим доверительные интервалы для параметров нормального распределения. Это распределение имеет два параметра: m – математическое ожидание и σ – среднеквадратическое отклонение. В том случае, если точечные оценки параметров m и σ получены на основании выборки, доверительный интервал для математического ожидания строится с использованием квантилей распределения Стьюдента для уровня значимости α/2 и числа степеней свободы n–1 (прил., табл. 3) следующим образом:
31

Таблица 11. Основные статистики для диаметров и высот деревьев в
древостое
Название показателя |
|
Название показателя, |
Значение |
Значение |
||
|
|
используемое |
в |
показателя |
показателя |
|
|
|
программе Statistica |
|
для |
ряда |
для ряда |
|
|
|
|
диаметров |
высот |
|
Число наблюдений |
|
Valid N |
|
200 |
|
200 |
Среднее арифметическое |
Mean |
|
31,52300 |
24,70550 |
||
Нижний доверительный предел |
Confidence –95,000% |
30,48563 |
24,38990 |
|||
Верхний доверительный предел |
Confidence +95,000% |
32,56037 |
25,02110 |
|||
Среднее геометрическое |
Geometric Mean |
|
30,70058 |
24,59623 |
||
Среднее гармоническое |
Harmonic Mean |
|
29,91934 |
24,47994 |
||
Медиана |
|
Median |
|
30,60000 |
25,00000 |
|
Мода |
|
Mode |
|
32,60000 |
25,60000 |
|
Частота модальной варианты |
Frequency of Mode |
|
7 |
|
12 |
|
Сумма |
|
Sum |
|
6304,600 |
4941,100 |
|
Минимальное значение |
|
Minimum |
|
17,70000 |
17,50000 |
|
Максимальное значение |
Maximum |
|
56,60000 |
59,60000 |
||
|
|
Lower quartile |
|
26,35000 |
23,45000 |
|
|
|
Upper Quartile |
|
36,00000 |
26,00000 |
|
|
|
Percentile 10,00000 |
|
22,60000 |
21,95000 |
|
|
|
Percentile 90,00000 |
|
41,50000 |
27,50000 |
|
Размах вариации |
|
Range |
|
38,90000 |
12,10000 |
|
|
|
Quartile Range |
|
9,650000 |
2,550000 |
|
Дисперсия |
|
Variance |
|
55,34791 |
5,12283 |
|
Стандартное отклонений |
Std.Dev. |
|
7,439618 |
2,263368 |
||
Стандартная ошибка среднего |
Standard Error |
|
0,526060 |
0,160044 |
||
Коэффициент асимметрии |
Skewnwss |
|
0,825890 |
–0,714364 |
||
Стандартная ошибка |
коэффи- |
Std.Err.Skewness |
|
0,171925 |
0,171925 |
|
циента асимметрии |
|
|
|
|
|
|
Коэффициент эксцесса |
|
Kurtosis |
|
0,888992 |
0,781475 |
|
Стандартная ошибка |
коэффи- |
Std.Err. Kurtosis |
|
0,342202 |
0,342202 |
|
циента эксцесса |
|
|
|
|
|
|
|
σ |
;m +tα/ 2,n−1 |
σ |
(18) |
m −tα/ 2,n−1 |
n |
. |
||
|
|
n |
|
|
Доверительный интервал для среднеквадратического отклоне- |
||||
ния σ строится следующим образом: |
|
|||
]σ γ1;σγ2 [, |
|
|
|
(19) |
|
|
|
32 |
|

где |
γ |
1 |
= |
n −1 |
; γ |
2 |
= |
n −1 |
; χ2 |
и χ2 |
– квантили |
|
|
|
χ2 |
|
|
χ2 |
α/ 2,n−1 |
1−α/ 2,n−1 |
|
||
|
|
|
|
α/ 2,n−1 |
|
|
|
1−α/ 2,n−1 |
|
|
|
распределения χ2, соответствующие числу степеней свободы γ = n–1 и уровням значимости α/2 и 1–α/2. Коэффициенты γ1 и γ2 приведены в прил. (табл. 4).
Рассмотрим пример вычисления доверительных интервалов для параметров нормального распределения по материалам вариационных рядов диаметров и высот. Используя средние арифметические двухсот измеренных диаметров и высот, вычисленные ранее (3) и (4), а также среднеквадратические отклонения (13) и (14) и исходя из предположения, что диаметры деревьев подчиняются закону нормального распределения, найдем доверительные интервалы, накрывающие параметры m и σ с доверительной вероятностью 0,95. В таблице квантилей
распределения Стьюдента 3 в приложении находим t0,025;199 = 1,972. Тогда доверительный интервал для среднего арифметического значе-
ния с учетом выражения (18) будет |
|
|
|
|||||
диаметры |
|
7,455 |
|
|
|
7,455 |
|
|
|
−1,972 |
|
; 31,60 |
+1,972 |
|
|
||
31,60 |
200 |
, или ]30,560; 32,640[; |
||||||
|
|
|
|
|
|
200 |
|
|
высоты |
|
2,278 |
|
|
|
2,278 |
|
|
|
−1,972 |
|
; 24,68 +1,972 |
, или ]24,362; 24,998[. |
||||
24,68 |
200 |
|
||||||
|
|
|
|
|
|
200 |
|
Для того чтобы вычислить границы доверительных интервалов для среднеквадратического отклонения, найдем по табл. 4 прил. коэффициенты γ1 = 0,912 и γ2 = 1,11 для уровня значимости α = 0,05. Используя точечные оценки среднеквадратических отклонений для данных по диаметрам (13) и высотам (14) и с учетом выражения (19), получаем доверительные интервал для среднего квадратического отклонения:
]7,455 0,912; 7,455 1,11[, или ]6,799; 8,275[ – диаметры; ]2,278 0,912; 2,278 1,11[, или ]2,078; 2,529[ – высоты.
33

АНАЛИЗ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
Любая случайная величина подчинена какому-либо, как правило, неизвестному закону распределения. Одной из задач биометрии и является определение закона распределения анализируемой случайной величины. Обычно решение этой задачи начинается с проверки гипотезы о нормальном распределении данных.
Нормальное распределение
Нормальное распределение имеет важное значение в биометрии. На практике очень часто исследуемые случайные величины следуют этому закону. Для того чтобы узнать, подчиняется случайная величина закону нормального распределения или нет, надо вычислить теоретические частоты вариационного ряда исходя из предположения о нормальном распределении анализируемого параметра и сравнить их с эмпирическими частотами.
Закон распределения случайной величины может быть описан с помощью функции, определяемой соотношением
FX (x) = P(X < x)
и называемой функцией распределения величины X.
Разность F (b) − F (a) представляет собой вероятность того, что случайная величина X примет значение, принадлежащее интервалу a ≤ X < b, т. е. если a и b являются нижней и верхней границами интервала вариационного ряда, то вероятность попадания изучаемой случайной величины в данный интервал можно вычислить так:
Pa,b = P(a ≤ X < b) = F(b) − F(a) . |
(20) |
Зная эту величину, нетрудно вычислить теоретическое число наблюдений для данного интервала fa,b = n Pa,b .
Функция нормального распределения F(x) имеет вид
x |
1 |
x |
(z −m)2 |
|
|
F(x) = ∫P(z)dz = |
∫e− |
2 σ2 |
dz . |
(21) |
|
−∞ |
σ 2 π −∞ |
|
|
|
Сучетом функции нормального распределения (21) выражение
(20)можно переписать следующим образом:
34

|
|
|
1 |
b e− |
(z−m)2 |
1 |
a e− |
(z−m)2 |
||
P |
= P(a ≤ X <b) = |
|
2 σ2 |
dz − |
2 σ2 |
dz . (22) |
||||
a,b |
|
σ |
2 π −∫∞ |
|
|
σ 2 π −∫∞ |
|
|
||
|
|
|
|
|
|
Интегралы, входящие в это выражение, нельзя выразить через элементарные функции, но их можно вычислить через специальную функцию:
|
1 |
x |
− |
t 2 |
|
F(x) = |
∫e |
2 |
dt , |
||
|
2 π −∞ |
|
|
|
которая является интегральной функцией нормального распределения с параметрами m = 0 и σ = 1. Для этого следует перейти к нормиро-
ванной случайной величине:
T = X σ−m .
Преобразовав неравенство a ≤ X < b |
|
|
соответствующим обра- |
||||||||||||||||||||||||||||||||||||||
зом, получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
a −m |
≤ |
X −m |
< |
b −m |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
σ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
σ |
|
|
|
|
|
|
σ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Эти два неравенства равносильны, следовательно, их вероятно- |
|||||||||||||||||||||||||||||||||||||||||
сти равны между собой: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
a −m |
|
|
|
X −m |
|
|
a −m |
|
|
|
|
|
|
|||||||||||||||
|
P(a ≤ X < b) = P |
|
|
|
|
≤ |
|
|
|
|
|
|
|
|
< |
|
|
. |
|
|
|
(23) |
|||||||||||||||||||
|
σ |
|
|
|
|
|
σ |
|
|
σ |
|
|
|
|
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
Используя (22) и (23), получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a −m |
|
|
|
X −m |
|
|
|
a −m |
|
||||||||||||||
|
Pa,b = P(a ≤ |
X < b) = P |
|
|
|
|
|
|
|
≤ |
|
|
|
|
< |
|
|
|
|
= P(t1 |
≤T < t2 ) = |
||||||||||||||||||||
|
|
|
|
σ |
|
|
|
σ |
|
|
σ |
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
1 |
|
|
|
|
|
b |
(z −m)2 |
|
|
|
|
|
|
|
1 |
|
|
|
|
a |
|
(z −m)2 |
|
|
|
|
||||||||||||
= |
|
|
|
|
|
∫e− |
|
2 σ2 |
dz − |
|
|
|
|
|
|
∫e− |
|
|
2 σ2 |
dz = |
|
||||||||||||||||||||
|
|
σ |
2 π |
|
−∞ |
|
|
|
|
|
|
|
|
|
σ |
2 π |
−∞ |
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
z −m |
|
|
|
|
|
|
|
|
|
|
|
|
|
b−m |
|
|
|
|
t 2 |
|
|
|
|
|
|
|
|
|
|
a−m |
|
|
t 2 |
|
|
||||
|
|
= t |
|
|
|
|
|
1 |
|
|
|
σ |
|
|
|
|
− |
|
|
|
|
|
|
1 |
|
|
|
|
σ |
− |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
−∞∫ e 2 dz − |
|
|
|
−∞∫ e 2 dz = |
|
||||||||||||||||||||||||
= dzσ= σ dt |
|
= |
|
|
2 π |
|
|
2 π |
|
|
|
||||||||||||||||||||||||||||||
= 1 |
|
|
t |
|
|
|
|
t 2 |
|
|
|
|
1 |
|
|
|
|
t |
|
t 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
2 e |
− |
|
dz − |
|
|
|
|
|
1 e |
− |
|
dz = Φ(t |
|
|
) −Φ(t ) . |
(24) |
||||||||||||||||||||||
|
|
2 |
|
|
|
|
2 |
2 |
|||||||||||||||||||||||||||||||||
|
|
2 π −∫∞ |
|
|
|
|
|
|
|
|
2 π |
|
|
−∫∞ |
|
|
|
|
|
|
|
|
|
|
1 |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
С помощью (24) и данных табл. 2 прил. мы можем вычислить теоретические частоты вариационного ряда, предполагая, что иссле-
35

дуемая случайная величина распределена по нормальному закону. Выполним эту работу для вариационных рядов по диаметру и
высоте. Для выполнения вычислений составим вспомогательную таблицу (табл. 12). С учетом того, что оценкой параметров нормального распределения методом моментов являются среднеквадратическое отклонение и среднее арифметическое, вычислим нормированные нижнюю и верхнюю границы интервалов следующим образом:
|
|
x − λ |
− x |
|
x + λ |
− x |
||||
н |
|
i |
2 |
|
в |
|
i |
2 |
|
|
ti |
= |
|
|
|
; ti |
= |
|
|
|
. |
|
σ |
|
|
σ |
|
|||||
|
|
|
|
|
|
|
|
|
Таблица 12. Вычисление теоретических частот для функции нормаль-
ного распределения (диаметры)
|
xi |
|
fi |
|
н |
|
в |
|
н |
|
в |
) |
|
Pi |
|
~ |
|
~ |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
ti |
|
ti |
|
Ф(ti ) |
|
Ф(ti |
|
|
fi |
|
∆ = fi − fi |
|
||||
|
14,45 |
|
0 |
|
–2,52 |
|
–2,09 |
|
0,000 |
|
0,018 |
|
0,018 |
|
3,6 |
|
–3,6 |
|
|
|
17,65 |
|
3 |
|
–2,09 |
|
–1,66 |
|
0,018 |
|
0,048 |
|
0,030 |
|
6,0 |
|
–3,0 |
|
|
|
20,85 |
|
11 |
|
–1,66 |
|
–1,23 |
|
0,048 |
|
0,106 |
|
0,058 |
|
11,6 |
|
–0,6 |
|
|
|
24,05 |
|
29 |
|
–1,23 |
|
–0,80 |
|
0,106 |
|
0,212 |
|
0,106 |
|
21,2 |
|
7,8 |
|
|
|
27,25 |
|
39 |
|
–0,80 |
|
–0,37 |
|
0,212 |
|
0,356 |
|
0,144 |
|
28,8 |
|
10,2 |
|
|
|
30,45 |
|
32 |
|
–0,37 |
|
0,06 |
|
0,356 |
|
0,524 |
|
0,168 |
|
33,6 |
|
–1,6 |
|
|
|
33,65 |
|
33 |
|
0,06 |
|
0,49 |
|
0,524 |
|
0,688 |
|
0,164 |
|
32,8 |
|
0,2 |
|
|
|
36,85 |
|
23 |
|
0,49 |
|
0,92 |
|
0,688 |
|
0,821 |
|
0,133 |
|
26,6 |
|
–3,6 |
|
|
|
40,05 |
|
10 |
|
0,92 |
|
1,35 |
|
0,821 |
|
0,911 |
|
0,090 |
|
18,0 |
|
–8,0 |
|
|
|
43,25 |
|
9 |
|
1,35 |
|
1,78 |
|
0,911 |
|
0,961 |
|
0,050 |
|
10,0 |
|
–1,0 |
|
|
|
46,45 |
|
3 |
|
1,78 |
|
2,21 |
|
0,961 |
|
0,986 |
|
0,025 |
|
5,0 |
|
–2,0 |
|
|
|
49,65 |
|
4 |
|
2,21 |
|
2,64 |
|
0,986 |
|
0,996 |
|
0,010 |
|
2,0 |
|
2,0 |
|
|
|
52,85 |
|
2 |
|
2,64 |
|
3,07 |
|
0,996 |
|
0,999 |
|
0,003 |
|
0,6 |
|
1,4 |
|
|
|
56,05 |
|
2 |
|
3,07 |
|
3,49 |
|
0,999 |
|
1,000 |
|
0,001 |
|
0,2 |
|
1,8 |
|
|
|
59,25 |
|
0 |
|
3,49 |
|
3,92 |
|
1,000 |
|
1,000 |
|
0,000 |
|
0,0 |
|
0,0 |
|
|
|
Сумма |
|
200 |
|
|
|
|
|
|
|
|
|
|
1,000 |
|
200,0 |
|
0,0 |
|
В отличие от анализируемого вариационного ряда, нормальное распределение определено на интервале от –∞ до +∞. Для того чтобы области определения эмпирического и нормального распределения сделать одинаковыми, добавим дополнительные интервалы перед первым интервалом с границами от –∞ до нижней границы первого интервала и после последнего интервала с границами от верхней границы последнего интервала до +∞. Эмпирические частоты этих дополнительных интервалов будут равны нулю, так как в исходных дан-
36
ных нет ни одного наблюдения, которое было бы меньше нижней границы первого интервала или больше верхней границы последнего интервала. Значения функции нормированного нормального распределения для нижней Ф(tiн) и верхней Ф(tiв) границ интервалов можно найти с помощью табл. 2, используя в качестве аргументов значения tiн и tiв соответственно. В этой таблице значения функции распределения даны только для положительных аргументов. Если надо найти функцию распределения для отрицательного аргумента, следует воспользоваться соотношением Ф(–x) = 1–Ф(x), которое справедливо, так как нормальное распределение является симметричным.
Вероятности для интервалов вариационного ряда легко вычислить как разность значений функции распределения для верхней и нижней границ:
Pi = Φ(tiв) −Φ(tiн) .
Теперь можно найти теоретические частоты ряда: fi = n Pi .
Аналогичным образом можно вычислить теоретические частоты для вариационного ряда высот (табл. 13).
Последние колонки табл. 12 и 13, представляющие собой разность между эмпирическими и теоретическими частотами, дают нам информацию о близости теоретического (в данном случае нормального) и эмпирического распределений. Однако по данным отклонениям достаточно трудно принять решение о согласованности эмпирического и теоретического распределений. Более наглядную картину можно увидеть, изобразив эти распределения графически (рис. 8 и 9). Однако такие сравнения распределений будут субъективными. Для того чтобы дать объективную оценку согласованности эмпирических и теоретических распределений, необходимо воспользоваться специальными методиками проверки статистических гипотез.
Статистическая проверка непараметрических гипотез
Для того чтобы выяснить, подчиняются ли экспериментальные данные какому-либо закону распределения, надо сформулировать статистическую гипотезу в отношении распределения анализируемой случайной величины и затем проверить ее. Для проверки гипотез, выдвигаемых в отношении вида распределения, используются специальные статистики, называемые непараметрическими критериями или
37

критериями согласия. Рассмотрим процесс проверки непараметрической гипотезы с помощью одного из критериев согласия – критерия Пирсона. На первом этапе следует выдвинуть нулевую гипотезу, состоящую в том, что анализируемый признак подчиняется какому-либо закону распределения. Далее, исходя из предположения о том, что нулевая гипотеза справедлива, следует вычислить статистику χ2:
χ2 = ∑k |
~ 2 |
|
(fi −~fi ) . |
(25) |
|
i=1 |
fi |
|
Таблица 13. Вычисление теоретических частот для функции нормаль-
ного распределения (высоты)
|
xi |
|
fi |
|
н |
|
в |
|
н |
|
в |
) |
|
Pi |
|
~ |
|
~ |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
ti |
|
ti |
|
Ф(ti ) |
|
Ф(ti |
|
|
fi |
|
∆ = fi − fi |
|
||||
|
16,45 |
|
0 |
|
–3,83 |
|
–3,39 |
|
0,000 |
|
0,000 |
|
0,000 |
|
0,0 |
|
0,0 |
|
|
|
17,45 |
|
3 |
|
–3,39 |
|
–2,95 |
|
0,000 |
|
0,002 |
|
0,002 |
|
0,4 |
|
2,6 |
|
|
|
18,45 |
|
2 |
|
–2,95 |
|
–2,51 |
|
0,002 |
|
0,006 |
|
0,004 |
|
0,8 |
|
1,2 |
|
|
|
19,45 |
|
2 |
|
–2,51 |
|
–2,07 |
|
0,006 |
|
0,019 |
|
0,013 |
|
2,6 |
|
–0,6 |
|
|
|
20,45 |
|
6 |
|
–2,07 |
|
–1,64 |
|
0,019 |
|
0,049 |
|
0,030 |
|
6,0 |
|
0,0 |
|
|
|
21,45 |
|
7 |
|
–1,64 |
|
–1,20 |
|
0,049 |
|
0,115 |
|
0,066 |
|
13,2 |
|
–6,2 |
|
|
|
22,45 |
|
22 |
|
–1,20 |
|
–0,76 |
|
0,115 |
|
0,227 |
|
0,112 |
|
22,4 |
|
–0,4 |
|
|
|
23,45 |
|
21 |
|
–0,76 |
|
–0,32 |
|
0,227 |
|
0,374 |
|
0,147 |
|
29,4 |
|
–8,4 |
|
|
|
24,45 |
|
36 |
|
–0,32 |
|
0,12 |
|
0,374 |
|
0,548 |
|
0,174 |
|
34,8 |
|
1,2 |
|
|
|
25,45 |
|
44 |
|
0,12 |
|
0,56 |
|
0,548 |
|
0,712 |
|
0,164 |
|
32,8 |
|
11,2 |
|
|
|
26,45 |
|
29 |
|
0,56 |
|
1,00 |
|
0,712 |
|
0,841 |
|
0,129 |
|
25,8 |
|
3,2 |
|
|
|
27,45 |
|
17 |
|
1,00 |
|
1,44 |
|
0,841 |
|
0,925 |
|
0,084 |
|
16,8 |
|
0,2 |
|
|
|
28,45 |
|
9 |
|
1,44 |
|
1,87 |
|
0,925 |
|
0,969 |
|
0,044 |
|
8,8 |
|
0,2 |
|
|
|
29,45 |
|
2 |
|
1,87 |
|
2,31 |
|
0,969 |
|
0,990 |
|
0,021 |
|
4,2 |
|
–2,2 |
|
|
|
30,45 |
|
0 |
|
2,31 |
|
2,75 |
|
0,990 |
|
1,000 |
|
0,010 |
|
2,0 |
|
–2,0 |
|
|
|
Сумма |
|
200 |
|
|
|
|
|
|
|
|
|
|
1,000 |
|
200,0 |
|
0,0 |
|
Полученное значение сравнивается с квантилем распределения Пирсона χ2, приведенного в табл. 5 приложения. В качестве параметров распределения используется уровень значимости (обычно используется α = 0,05) и число степеней свободы:
γ = k −ρ−1, |
(26) |
где k – общее число степеней свободы, равное числу слагаемых в сумме из формулы (25); ρ – число параметров теоретической функции распределения, которые оценивались по анализируемым данным.
38

|
50 |
частоты |
40 |
30 |
|
20 |
|
|
|
|
10 |
|
0 |
|
|
5 |
|
5 |
5 |
|
|
5 |
|
5 |
5 |
|
|
5 |
|
5 |
5 |
|
5 |
|
5 |
5 |
5 |
||||||||||
|
,6 |
|
,8 |
|
|
|
,2 |
|
,4 |
33,6 |
|
|
,8 |
|
,0 |
43,2 |
|
6,4 |
|
,6 |
52,8 56,0 |
||||||||||||
7 |
|
0 |
|
|
|
7 |
|
0 |
|
|
6 |
|
0 |
|
|
9 |
|
||||||||||||||||
1 |
|
|
2 |
|
|
24,0 2 |
|
|
3 |
|
|
3 |
|
|
4 |
|
|
4 |
|
4 |
|
|
значения классов
Рис. 8. Сравнение эмпирического и нормального распределений сосновых стволов по диаметрам
частоты
50
40
30
20
10
0
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
5 |
||||||
17,4 18,4 19,4 |
20,4 |
21,4 22,4 |
23,4 24,4 |
25,4 26,4 |
27,4 |
28,4 29,4 |
значения классов
Рис. 9. Сравнение эмпирического и нормального распределений сосновых стволов по высотам
При вычислении критерия Пирсона следует иметь в виду, что теоретические частоты не должны быть меньше пяти. В том случае, если теоретические частоты оказываются недостаточно большими, следует объединять маленькие классы в большие.
Рассмотрим процесс проверки непараметрической гипотезы с помощью критерия Пирсона на примере распределений диаметров и высот деревьев в сосновом древостое. Нулевая гипотеза будет заключаться в предположении, что анализируемые случайные величины подчиняются закону нормального распределения. Исходя из такого предположения, вычислим статистику χ2 для вариационного ряда по диаметрам. Для этого составим вспомогательную табл. 14.
39