
Mashkovsky_Lesnaya_biometria
.pdf
|
|
|
|
|
|
|
n |
n |
|
|
|
|
n |
|
n |
|
|
n |
∑x2,i ∑x1,i x2,i |
n |
|||
B5 ∑x1,2i − B3 ∑x1,i |
x2,i = |
∑x2,2 i − |
i=1 |
i=1 |
|
∑x1,2i − |
|||||
|
n |
||||||||||
|
|
|
|
|
|
|
|
|
|
||
|
i=1 |
|
i=1 |
|
i |
=1 |
|
∑x1,i |
|
i=1 |
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
n |
n |
|
|
|
|
|
|
|
|
n |
|
∑x12,i |
∑x2,i |
n |
|
|
|
|
||
− |
∑x2,i |
x1,i − |
i=1 |
i=1 |
|
|
∑x1,i x2,i . |
|
|
|
|
n |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
∑x1,i |
|
|
i=1 |
|
|
|
|
||
|
|
|
i=1 |
|
|
|
|
|
|
|
Раскроем скобки в правой части полученного равенства
|
|
|
n |
|
n |
|
|
n |
|
n |
|
|
B5 ∑x12,i − B3 |
∑x1,i x2,i |
= ∑x12,i ∑x22,i − |
|
|||||||||
|
|
i=1 |
|
i=1 |
|
|
i=1 |
|
i=1 |
|
|
|
|
|
n |
|
n |
|
|
|
|
|
|
|
|
|
|
∑x2,i ∑x1,i x2,i |
n |
2 |
|
n |
|
2 |
|
|||
|
|
i=1 |
|
i=1 |
|
|
|
|||||
− |
|
|
|
|
|
∑x1,i − |
∑x1,i x2,i |
|
+ |
|||
|
|
|
n |
|
|
|||||||
|
|
|
|
∑x1,i |
|
i=1 |
|
|
i=1 |
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
n |
|
n |
|
|
|
|
|
|
|
|
|
|
∑x12,i |
∑x2,i |
n |
|
|
|
|
|
|
|
|
+ |
i=1 |
|
i=1 |
∑x1,i x2,i |
|
|
|
|
|
|||
|
n |
|
|
|
|
|
|
|||||
|
|
|
∑x1,i |
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i=1
иприведем подобные члены:
n |
n |
n |
n |
|
n |
|
2 |
|
B5 ∑x12,i − B3 |
∑x1,i x2,i = ∑x22,i ∑x12,i − |
∑x1,i x2,i |
. |
(181) |
||||
i=1 |
i=1 |
i=1 |
i=1 |
i=1 |
|
|
|
Теперь с учетом (180) и (181) преобразуем выражение (179) следующим образом:
|
|
|
|
σ2 |
|
|
|
n |
n |
|
|
|
|
|
|
|
B5 |
∑x12,i − B3 |
∑x1,i |
x2,i |
|||||
V (a0 )= |
|
|
|
|
i=1 |
i=1 |
|
|
= |
|||
|
|
∑n |
|
|
|
|
|
|||||
|
|
|
|
|
|
x1,i (B3 B4 − B2 B5 ) |
||||||
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
n |
|
|
n |
n |
|
2 |
|||
|
σ2 |
|
∑x22,i ∑x12,i − ∑x1,i x2,i |
|
||||||||
|
|
|
|
|
|
|
|
i=1 |
|
|
||
= |
|
i=1 |
|
i=1 |
|
. |
||||||
|
|
|
|
n (C2 C4 −C32 ) |
|
|
||||||
|
|
|
|
|
|
|
|
|
В том случае, когда σ2 неизвестна, предполагая, что модель корректна, вместо нее можно использовать оценку s2 – остаточный
193

7.3.Оценка коэффициентов прямой
Рассмотрим процесс построения самой простой регрессионной модели в случае, когда у нас есть одна независимая переменная. Такая модель является частным случаем линейной регрессионной модели (123) и имеет вид прямой:
y = a0 + a1 x .
Для того чтобы получить оценку коэффициентов a0 и a1 уравнения прямой линии методом наименьших квадратов, следует решить систему нормальных уравнений. В случае одной независимой переменной система (131) примет следующий вид:
|
|
n |
|
n |
|
n a0 + a1 |
∑xi |
= ∑yi ; |
|||
|
|
i=1 |
|
i=1 |
|
|
n |
n |
|
|
n |
a0 ∑xi + a1 ∑xi2 |
= ∑yi xi . |
||||
|
i=1 |
i=1 |
|
i=1 |
Вычислим коэффициенты регрессии прямой линии по данным замеров диаметров и высот деревьев в древостое. Для этого воспользуемся результатами группировки, приведенными в таблице распределения 14. В случае использования сгруппированных исходных данных некоторые пары значений зависимой и независимой переменной могут встречаться несколько раз. В связи с этим система нормальных уравнений примет следующий вид:
|
|
k |
k |
yi ; |
|
n a0 + a1 |
∑ fi xi |
= ∑ fi |
|
||
|
|
i=1 |
i=1 |
|
(184) |
|
k |
k |
|
k |
|
a0 ∑ fi xi + a1 ∑ fi xi2 |
= ∑ fi yi xi . |
|
|||
|
i=1 |
i=1 |
i=1 |
|
Для того чтобы вычислить все необходимые суммы, составим вспомогательную таблицу (табл. 44).
В данной таблице суммы вычисляются сначала по интервалам, а затем складываются. Подставив значения сумм в систему нормальных уравнений (184), получим
a |
|
200 + a |
6320,40 = 4960,4; |
(185) |
|
0 |
1 |
|
|
a0 |
6320,40 + a1 210797,2 =158 989,1. |
|
195

Таблица 44. Вспомогательная таблица для вычисления коэффициентов регрессии прямой
H |
D |
17,65 |
20,85 |
24,05 |
27,25 |
30,45 |
33,65 |
36,85 |
40,05 |
43,25 |
46,45 |
49,65 |
52,85 |
56,05 |
Сумма |
∑ f j y j |
|
30,05 |
|
|
– |
– |
– |
1 |
|
|
|
– |
– |
– |
– |
|
|
1 |
30,1 |
29,05 |
|
|
– |
– |
– |
1 |
1 |
|
|
– |
– |
– |
1 |
|
|
3 |
87,2 |
28,05 |
|
|
– |
– |
1 |
1 |
2 |
1 |
3 |
2 |
– |
1 |
2 |
1 |
|
14 |
392,7 |
27,05 |
|
|
– |
– |
– |
1 |
3 |
4 |
5 |
3 |
4 |
2 |
– |
|
2 |
24 |
649,2 |
26,05 |
|
|
– |
– |
1 |
7 |
4 |
13 |
10 |
3 |
4 |
– |
1 |
|
|
43 |
1120,2 |
25,05 |
|
|
– |
– |
1 |
7 |
7 |
12 |
2 |
1 |
1 |
– |
– |
1 |
|
32 |
801,6 |
24,05 |
|
|
– |
– |
7 |
7 |
12 |
1 |
3 |
1 |
– |
– |
– |
|
|
31 |
745,6 |
23,05 |
|
|
– |
1 |
8 |
12 |
2 |
2 |
|
– |
– |
– |
– |
|
|
25 |
576,3 |
22,05 |
|
|
– |
3 |
8 |
1 |
1 |
|
|
– |
– |
– |
– |
|
|
13 |
286,7 |
21,05 |
|
|
– |
1 |
– |
1 |
|
|
|
– |
– |
– |
– |
|
|
2 |
42,1 |
20,05 |
|
|
– |
4 |
1 |
|
|
|
|
– |
– |
– |
– |
|
|
5 |
100,3 |
19,05 |
|
|
1 |
2 |
1 |
|
|
|
|
– |
– |
– |
– |
|
|
4 |
76,2 |
18,05 |
|
|
– |
– |
1 |
|
|
|
|
– |
– |
– |
– |
|
|
1 |
18,1 |
17,05 |
|
|
2 |
– |
– |
|
|
|
|
– |
– |
– |
– |
|
|
2 |
34,1 |
fx |
|
|
3 |
11 |
29 |
39 |
32 |
33 |
23 |
10 |
9 |
3 |
4 |
2 |
2 |
200 |
4960,4 |
∑ fi xi |
|
|
52,95 |
229,35 |
697,45 |
1062,75 |
974,40 |
1110,45 |
847,55 |
400,50 |
389,25 |
139,35 |
198,60 |
105,70 |
112,10 |
6320,40 |
– |
∑ fi xi2 |
|
|
934,6 |
4781,9 |
16773,7 |
28959,9 |
29670,5 |
37366,6 |
31232,2 |
16040,0 |
16835,1 |
6472,8 |
9860,5 |
5586,2 |
6283,2 |
210797,2 |
– |
∑ fi, j y j |
xi |
|
938,1 |
4765,3 |
16004,1 |
26158,6 |
24439,2 |
28456,1 |
22189,2 |
10593,2 |
10269,7 |
3815,9 |
5521,1 |
2806,3 |
3032,3 |
158989,1 |
– |
~ |
|
|
22,00 |
22,64 |
23,28 |
23,93 |
24,57 |
25,21 |
25,86 |
26,5 |
27,14 |
27,79 |
28,43 |
29,07 |
29,72 |
– |
– |
yi |
|
|
|||||||||||||||
|
~ |
2 |
57,71 |
56,35 |
105,91 |
151,84 |
87,33 |
41,76 |
32,97 |
14,43 |
9,15 |
1,16 |
6,34 |
17,2 |
14,26 |
596,41 |
– |
∑ fi, j ( y j − yi ) |
|
196
Решим полученную систему уравнений. Для этого разделим каждое из уравнений системы (185) на коэффициенты при параметре a0:
a |
|
+ a |
31,602 = 24,802; |
(186) |
|
0 |
1 |
33,352 = 25,155. |
|
a0 |
+ a1 |
|
||
Теперь вычтем первое уравнение системы (186) из второго |
(187) |
|||
a1 1,750 = 0,353 |
||||
и выразим из полученного уравнения (187) коэффициент a1: |
|
|||
a |
= 0,353 = 0,2017 . |
|
||
1 |
|
1,750 |
|
|
|
|
|
Подставляя вычисленное значение коэффициента a1 в первое уравнение системы (186) и выразив из него коэффициент a0, получим
a0 = 24,802 − a1 31,602 = 24,802 − 0,2017 31,602 =18,43 .
Таким образом, у нас получилась регрессионная модель зависимости высоты от диаметра деревьев в сосновом древостое
следующего вида: |
|
(188) |
y =18,43 + 0,2017 x , |
||
~ |
|
|
или, используя другие обозначения |
|
|
~ |
d . |
|
h =18,43 + 0,2017 |
|
На рис. 28 изображено полученное регрессионное уравнение прямой линии.
197

Рис. 28. Зависимость между высотами и диаметрами деревьев в древостое (прямая)
Проанализируем полученное уравнение. Для начала рассчитаем таблицу дисперсионного анализа (табл. 45). Число степеней свободы для суммы квадратов, обусловленной регрессией, в случае уравнения прямой линии равно 1, так как, помимо свободного члена, в нем есть только один коэффициент регрессии a1. Общей скорректированной сумме квадратов соответствует число степеней свободы, на единицу меньшее общего количества наблюдений, т. е. 200–1 = 199. На сумму квадратов отклонений относительно регрессии остается 199–1 = 198 степеней свободы. Пользуясь полученным регрессионным уравнением
прямой линии (188), определим теоретические высоты ~ и сумму yi
квадратов отклонений эмпирических высот от теоретических (табл. 44). Это значение 596,41 является суммой квадратов отклонений относительно регрессии, или остатком (табл. 45). Общая скорректированная сумма квадратов отклонений – это сумма квадратов отклонений всех высот от средней арифметической высоты. Данная величина была получена ранее для рассматриваемых данных
198
при вычислении показателей вариации (табл. 23). Сумму квадратов отклонений, обусловленную регрессией, получим как разницу между общей скорректированной суммой квадратов отклонений и остатком: 1051,51 – 596,52 = 454,99. Разделив суммы квадратов на соответствующие числа степеней свободы, получим средний квадрат, обусловленный регрессией (454,99), и средний квадрат относительно регрессии (3,01).
Таблица 45. Дисперсионный анализ уравнения прямой линии
Источник вариации |
|
Число |
степеней |
Суммы квадратов |
Средние квадраты |
||
|
|
|
|
свободы |
отклонений SS |
MS |
|
Обусловленный |
|
|
|
|
|
||
регрессией |
|
|
1 |
454,99 |
454,99 |
||
|
|
|
|
|
|
|
|
Относительно |
|
|
198 |
596,52 |
3,01 |
||
регрессии (остаток) |
|
|
|||||
|
|
|
|
|
|||
Общий, |
|
|
199 |
1051,51 |
|
||
скорректированный |
|
|
|
||||
|
|
|
|
|
|||
Теперь рассчитаем F-статистику Фишера, воспользовавшись |
|||||||
формулой (141): |
|
|
|
|
|
||
F = |
MSR |
= |
454,99 |
=151,16 . |
|
|
|
|
3,01 |
|
|
||||
|
s2 |
|
|
|
С помощью полученного значения проверим гипотезу об отсутствии связи между зависимой и независимой переменными. Для этого в табл. 8 приложения найдем квантиль распределения Фишера с 1 и 198 степенями свободы для уровня значимости α = 0,05. Это значение равно F0,05,1,198 = 3,84. Так как вычисленное значение F- критерия Фишера превышает табличное, мы отвергаем нулевую гипотезу об отсутствии связи между высотами и диаметрами. Следовательно, результаты расчетов подтверждают наличие линейной связи между диаметрами и высотами деревьев в древостое.
Наряду с дисперсионным анализом вычислим коэффициент детерминации, пользуясь формулой (142)
199

|
n |
~ |
2 |
|
|
|
R2 = |
∑ |
(yi − y) |
454,99 |
|
||
i=1 |
|
|
= |
= 0,4327 ; |
||
∑n |
|
|
1051,51 |
|||
|
(yi − y)2 |
|
i=1
приведенную R2 статистику с помощью выражения (143)
R2 |
=1−(1− R2 ) |
|
n −1 |
|
= |
|
|
|
|
|
|||||
a |
|
n − m −1 |
|
|
|
||
|
|
|
|
|
|||
=1−(1−0,4327) |
|
200 −1 |
|
|
= 0,4298 |
||
|
200 −1−1 |
||||||
|
|
|
|
и коэффициент корреляции, который является квадратным корнем из коэффициента детерминации:
n |
~ |
2 |
|
|
∑ |
(yi − y) |
454,99 |
|
|
R = i=1 |
|
= |
= 0,6578 . |
|
∑n |
(yi − y)2 |
1051,51 |
|
|
i=1 |
|
|
|
|
Полученные значения последних показателей позволяют оценить степень адекватности линейной модели связи между высотами и диаметрами экспериментальным данным как среднюю.
Следующий этап оценки качества полученного уравнения регрессии будет заключаться в проверке гипотез о равенстве коэффициентов регрессии нулю. Для этого следует вычислить t- статистики Стьюдента для коэффициентов a0 и a1 с помощью формул (152) и (147). Необходимые для вычислений суммы мы можем найти в табл. 20, 22. Остаточный средний квадрат s2 возьмем из табл. 45:
|
|
|
|
|
|
|
n |
|
− x1 )2 |
1/ 2 |
|
|
|
|
t |
|
= |
a0 |
n ∑(x1,i |
|
= |
1/ 2 |
= |
||||||
|
|
|
i=1 |
|
|
|
18,43 (200 11060,04) |
|||||||
|
a0 |
|
|
|
|
n |
1/ 2 |
|
|
|
(3,01 210 797,2)1/ 2 |
|
||
|
|
|
|
|
s2 |
|
∑x12,i |
|
|
|
|
|
||
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
= |
27 410,609 |
|
= 34,41; |
|
|
|
|
|
||||||
796,55 |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
200
