Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
211765_91064_chertko_n_k_karpichenko_a_a_matema...doc
Скачиваний:
6
Добавлен:
01.07.2025
Размер:
5.67 Mб
Скачать

6.4. Множественная регрессия

Если при установлении зависимости между признаками используется больше одной независимой переменной, то применяют множественный регрессионный анализ. Проведение такого анализа возможно в следующих условиях: распределение зависимой переменной при различных значениях независимых должно быть близко к нормальному; дисперсия зависимой переменной при разных значениях признаков х должна считаться одинаковой. С увеличением числа признаков и в случаях нелинейной множественной регрессии необходимо использовать ЭВМ. Поэтому рассмотрим простой вариант множественной линейной регрессии без применения ЭВМ, когда один признак зависит от двух факторов. Общее уравнение линейной множественной регрессии имеет вид

y = a + bx + cz (6.9)

Для вычисления параметров а, b, с составляется следующая система уравнений:

(6.10)

Соответствие между теоретическими (у') и эмпирическими (у) значениями признака устанавливают с помощью критериев хи-квадрат или Стьюдента (см. п. 1.6). При необходимости ошибка уравнения линейной множественной регрессии определяется по формуле:

, (6.11)

где а, b, с – значения параметров уравнения множественной регрессии; п – число сопряженных значений вариант; kчисло коэффициентов уравнения регрессии (а, b, с плюс свободный член).

Другие параметры для (6.11) вычисляются по формулам:

Σ = Σy2 n ; (6.12)

Σayax = ΣxynMyMx; (6.13)

Σayaz = ΣyznMyMz. (6.14)

Пример. При изучении зависимости между биомассой трав (у, г/м2) в агроландшафте, с одной стороны, температурой (х, °С) и количеством атмосферных осадков (z, мм) с другой, установлена прямая односторонняя зависимость у от х и z. С практической точки зрения целесообразно составить уравнение множественной регрессии, которое можно было бы использовать для прогноза биомассы по температуре и количеству выпавших осадков. Данные по х, у, z представляют собой средние многолетние показатели за период вегетации (май, июнь):

y

300

350

370

420

450

500

x

14,5

15,0

15,6

17,2

18,5

19,3

z

82

95

105

120

130

140

Таблица 6.5

Расчет данных для уравнения линейной множественной регрессии

y

x

z

y2

x2

z2

xy

xz

yz

300

14,5

82

90000

210,25

6724

4350

1189

24600

350

15,0

95

122500

225,00

9025

5250

1425

33250

370

15,6

105

136900

243,36

11025

5772

1638

38850

420

17,2

120

176400

295,84

14400

7224

2064

50400

450

18,5

130

202500

342,25

16900

8325

2405

58500

500

19,3

140

250000

372,49

19600

9650

2702

70000

Σ 2390

100,1

672

978300

1689,19

77674

40571

11423

275600

My = 398,33

Mx = 16,68

Mz = 112

 

 

 

 

 

 

Вычисленные в табл. 6.5 показатели подставляем в систему уравнений (6.10):

Решаем систему уравнений относительно а, b, с. Получаем а = –3,26; b = 5,01; c = 2,84. Подставляем значения а, b, с в общую формулу уравнения множественной регрессии (6.9):

y = –3,26 + 5,01x + 2,84z (6.15)

Затем находим теоретические значения у'. Для этого подставляем в формулу (6.15) экспериментальные данные по x и z и заносим в табл. 6.6 для расчета критерия хи-квадрат. Поскольку χ2ф = 0,602 < χ2т = 11,1 при Р = 0,95 для ν = 5, то можно сделать вывод, что расчет биомассы по данным температуры (х) и осадкам (z)достаточно точный.

Для определения ошибки уравнения линейной множественной регрессии показатели рассчитываем по формулам (6.12–6.14):

Σ = 978300 – 6 ∙ 398,332 = 29299,4;

Σayax = 40571 – 6 ∙ 398,33 ∙ 16,68 = 706,14;

Σayaz = 275600 – 6 ∙ 398,33 ∙ 112 = 7922,3.

Затем подставляем полученные значения в формулу (6.11):

г/м2.

Таким образом, прогнозируя урожай биомассы трав за период вегетации по температуре и осадкам, мы рискуем ошибиться в среднем на 9,35 г/м2, т. е. на 2,3 %.

Таблица 6.6

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]