Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Игнатенко Статистическая оценка данных екологического мониторинга 2010.pdf
Скачиваний:
140
Добавлен:
16.08.2013
Размер:
2.09 Mб
Скачать

'

 

2

3

y

(1M )2 + y

2

(2

M )2 +.. + y

N

(N M )2

 

=1 / 3H

 

1

 

 

 

 

 

 

 

 

B11

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(N

1)/ 4

(y1

+ y2

+.. + yN )

 

 

 

 

 

 

 

 

 

где H2 = N (N2 – 1)(N2 – 4)/180, а М и H1 вычисляют по формуле

(4.14).

При четном N:

B′ = y (H1 N )B11' ;

B1′ =1 2H1 y1 (2 N 1)+ y2 (4 N 1)=... + yN (2N N 1) ; B11′ =112H2 {3 y1 (2 N 1)2 + y2 (4 N 1)2

(N 2 1)(y1 + y2 +... + yN )}.

М= N/2, а H1 и H2 вычисляют по тем же формулам.

4.3.Метод наименьших квадратов для многофакторных экспериментов

Случай линейной регрессионной модели с k варьируемыми факторами. Регрессионная модель здесь имеет вид (4.2). Значения факторов, принимаемые в каждом опыте, можно свести в табл. 4.3.

Таблица 4.3

Значения факторов

Номер

Х0

Х1

Х2

...

Хk

опыта

 

 

 

 

 

1

Х01

Х11

Х21

...

Хk1

2

Х02

Х12

Х22

...

Хk2

3

Х03

Х13

Х23

...

Хk3

...

...

...

...

...

...

...

...

...

...

...

...

N

Х0N

Х1N

Х2N

...

ХkN

Таблицы, составленные по представленному типу, в которых записаны условия опытов, называют матрицами планов. Прежде

65

чем проводить вычисления, запишем регрессионную модель (4.2) в более симметричном виде, введя фиктивный фактор Х0:

y = B0 X0 + B1 X1 + B2 X2 +... + Bk Xk . (4.17)

В связи с этим дополним матрицу плана в табл. 4.3, введя в нее столбец значений фиктивного фактора Х0 и сформируем новую табл. 4.4

Таблица 4.4

Значения факторов

Номер

Х1

Х2

...

Хk

опыта

 

 

 

 

1

Х11

Х21

...

Хk1

2

Х12

Х22

...

Хk2

3

Х13

Х23

...

Хk3

...

...

...

...

...

...

...

...

...

...

N

Х1N

Х2N

...

ХkN

Теперь каждому слагаемому модели (4.17) соответствует определенный столбец этой матрицы: слагаемому В0Х0 – столбец Х0, слагаемому В1Х1 – столбец Х1 и т.д. Такая матрица называется матрицей базисных функций. В табл. 4.4, таким образом, построена матрица базисных функций модели (4.17) для плана в табл. 4.3.

Для отыскания коэффициентов регрессии В0, В1, В2,…, Вk модели (4.17) необходимо проделать выкладки, аналогичные тем, которые были проведены выше для получения коэффициентов В0 и В1 линейной модели с единственным фактором. Опуская их, приведем промежуточный результат – систему нормальных уравнений:

 

N

N

N

N

N

B0

X02j +B1

X0 j X1 j + B2

X0 j X2 j +... + Bk X0 j Xkj = X0 j y j ,

 

j=1

j=1

j=1

j=1

j=1

 

N

N

N

N

N

B0

X0 j X1 j

+B1 X12j + B2

X1 j X2 j

+... + Bk X1 j Xkj = X1 j y j ,

 

j=1

j=1

j=1

j=1

j=1

 

N

N

N

N

N

B0

X0 j X2 j

+B1 X1 j X2 j + B2 X22 j +... + Bk X2 j Xkj = X2 j y j ,

 

j=1

j=1

j=1

j=1

j=1

66

..............................................................................................................

N

N

N

N

N

B0 X0 j Xkj +B1

X1 j Xkj + B2

...X2 j Xkj + + Bk Xkj2 = Xkj y j .

j=1

j=1

j=1

j=1

j=1

(4.18)

Система (4.18) построена по тому же принципу, что и система нормальных уравнений (4.10) для линейной однофакторной модели. Ее легко написать, имея матрицу базисных функций (табл. 4.4).

Отметим, что число уравнений этой системы равно числу коэффициентов регрессии, подлежащих определению, т.е. в данном случае k + 1. Ясно также, что в случае применения метода наименьших квадратов число опытов N должно быть не меньше числа p оцениваемых коэффициентов регрессии N p. План, для которого p = N, называется насыщенным планом. Насыщенные планы не позволяют проверить адекватность математической модели. План, для которого p < N, называется ненасыщенным.

Расчет коэффициентов регрессии и интерпретация результатов эксперимента существенно упрощаются, если преобразовать все факторы в безразмерные параметры, варьируемые в одинаковых диапазонах. Это можно сделать, введя нормализованные обозначения факторов. Пусть в эксперименте варьируются k факторов и Хi – любой из них: i = 1,2, …, k. Его диапазон варьирова-

ния Хimin ≤ Хi ≤ Хimax. Величина Хimax называется верхним уровнем фактора Хi, а величина Хimin – его нижним уровнем. Середину диа-

пазона варьирования фактора Хi назовем его основным уровнем и обозначим Xi0 , Xi0 = (Хimin + Хimax)/2. Разность ∆i = Хimax Xi0 = Xi0

Хimin называется интервалом варьирования фактора Хi.

Сопоставим теперь произвольному фактору Хi его нормализованное обозначение xi , которое определяется по формуле

xi = (X i X i(0)) i .

(4.19)

Введение нормализованных обозначений факторов по формуле (4.19) удобно по ряду причин. Можно заметить, что независимо от диапазона варьирования любого фактора его нижнему уровню соответствует (–1) в нормализованных обозначениях, верхнему уровню – (+1), основному – 0. Математическая модель объекта, записанная в нормализованных обозначениях факторов, позволяет об-

67

легчить интерпретацию результатов, поскольку диапазоны варьирования всех факторов оказываются одинаковыми и равными (–1), (+1), а все коэффициенты уравнения регрессии имеют одинаковую размерность. Это дает возможность, например, сравнивать степень влияния факторов непосредственно по абсолютным величинам коэффициентов регрессии линейной модели.

Пример. Покажем, как были обработаны результаты эксперимента в п. 3.1 (в нем исследовалось влияние влажности W = X1 и температуры t = X2 на прорастание семян ржи l = y, мм).

Построим матрицу базисных функций линейной модели, дополнив матрицу в табл. 3.1 столбцом X0 сформировав табл. 4.5 и 4.6.

 

 

 

 

 

Таблица 4.5

 

Матрица плана

 

 

 

 

 

 

 

X2, с

 

 

Номер опыта

X0

X1, %

у, мм

1

2

3

 

4

5

 

1

1

6

 

40

9,0

 

2

1

18

 

40

5,5

 

3

1

30

 

40

3,0

 

4

1

6

 

80

7,5

 

5

1

18

 

80

4,2

 

6

1

30

 

80

2,0

 

Таблица 4.6

Матрица плана с нормализованными факторами

Номер опыта

х0

х1

х2

у, мм

ŷ1,мм

1

2

3

4

5

6

1

1

–1

–1

9,0

8,7

2

1

0

–1

5,5

5,8

3

1

+1

–1

3,0

2,95

4

1

–1

+1

7,5

7,44

5

1

0

+1

4,2

4,57

6

1

+1

+1

2,0

1,69

68

Согласно экспериментальному плану фактор X1 варьируется на верхнем, нижнем и основном уровне, а фактор X2 – только на верхнем и нижнем уровне.

Перейдем к нормализованным факторам. Распишем сначала формулы (4.19) для каждого из варьируемых факторов: X1min = 6 %,

X1max = 30 %, X10 = (6+30)/2 = 18 %, ∆1 = 18 – 6 = 12 %. В этом слу-

чае формула (4.19) для первого фактора имеет вид x1 = X11218 .

Аналогичным образом формула, связывающая нормализованные и натуральные обозначения для второго фактора, запишется в виде x2 = X22060 .

Перепишем матрицу базисных функций в нормализованных обозначениях факторов; она приведена в столбцах 2–4 табл. 4.6.

Для составления системы нормальных уравнений необходимо вычислить суммы произведений элементов каждой пары столбцов

(см. систему (4.18)):

6

 

 

x02 j =1+1+... +1 = 6;

 

j=1

 

 

6

6

 

x0 j x1 j = x1 j = −1+0 +11+0 +1 = 0;

j=1

j=1

 

6

6

6

x0 j x2 j = x2 j = 0;

x0 j y j = 31,2;

j=1

j=1

j=1

6

6

6

x12j = 4;

x1 j y2 j = 0;

x1 j y j = −11,5;

j=1

j=1

j=1

6

6

 

x22 j = 6;

x2 j y2 j = −3,8.

j=1

j=1

 

Теперь система нормальных уравнений (4.18), записанная для нормализованных факторов, сводится к виду: 6b0 = 31,2; 4b1 = = –11,54; 6b2 = –3,8, откуда b0 = 5,2; b1 = –2,87; b2 = –0,63. Таким об-

разом, получена следующая линейная модель для нормализован-

ных факторов y = 5,2 – 2,87x1 0,63x2.

69

Для иллюстрации точности, с которой построенная модель предсказывает результаты эксперимента, в последнем столбце табл. 4.6 приведены значения отклика ŷ, рассчитанные по уравнению регрессии для каждого опыта. При переходе к натуральным факторам следует воспользоваться полученными выше формулами, связывающими нормализованные и натуральные обозначения фак-

торов. Подставив в найденное

уравнение

регрессии значения

x =

X1 18

и x

=

X2 60

, получим:

 

 

 

 

 

 

 

 

 

 

 

 

1

12

2

20

 

 

 

 

 

 

 

 

 

 

2,87( X1

18)

 

0,63(X2

60)

 

 

 

 

y = 5, 2

.

 

 

 

12

 

 

20

 

 

 

 

 

 

 

 

 

 

 

После преобразований будем иметь математическую модель в натуральных обозначениях факторов:

y = 11,4 – 0,24Х1 0,0315 Х2 .

Составление системы нормальных уравнений для регрессионных моделей в виде многочленов порядка выше первого.

Идея обобщения метода наименьших квадратов на этот случай заключается в том, что любое произведение факторов, или их степень можно рассматривать в качестве нового фактора. Пусть, например, экспериментатор, исследуя влияние трех факторов на экологический объект, решил задаться моделью

у = B0 + B1 X1 + B2 X 2 + B11 X13 + B22 X 22 + B12 X1 X 2 .

Заменим члены второго и более высокого порядков новыми линейными членами

X13 = X3 ; X 22 = X 4 ; X1 X 2 = X5.

В результате исходная модель заменена линейной с пятью факторами. Таким образом, данный случай сводится к предыдущему.

Для того чтобы выписать систему нормальных уравнений, аналогичным образом составляем матрицу базисных функций по типу табл. 4.4. Каждому слагаемому модели должен соответствовать определенный столбец матрицы. Поэтому она включает все степени и произведения факторов, которые фигурируют в модели (табл. 4.7).

С помощью этой таблицы можно составить систему нормальных уравнений.

70

 

 

 

 

 

 

 

Таблица 4.7

 

 

Матрица базисных функций

 

 

 

 

 

 

 

 

 

 

 

Номер опыта

Х0

 

Х1

X2

X13

X22

Х1 Х2

 

1

1

 

Х11

Х21

X113

X212

Х11, Х21

 

2

1

 

Х12

Х22

X123

X222

Х12, Х22

 

...

 

 

...

....

 

 

...

...

 

 

N

1

 

Х1N

Х2N

X13N

X22N

Х1N Х2N

 

Пример. На шести образцах разных размеров из хвойной древесины проверялась их усушка до конечной влажности 20 %. Необходимо установить зависимость величины усушки образца от его

размера.

 

 

 

 

 

 

Размер образца, мм

16

19

22

25

32

40

Величина усушки, мм

0,6

0,6

0,7

0,8

1,0

1,2

Опишем эту зависимость, с учетом априорной информации, уравнением параболы y = B0 + B1 X1 + B11 X12 , найдя коэффициенты

В0, В1, В11 по методу наименьших квадратов. В табл. 4.8 построена матрица базисных функций этой модели, дополненная столбцом значений выходной величины.

Таблица 4.8

Матрица базисных функций для моделей примера

Номер опыта

Х0

Х1

X12

y, мм

ŷ, мм

1

1

16

256

0,6

0,57

2

1

19

361

0,6

0,64

3

1

22

484

0,7

0,71

4

1

25

625

0,8

0,80

5

1

32

1024

1,0

0,98

6

1

40

1600

1,2

1,21

Для этого случая получим следующую систему нормальных уравнений:

71

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]