- •1.3. Расчет доверительного интервала
- •1.6. Проверка гипотезы об однородности
- •1.7. Проверка однородности нескольких дисперсий,
- •1.8. Проверка однородности нескольких дисперсий,
- •3. ОСНОВНЫЕ ПОНЯТИЯ И ЗАДАЧИ
- •ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ
- •3.1. Активные и пассивные, однофакторные
- •4.1. Основные виды математических моделей,
- •4.2. Метод наименьших квадратов для моделей
- •4.3. Метод наименьших квадратов для многофакторных
- •4.4. Об интервале съема данных и продолжительности
- •4.6. Пример обработки результатов экспериментальных
- •1.2. Статистические оценки результатов наблюдений
- •1.4. Определение необходимого объема выборки
- •1.5. Отбрасывание сомнительных наблюдений
- •1.9. Проверка однородности средних
- •1.10. Проверка нормальности распределения
- •1.11. Коэффициент корреляции
- •1.12. Ранговая корреляция
- •3.1. Активные и пассивные, однофакторные
- •3.2. Основные задачи планирования эксперимента
- •4.2. Метод наименьших квадратов для моделей
- •Случай линейной регрессионной модели с k варьируемыми факторами. Регрессионная модель здесь имеет вид (4.2). Значения факторов, принимаемые в каждом опыте, можно свести в табл. 4.3.
- •Обобщение МНК на случай регрессионных моделей произвольного вида, линейных по параметрам. Рассмотренное выше обобщение МНК применимо и для регрессионных моделей произвольного вида при условии, что коэффициенты регрессии входят в них линейно. Так, модель
- •4.5. Статистический анализ уравнения регрессии
- •Изучим сначала случай отсутствия дублированных опытов в основном эксперименте.
- •Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта.
- •7. КОНТРОЛЬНОЕ ЗАДАНИЕ
- •СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
' |
|
2 |
3 |
y |
(1− M )2 + y |
2 |
(2 |
− M )2 +.. + y |
N |
(N − M )2 |
|
|||
=1 / 3H |
|
1 |
|
|
|
|
|
|
|
|
||||
B11 |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
−(N |
−1)/ 4 |
(y1 |
+ y2 |
+.. + yN ) |
|
|
|
||||
|
|
|
|
|
|
|||||||||
где H2 = N (N2 – 1)(N2 – 4)/180, а М и H1 вычисляют по формуле
(4.14).
При четном N:
B−′ = y −(H1
N )B11' ;
B1′ =1 2H1 y1 (2 − N −1)+ y2 (4 − N −1)=... + yN (2N − N −1) ; B11′ =1
12H2 {3 y1 (2 − N −1)2 + y2 (4 − N −1)2 −
−(N 2 −1)(y1 + y2 +... + yN )}.
М= N/2, а H1 и H2 вычисляют по тем же формулам.
4.3.Метод наименьших квадратов для многофакторных экспериментов
Случай линейной регрессионной модели с k варьируемыми факторами. Регрессионная модель здесь имеет вид (4.2). Значения факторов, принимаемые в каждом опыте, можно свести в табл. 4.3.
Таблица 4.3
Значения факторов
Номер |
Х0 |
Х1 |
Х2 |
... |
Хk |
|
опыта |
||||||
|
|
|
|
|
||
1 |
Х01 |
Х11 |
Х21 |
... |
Хk1 |
|
2 |
Х02 |
Х12 |
Х22 |
... |
Хk2 |
|
3 |
Х03 |
Х13 |
Х23 |
... |
Хk3 |
|
... |
... |
... |
... |
... |
... |
|
... |
... |
... |
... |
... |
... |
|
N |
Х0N |
Х1N |
Х2N |
... |
ХkN |
Таблицы, составленные по представленному типу, в которых записаны условия опытов, называют матрицами планов. Прежде
65
чем проводить вычисления, запишем регрессионную модель (4.2) в более симметричном виде, введя фиктивный фактор Х0:
y = B0 X0 + B1 X1 + B2 X2 +... + Bk Xk . (4.17)
В связи с этим дополним матрицу плана в табл. 4.3, введя в нее столбец значений фиктивного фактора Х0 и сформируем новую табл. 4.4
Таблица 4.4
Значения факторов
Номер |
Х1 |
Х2 |
... |
Хk |
|
опыта |
|||||
|
|
|
|
||
1 |
Х11 |
Х21 |
... |
Хk1 |
|
2 |
Х12 |
Х22 |
... |
Хk2 |
|
3 |
Х13 |
Х23 |
... |
Хk3 |
|
... |
... |
... |
... |
... |
|
... |
... |
... |
... |
... |
|
N |
Х1N |
Х2N |
... |
ХkN |
Теперь каждому слагаемому модели (4.17) соответствует определенный столбец этой матрицы: слагаемому В0Х0 – столбец Х0, слагаемому В1Х1 – столбец Х1 и т.д. Такая матрица называется матрицей базисных функций. В табл. 4.4, таким образом, построена матрица базисных функций модели (4.17) для плана в табл. 4.3.
Для отыскания коэффициентов регрессии В0, В1, В2,…, Вk модели (4.17) необходимо проделать выкладки, аналогичные тем, которые были проведены выше для получения коэффициентов В0 и В1 линейной модели с единственным фактором. Опуская их, приведем промежуточный результат – систему нормальных уравнений:
|
N |
N |
N |
N |
N |
B0 |
∑X02j +B1 |
∑X0 j X1 j + B2 |
∑X0 j X2 j +... + Bk ∑X0 j Xkj = ∑X0 j y j , |
||
|
j=1 |
j=1 |
j=1 |
j=1 |
j=1 |
|
N |
N |
N |
N |
N |
B0 |
∑X0 j X1 j |
+B1 ∑X12j + B2 |
∑X1 j X2 j |
+... + Bk ∑X1 j Xkj = ∑X1 j y j , |
|
|
j=1 |
j=1 |
j=1 |
j=1 |
j=1 |
|
N |
N |
N |
N |
N |
B0 |
∑X0 j X2 j |
+B1 ∑X1 j X2 j + B2 ∑X22 j +... + Bk ∑X2 j Xkj = ∑X2 j y j , |
|||
|
j=1 |
j=1 |
j=1 |
j=1 |
j=1 |
66
..............................................................................................................
N |
N |
N |
N |
N |
B0 ∑X0 j Xkj +B1 |
∑X1 j Xkj + B2 |
∑ ...X2 j Xkj + + Bk ∑Xkj2 = ∑Xkj y j . |
||
j=1 |
j=1 |
j=1 |
j=1 |
j=1 |
(4.18)
Система (4.18) построена по тому же принципу, что и система нормальных уравнений (4.10) для линейной однофакторной модели. Ее легко написать, имея матрицу базисных функций (табл. 4.4).
Отметим, что число уравнений этой системы равно числу коэффициентов регрессии, подлежащих определению, т.е. в данном случае k + 1. Ясно также, что в случае применения метода наименьших квадратов число опытов N должно быть не меньше числа p оцениваемых коэффициентов регрессии N ≥ p. План, для которого p = N, называется насыщенным планом. Насыщенные планы не позволяют проверить адекватность математической модели. План, для которого p < N, называется ненасыщенным.
Расчет коэффициентов регрессии и интерпретация результатов эксперимента существенно упрощаются, если преобразовать все факторы в безразмерные параметры, варьируемые в одинаковых диапазонах. Это можно сделать, введя нормализованные обозначения факторов. Пусть в эксперименте варьируются k факторов и Хi – любой из них: i = 1,2, …, k. Его диапазон варьирова-
ния Хimin ≤ Хi ≤ Хimax. Величина Хimax называется верхним уровнем фактора Хi, а величина Хimin – его нижним уровнем. Середину диа-
пазона варьирования фактора Хi назовем его основным уровнем и обозначим Xi0 , Xi0 = (Хimin + Хimax)/2. Разность ∆i = Хimax – Xi0 = Xi0 –
– Хimin называется интервалом варьирования фактора Хi.
Сопоставим теперь произвольному фактору Хi его нормализованное обозначение xi , которое определяется по формуле
xi = (X i − X i(0)) i . |
(4.19) |
Введение нормализованных обозначений факторов по формуле (4.19) удобно по ряду причин. Можно заметить, что независимо от диапазона варьирования любого фактора его нижнему уровню соответствует (–1) в нормализованных обозначениях, верхнему уровню – (+1), основному – 0. Математическая модель объекта, записанная в нормализованных обозначениях факторов, позволяет об-
67
легчить интерпретацию результатов, поскольку диапазоны варьирования всех факторов оказываются одинаковыми и равными (–1), (+1), а все коэффициенты уравнения регрессии имеют одинаковую размерность. Это дает возможность, например, сравнивать степень влияния факторов непосредственно по абсолютным величинам коэффициентов регрессии линейной модели.
Пример. Покажем, как были обработаны результаты эксперимента в п. 3.1 (в нем исследовалось влияние влажности W = X1 и температуры t = X2 на прорастание семян ржи l = y, мм).
Построим матрицу базисных функций линейной модели, дополнив матрицу в табл. 3.1 столбцом X0 сформировав табл. 4.5 и 4.6.
|
|
|
|
|
Таблица 4.5 |
|
|
Матрица плана |
|
|
|
||
|
|
|
|
X2, с |
|
|
Номер опыта |
X0 |
X1, % |
у, мм |
|||
1 |
2 |
3 |
|
4 |
5 |
|
1 |
1 |
6 |
|
40 |
9,0 |
|
2 |
1 |
18 |
|
40 |
5,5 |
|
3 |
1 |
30 |
|
40 |
3,0 |
|
4 |
1 |
6 |
|
80 |
7,5 |
|
5 |
1 |
18 |
|
80 |
4,2 |
|
6 |
1 |
30 |
|
80 |
2,0 |
|
Таблица 4.6
Матрица плана с нормализованными факторами
Номер опыта |
х0 |
х1 |
х2 |
у, мм |
ŷ1,мм |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
1 |
–1 |
–1 |
9,0 |
8,7 |
2 |
1 |
0 |
–1 |
5,5 |
5,8 |
3 |
1 |
+1 |
–1 |
3,0 |
2,95 |
4 |
1 |
–1 |
+1 |
7,5 |
7,44 |
5 |
1 |
0 |
+1 |
4,2 |
4,57 |
6 |
1 |
+1 |
+1 |
2,0 |
1,69 |
68
Согласно экспериментальному плану фактор X1 варьируется на верхнем, нижнем и основном уровне, а фактор X2 – только на верхнем и нижнем уровне.
Перейдем к нормализованным факторам. Распишем сначала формулы (4.19) для каждого из варьируемых факторов: X1min = 6 %,
X1max = 30 %, X10 = (6+30)/2 = 18 %, ∆1 = 18 – 6 = 12 %. В этом слу-
чае формула (4.19) для первого фактора имеет вид x1 = X112−18 .
Аналогичным образом формула, связывающая нормализованные и натуральные обозначения для второго фактора, запишется в виде x2 = X220−60 .
Перепишем матрицу базисных функций в нормализованных обозначениях факторов; она приведена в столбцах 2–4 табл. 4.6.
Для составления системы нормальных уравнений необходимо вычислить суммы произведений элементов каждой пары столбцов
(см. систему (4.18)):
6 |
|
|
∑x02 j =1+1+... +1 = 6; |
|
|
j=1 |
|
|
6 |
6 |
|
∑x0 j x1 j = ∑x1 j = −1+0 +1−1+0 +1 = 0; |
||
j=1 |
j=1 |
|
6 |
6 |
6 |
∑x0 j x2 j = ∑x2 j = 0; |
∑x0 j y j = 31,2; |
|
j=1 |
j=1 |
j=1 |
6 |
6 |
6 |
∑x12j = 4; |
∑x1 j y2 j = 0; |
∑x1 j y j = −11,5; |
j=1 |
j=1 |
j=1 |
6 |
6 |
|
∑x22 j = 6; |
∑x2 j y2 j = −3,8. |
|
j=1 |
j=1 |
|
Теперь система нормальных уравнений (4.18), записанная для нормализованных факторов, сводится к виду: 6b0 = 31,2; 4b1 = = –11,54; 6b2 = –3,8, откуда b0 = 5,2; b1 = –2,87; b2 = –0,63. Таким об-
разом, получена следующая линейная модель для нормализован-
ных факторов y = 5,2 – 2,87x1 – 0,63x2.
69
Для иллюстрации точности, с которой построенная модель предсказывает результаты эксперимента, в последнем столбце табл. 4.6 приведены значения отклика ŷ, рассчитанные по уравнению регрессии для каждого опыта. При переходе к натуральным факторам следует воспользоваться полученными выше формулами, связывающими нормализованные и натуральные обозначения фак-
торов. Подставив в найденное |
уравнение |
регрессии значения |
||||||||||
x = |
X1 −18 |
и x |
= |
X2 −60 |
, получим: |
|
|
|
|
|
||
|
|
|
|
|
|
|
||||||
1 |
12 |
2 |
20 |
|
|
|
|
|
|
|
|
|
|
|
2,87( X1 |
−18) |
|
0,63(X2 |
−60) |
|
|||||
|
|
|
y = 5, 2 − |
− |
. |
|||||||
|
|
|
12 |
|
|
20 |
|
|||||
|
|
|
|
|
|
|
|
|
|
|||
После преобразований будем иметь математическую модель в натуральных обозначениях факторов:
y = 11,4 – 0,24Х1 – 0,0315 Х2 .
Составление системы нормальных уравнений для регрессионных моделей в виде многочленов порядка выше первого.
Идея обобщения метода наименьших квадратов на этот случай заключается в том, что любое произведение факторов, или их степень можно рассматривать в качестве нового фактора. Пусть, например, экспериментатор, исследуя влияние трех факторов на экологический объект, решил задаться моделью
у = B0 + B1 X1 + B2 X 2 + B11 X13 + B22 X 22 + B12 X1 X 2 .
Заменим члены второго и более высокого порядков новыми линейными членами
X13 = X3 ; X 22 = X 4 ; X1 X 2 = X5.
В результате исходная модель заменена линейной с пятью факторами. Таким образом, данный случай сводится к предыдущему.
Для того чтобы выписать систему нормальных уравнений, аналогичным образом составляем матрицу базисных функций по типу табл. 4.4. Каждому слагаемому модели должен соответствовать определенный столбец матрицы. Поэтому она включает все степени и произведения факторов, которые фигурируют в модели (табл. 4.7).
С помощью этой таблицы можно составить систему нормальных уравнений.
70
|
|
|
|
|
|
|
Таблица 4.7 |
|
|
|
Матрица базисных функций |
|
|
||||
|
|
|
|
|
|
|
|
|
Номер опыта |
Х0 |
|
Х1 |
X2 |
X13 |
X22 |
Х1 Х2 |
|
1 |
1 |
|
Х11 |
Х21 |
X113 |
X212 |
Х11, Х21 |
|
2 |
1 |
|
Х12 |
Х22 |
X123 |
X222 |
Х12, Х22 |
|
... |
… |
|
… |
… |
… |
… |
… |
|
... |
.... |
|
… |
… |
… |
… |
… |
|
... |
... |
|
… |
… |
… |
… |
… |
|
N |
1 |
|
Х1N |
Х2N |
X13N |
X22N |
Х1N Х2N |
|
Пример. На шести образцах разных размеров из хвойной древесины проверялась их усушка до конечной влажности 20 %. Необходимо установить зависимость величины усушки образца от его
размера. |
|
|
|
|
|
|
Размер образца, мм |
16 |
19 |
22 |
25 |
32 |
40 |
Величина усушки, мм |
0,6 |
0,6 |
0,7 |
0,8 |
1,0 |
1,2 |
Опишем эту зависимость, с учетом априорной информации, уравнением параболы y = B0 + B1 X1 + B11 X12 , найдя коэффициенты
В0, В1, В11 по методу наименьших квадратов. В табл. 4.8 построена матрица базисных функций этой модели, дополненная столбцом значений выходной величины.
Таблица 4.8
Матрица базисных функций для моделей примера
Номер опыта |
Х0 |
Х1 |
X12 |
y, мм |
ŷ, мм |
1 |
1 |
16 |
256 |
0,6 |
0,57 |
2 |
1 |
19 |
361 |
0,6 |
0,64 |
3 |
1 |
22 |
484 |
0,7 |
0,71 |
4 |
1 |
25 |
625 |
0,8 |
0,80 |
5 |
1 |
32 |
1024 |
1,0 |
0,98 |
6 |
1 |
40 |
1600 |
1,2 |
1,21 |
Для этого случая получим следующую систему нормальных уравнений:
71
