2.8.4. Алгоритм построения регрессионных моделей
на основе планирования экспериментов
Рассмотрим последовательность проведения экспериментов при построении математической модели экспериментально-статистическими методами.
1. На первом шаге необходимо выполнить
содержательное описание исследуемого
объекта, выделив два множества
характеристик: зависимые и независимые.
Зависимые характеристики можно
рассматривать как составляющие вектора
выходных координат объекта Y.
Для построения математической модели
в форме уравнения регрессии выбираем
одну из составляющих этого вектора (
).
В создаваемой модели
рассматривается в качестве выходного
параметра (
).
2.
Используя выборку наблюдений за
,
выполняют проверку гипотезы о нормальном
законе распределения для выходного
параметра, а также допущения о
стационарности объекта. Чтобы оценить
характер эмпирического распределения
можно использовать критерий Пирсона:
|
|
где K – число интервалов
разбиения выборки N;
– число значений случайной величины
,
попавших в j-й интервал;
–
частота появления значений случайной
величины
в j-м интервале.
Гипотезу о нормальном законе распределения можно принять, если
|
|
где
– число оцениваемых параметров в законе
распределения.
3. Проводится анализ множества независимых характеристик, в ходе которого выделяются характеристики линейно независимые, существенно влияющие на . В создаваемой модели эти характеристики будут рассматриваться в качестве факторов (Х).
4. Для
каждого фактора определяется допустимый
интервал, определяющий границы изменений
.
Нарушение этого интервала может привести
к аварийным последствиям.
5.
Выбирается базовая точка факторного
пространства, которая совмещается с
центром плана
.
6. Для
каждого фактора определяется шаг его
варьирования
Основное требование к шагу состоит в
том, чтобы он не был меньше удвоенной
среднеквадратичной ошибки фактора [9].
Иными
словами, изменение фактора на величину
должно значимо (не случайно) влиять на
выходной параметр. При этом выполняется
требование:
Обычно шаг варьирования определяется
на основе априорной информации и при
необходимости корректируется.
7. Задается число уровней варьирования для каждого фактора. Наибольшее распространение получили планы с основанием два (при L=2).
Двухуровневый план эффективен (n>3), когда для проверки адекватности модели имеется достаточное число степеней свободы, т.е. имеется превышение числа опытов N над числом определяемых коэффициентов модели (n+1).
8. Рассчитываются верхние и нижние границы значений факторов для выбранного шага варьирования:
9. Составляется матрица планирования полного (или дробного) факторного эксперимента.
10. На основе матрицы планирования и с учетом вида физических параметров, изменяемых в ходе опытов, формируется список (S1), устанавливающий последовательность чередования опытов.
11. Выполняется весь объем экспериментальных исследований в соответствии с (S1). Регистрируется выборка значений выходного параметра (Y), по возможности выполняются параллельные замеры (Y). Пример в табл. 2.15.
12. Для оценки воспроизводимости (Y) рассчитываются выборочная дисперсия параллельных измерений (2.21) и критерий Кохрена (2.22) (пример в табл. 2.16).
Таблица 2.15
i
|
X1
|
X2
|
X3
|
y1
|
y2
|
y3
|
1 |
1 |
1 |
1 |
7,7 |
8,2 |
7,8 |
2 |
-1 |
1 |
1 |
2,1 |
2,6 |
2,2 |
3 |
1 |
-1 |
1 |
3,1 |
3,6 |
3,2 |
4 |
-1 |
-1 |
1 |
-0,1 |
0,4 |
0 |
5 |
1 |
1 |
-1 |
5 |
5,1 |
5,8 |
6 |
-1 |
1 |
-1 |
0,2 |
0,3 |
1 |
7 |
1 |
-1 |
-1 |
3,2 |
3,3 |
4 |
8 |
-1 |
-1 |
-1 |
0,8 |
0,9 |
1,6 |
Таблица 2.16
y1
|
y2
|
y3
|
y_sr
|
Дисперсия
|
7,7 |
8,2 |
7,8 |
8,4 |
0,07 |
2,1 |
2,6 |
2,2 |
4,4 |
0,07 |
3,1 |
3,6 |
3,2 |
6,4 |
0,07 |
-0,1 |
0,4 |
0 |
2,4 |
0,07 |
5 |
5,1 |
5,8 |
7,6 |
0,19 |
0,2 |
0,3 |
1 |
3,6 |
0,19 |
3,2 |
3,3 |
4 |
5,6 |
0,19 |
0,8 |
0,9 |
1,6 |
1,6 |
0,19 |
|
|
|
G_ras = |
0,046053 |
13. Если
,
то воспроизводимость выходного параметра
хорошая, и выборку Y можно
использовать для построения модели
(перейти к шагу 14). Если
,
то выборочные дисперсии параллельных
измерений Y не однородные
и следует проанализировать причину
такого результата. Необходимо выделить
точки с большим отклонением от среднего
по параллельным замерам и повторить
эти опыты (перейти к шагу 11).
14. Выполняется расчет оценок дисперсии воспроизводимости (2.24), оценок линейных коэффициентов регрессии, средних квадратических отклонений коэффициентов регрессии и расчетных значений критерия Стьдента (пример на рис. 2.23).
15. Если
,
то коэффициент
значимый, если
,
то
случайно отличен от нуля, это незначимый
коэффициент
.
После удаления всех незначимых
коэффициентов переход к шагу 16.
16. Расчет критерия Фишера для линейного уравнения. Например,
Результаты расчетов, полученные в Excel, приведены на рис.2.24.
17. Если
то перейти к шагу 18, иначе – к шагу 20.
18. Расчет коэффициента множественной корреляции.
Рис.2.23. Результаты расчетов на шаге 14, полученные в Excel
19. Если
,
то рекомендуется увеличить число
факторов и перейти к шагу 4. Если
,
то можно принять гипотезу о математической
модели в виде линейного уравнения
регрессии
.
Модель в виде найденного линейного
уравнения регрессии адекватна.
|
Рис.2.24. Результаты расчетов на шаге 16, полученные в Excel
|
20. Для
повышения точности уравнения модели
можно попытаться уменьшить шаг
варьирования факторов
Если
условие
выполняется, то следует вернуться к
шагу 8 и повторить расчет коэффициентов,
характеризующих линейные эффекты.
Если уменьшить шаг варьирования факторов не удается, то необходимо дополнить уравнение эффектами взаимодействия.
21.
Выполняется оценка коэффициентов
регрессии (
),
характеризующих взаимодействия (2.79),
средних квадратических отклонений
коэффициентов (
)
и расчетных значений критерия Стьюдента
(
).
Если
,
то коэффициент
значимый, если
,
то
случайно отличен от нуля, это незначимый
коэффициент (
).
После удаления всех незначимых
коэффициентов переход к шагу 22.
22. Расчет критерия Фишера для уравнения вида
23. Если
то перейти к шагу 24, иначе – к шагу 26.
24. Расчет коэффициента множественной корреляции.
25. Если
,
то рекомендуется увеличить число
факторов и перейти к шагу 4. Если
,
то можно принять гипотезу о математической
модели в виде нелинейного уравнения
регрессии
.
Модель в виде найденного нелинейного уравнения регрессии адекватна.
26. Необходимо перейти к формированию плана второго порядка: ортогонального, центрального, композиционного плана (ОЦКП).
В
качестве ядра плана принимается матрица
планирования, созданная на шаге 9.
Задаются параметры
.
Корректируется матрица плана.
27. Проводятся дополнительные опыты: в звездных точках и в центре плана. Регистрируется выборка значений выходного параметра (Y) в дополнительных опытах.
28. Так как выборка Y расширена новыми значениями, необходимо выполнить заново проверку воспроизводимости (2.21), (2.22).
29. Если
,
то воспроизводимость выходного параметра
хорошая, и выборку Y можно
использовать для построения модели
(перейти к шагу 30). Если
,
то выборочные дисперсии параллельных
измерений Y не однородные
и следует проанализировать причину
такого результата. Необходимо выделить
точки с большим отклонением от среднего
по параллельным замерам
и
повторить эти опыты (перейти к шагу 27).
30. Расчет оценок дисперсии воспроизводимости (2.24), оценок коэффициентов регрессии (2.92) - (2.94), средних квадратических отклонений коэффициентов и расчетных значений критерия Стьюдента.
31. Учитывая условие (2.90), из уравнения модели удаляются все незначимые коэффициенты.
32. Выполняется расчет критерия Фишера для квадратичного уравнения вида
33. Если то надо перейти к шагу 34, в противном случае следует переходить к другим формам нелинейных зависимостей (например, трансцендентному уравнению).
34. Расчет коэффициента множественной корреляции. Если , то рекомендуется увеличить число факторов и перейти к шагу 4. Если , то можно принять гипотезу о математической модели в виде квадратичного уравнения регрессии. Модель в виде найденного уравнения регрессии адекватна:
