- •Глава 3 активный эксперимент. Ортогональные планы первого порядка
- •Полный факторный эксперимент
- •Обработка результатов эксперимента
- •Дробный факторный эксперимент
- •Применение планов первого порядка в отсеивающих экспериментах
- •Глава 4 планирование эксперимента при отыскании экстремальной области
- •Классические методы определения экстремума
- •Факторные методы определения экстремума
- •Центральные композиционные планы второго порядка
- •Ортогональные центральные композиционные планы
- •Глава 5 дисперсионный анализ при экспериментальном исследовании
- •Однофакторный дисперсионный анализ
- •Двухфакторный эксперимент. Иерархическая и перекрестная классификации
- •Латинские и греко-латинские квадраты
Факторные методы определения экстремума
К факторным методам поиска экстремальной области относится метод крутого восхождения (метод Бокса — Уилсона) [31]. Среди методов, рассматриваемых теорией планирования эксперимента, метод крутого восхождения (будем рассматривать нахождение максимума функции отклика) является связующим между начальным и конечным этапами исследования.
Основная идея метода заключается в том, что на начальном этапе на основании ПФЭ или ДФЭ получают простейшие линейные модели в качестве приближенного описания некоторой части функции отклика, далекой от экстремума. Коэффициенты модели, полученной в результате ПФЭ и ДФЭ, пропорциональны проекциям вектор-градиента и позволяют оценить само направление градиента, т. е. направление самого крутого склона поверхности отклика. Затем вдоль этого направления совершается постепенное шаговое движение к области экстремума (отсюда и само название метода). Метод крутого восхождения (МКВ) сочетает лучшие свойства классических методов — градиентного и Гаусса — Зейделя. Сходство с градиентным методом заключается в том, что при реализации МКВ происходит также продвижение к области экстремума в направлении градиента, найденного на основании пробных опытов в окрестности базовой точки. Однако на этом их сходство и заканчивается. По классическому градиентному методу ставятся по два пробных опыта по обе стороны от базовой точки (см. рис. 4.2) путем поочередного варьирования каждой из входных величин при стабилизации остальных п — 1 факторов, а по МКВ пробные опыты ставятся в соответствии с матрицей плана ПФЭ или ДФЭ. При факторном эксперименте в оценке каждого коэффициента модели, а следовательно, каждой составляющей градиента, участвуют все N точек (опытов). Поэтому эти оценки получаются более точными, чем при классическом градиентном методе, где каждая составляющая градиента вычисляется только по двум точкам. Найденное таким образом по МКВ направление градиента более помехозащищенно и достоверно. В этой связи в найденном направлении градиента можно осуществлять несколько, а не один, пробных шагов до достижения частного экстремума. В этом состоит сходство МКВ с методом Гаусса — Зейделя. Однако по классическому методу предполагается фиксация п — 1 независимой переменной при продвижении к экстремуму по варьируемой переменной. Продвижение осуществляется вдоль оси-фактора, что замедляет продвижение к области экстремума. Таким образом, МКВ позволяет гораздо быстрее и надежнее по сравнению с классическими методами достичь экстремальной области. Кроме того, МКВ позволяет получить информацию о степени крутизны поверхности в районе базовой точки — эта информация заложена в коэффициентах взаимодействий.
Рис.4.3. К использованию метода крутого восхождения (спуска)
Допустим задана базовая точка К0 (рис. 4.3). Приняв ее за центр плана, поставим в ее окрестностях ПФЭ (или ДФЭ). Важной особенностью МКВ является проведение статистической оценки результатов ПФЭ, что значительно повышает надежность интерпретации этих результатов.
Допустим, по результатам опытов в области базовой точки получено линейное уравнение регрессии (в кодированной системе координат)
содержащее
статистически значимые коэффициенты.
Выше было
показано,
что найденные оценки коэффициентов
(
)
пропорциональны проекциям вектор-градиента
на оси-факторы. Следовательно, по оценкам
линейных коэффициентов
можно
оценить и направление вектор-градиента,
по которому с выбранным шагом можно
осуществлять продвижение к частному
экстремуму. О достижении частного
экстремума, как и по методу Гаусса —
Зейделя, можно судить по неравенству
Ym-1
<Ym>
Ym+l.
Если
данное неравенство выполняется, точка
Кi
является
точкой частного экстремума, ее принимают
за базовую и в окрестностях реализуют
ПФЭ или ДФЭ. Для случая, приведенного
на рис. 4.3, при продвижении в направлении
градиента (луч К0М)
такой точкой будет точка К8.
В реальных условиях на исследуемом объекте рассматриваются входные переменные в реальном масштабе, варьирование независимых переменных осуществляют в естественных координатах. Полный или дробный факторный эксперимент дает значения функции отклика в кодированной системе координат. Поэтому при оценке составляющих градиента следует учитывать значения ступеней варьирования по каждому фактору, а также то, что значение составляющих градиента зависит и от масштаба измерения (представления) факторов. Поэтому в течение всего эксперимента независимые переменные необходимо измерять (задавать) в одних и тех же единицах, сохранять постоянный масштаб.
Для вычисления координаты точки Ki в направлении градиента при поиске частного экстремума необходимо определить взаимосвязь между шагом варьирования j-й независимой переменной в естественной и кодированной системах координат. При этом на основании уравнения регрессии, полученного по результатам ПФЭ или ДФЭ в окрестностях базовой точки, устанавливают наиболее существенный фактор, например k-й. Оценка коэффициента по этому фактору по абсолютной величине максимальна по сравнению с другими оценками коэффициентов. Из физических соображений для данного фактора выбирается шаг варьирования в естественном масштабе λк. Исходя из известного соотношения между значением фактора в кодированной хк и естественной Хк системе координат
(4.4)
где
можно установить взаимосвязь между λк
и нормированным шагом λ
варьирования независимой переменной
в кодированной системе координат.
Так
как точка со значением
для пробного ПФЭ и ДФЭ лежит в центре
плана (на рис. 4.3 это точка К0)
и, начиная с нее, начинается продвижение
к экстремуму в направлении градиента,
то координата по Хк
первой точки в направлении экстремума
(для рассматриваемого примера точки
К5)
определится как разность
(4.5)
На основании соотношения (4.4) в кодированной системе координат получим для точки К5
(4.6)
Однако для кодированного значения k-го фактора для точки К5 можно записать
(4.7)
Как
уже отмечалось, точка К0
лежит в центре плана, поэтому
и
(4.7)
Сопоставив выражения (4.6) и (4.7), получим взаимосвязь между шагом варьирования k-го фактора λк в натуральных единицах с нормированным шагом варьирования λ в кодированных единицах:
(4.8)
Так как первоначально был выбран шаг варьирования наиболее существенной переменной λk, то для того чтобы продвигаться в направлении градиента, найденного на основании факторного эксперимента, необходимо, исходя из выражения (4.8) для нормированного шага, найти значение в натуральных единицах шагов варьирования остальными факторами. Он будет
В этом случае получим координаты точки К5 (первой точки), лежащей на направлении градиента.
Используя соотношения:
(4.9)
полученные
из выражений (4.5), (4.7) с учетом Хjср
=
и
=
0, можно находить координаты точек,
лежащих на направлении градиента, где
l
— шаг продвижения в направлении
градиента.
Пример. По МКВ определить экстремальную область для функции отклика. На вход объекта воздействуют два фактора Х1 и Х2, для которых задано (в натуральных единицах):
Определим координаты базовой точки и интервалы варьирования факторов:
Таблица 4.1
N |
x1 |
x2 |
|
N |
x1 |
x2 |
|
1 |
-1 |
-1 |
95,0 |
3 |
-1 |
+1 |
85,0 |
2 |
+1 |
-1 |
90,0 |
4 |
+1 |
+1 |
82,0 |
В окрестностях базовой точки Хjср = в соответствии с матрицей планирования ПФЭ провели эксперимент и получили значения выходной величины (функции отклика) в соответствии с табл. 4.1.
На
основании формулы
определим
значения коэффициентов:
Таким образом, уравнение регрессии, полученное в окрестности базовой точки имеет вид
Наиболее существенно влияет на изменение функции отклика фактор Х2, так как коэффициент при нем по модулю наибольший.
Выберем шаг варьирования фактором Х2, равный λ2 = — 0,5 (шаг взят со знаком «минус», так как отыскивается максимум, а увеличение значения Х2 в исходном уравнении регрессии приводит к уменьшению оценки выходной величины).
Затем определим нормированный шар варьирования факторов в кодированной системе координат:
округляем до первой значащей цифры после запятой λ = —0,1. Зная λ, можно определить шаг, варьирования фактором Х1 в натуральных единицах, позволяющий найти координаты первой точки в направлении градиента (аналогично точке К5 на рис. 4.3)
Тогда координаты точки К5 при условии, что l=1 (первый шаг продвижения к экстремуму), определяются в соответствии с (4.9):
Установив значения Х1 = 1, 4 и Х2 = 6,5, в результате опыта получим значение функции отклика Y (К5).
Значение выходной величины (вернее, его оценку) можно получить и на основании уравнения регрессии, используя выражение (4.9) для определения кодированных значений факторов при l = 1:
Тогда
Рис. 4.4. Сечение поверхности отклика в направлении крутого восхождения
В каждой рабочей точке необязательно проводить реальные опыты. Чтобы уменьшить объем исследований, а следовательно, увеличить их эффективность, часть натурных, опытов на объекте заменяют на так называемые «мысленные». «Мысленные» опыты заключаются в получении значений выходной величины на основании имеющегося линейного уравнения регрессии при подстановке в него координат рабочей точки, определенных на основании выражения (4.9), как это было проделано выше. Реальные проверочные опыты проводятся через два-три «мысленных» опыта. На рис. 4.4 изображено сечение поверхности отклика вертикальной плоскостью, след которой проходит через луч K0M (см. рис. 4.3). «Идеальная» кривая 1 представляет собой действительное сечение поверхности отклика, а прямая 2 — значения выходной величины, полученные (предсказанные) на основании линейного уравнения регрессии.
Первый цикл крутого восхождения прекращается после прохождения частного экстремума (точка К8), о чем судят по реальным опытам. Поэтому по мере приближения к частному экстремуму следует чаще проводить проверочные опыты, а после прохождения частного экстремума в ряде случаев поставить дополнительный проверочный опыт в промежутке между теми двумя рабочими точками, после которых началось уменьшение выходной величины и в которых достигнуты примерно одинаковые и самые большие из всех предыдущих значения Y. Кроме того, как следует из рис. 4.4, о прохождении области частного экстремума свидетельствует изменение знака разности между расчетными и опытными данными («мысленными» и натуральными опытами).
Второй цикл начинается из достигнутой точки частного экстремума, принятой за новую базовую точку, в окрестностях которой ставится ПФЭ или ДФЭ. По мере приближения к. экстремальной области шаг варьирования следует уменьшать. Полученная новая линейная модель дает новое направление градиента, вдоль которого проводятся «мысленные» и проверочные опыты до достижения в данном направлении частного экстремума.
Признаком достижения глобального экстремума является неадекватность линейной модели, полученной на основании ПФЭ или ДФЭ, когда коэффициенты при факторах становятся незначимыми, коэффициенты при парных взаимодействиях резко возрастают.
Рассмотрим пример применения метода крутого восхождения при определении экстремальной (максимальной) области (основу его составляет приведенный в [19] пример изучения оптимального состава легированной стали).
Функция отклика Y зависит от семи факторов, граничные значения которых выбирались на основании накопленного ранее опыта. Исходные данные, матрица планирования, результаты опытов для пробных точек, координаты шагов варьирования при продвижении к экстремуму и значения функции отклика в этих точках сведены в табл. 4.2.
Для
определения направления градиента в
окрестностях базовой точки с уровнем
достаточно
в ее окрестностях построить линейную
регрессионную модель, аппроксимирующую
поверхность отклика
коэффициенты которой пропорциональны проекциям градиента. Для этой цели достаточно, провести N ≥ 8 опытов. Следовательно, в окрестностях базовой точки достаточно провести ДФЭ вида 27-4, в котором факторы х1, х2 и х3 считаются основными и для которых матрица плана строится по известному правилу, как при ПФЭ.
Таблица 4.2
Уровни варьирования дополнительных факторов устанавливаем на основании четырех генерирующих соотношений, которым соответствуют определяющие контрасты. Пусть были выбраны следующие ГС:
которые дадут соответственно ОК:
В
обобщенный определяющий контраст будут
входить исходные ОК, а также их
сочетания по 2, по 3 и одно сочетание
из всех четырех ОК. Общее число сочетаний,
входящих в ООК, составит 4 + 6 + 4+1 = 15, и
даст весьма сложную картину смешивания
оценок коэффициентов. Однако смешивание
оценок определять не надо, так как цель
пробных опытов при МКВ — это
определение направления градиента,
т.е. оценок коэффициентов
при
фактора.
В соответствии с матрицей ДФЭ вида 27-4 при выбранных ГС были проведены опыты и получены значения функции отклика в точках плана. Исходя из формулы
найдены оценки коэффициентов и уравнение регрессии
Наиболее
существенным является фактор х3,
т. к. коэффициент
по модулю, является самым большим
из
всей совокупности
.
Для него устанавливаем шаг варьирования,
например, λ3
= 0,02.
Тогда в соответствии с (4.8) нормированный шаг варьирования
откуда
в соответствии с выражением
определим расчетные значения шага
варьирования входными величинами
в естественной системе координат,
позволяющие получить координаты точек,
лежащих на направлении градиента.
Так, для переменной Х1
рабочий шаг варьирования
Аналогично определяются и другие λj (результаты занесены в соответствующую строку табл. 4.2).
При
крутом восхождении нет необходимости
проводить реально все опыты — их можно
заменить на «мысленные». Для этого на
основании соотношения (4.9) определяются
значения xj
и
рассчитывается значение
Так, для первого «мысленного» опыта расчетное значение выходной величины
Аналогично
найдем значения выходной величины для
точек в направлении градиента, в которых
проводятся «мысленные» опыты, и
занесем их в табл. 4.2. Как уже отмечалось,
что на начальном этапе поиска экстремума
натурный (реальный) опыт можно ставить
через три—пять «мысленных». В
рассматриваемом примере натурный опыт
ставится после четырех «мысленных» и
полученное, значение
сравнивается
с расчетным
.
В соответствии с рис. 4.4 можно предположить,
что область экстремума уже пройдена,
так как
,
т.е.
расчетное значение больше реального.
Поэтому следующий (шестой) опыт также
надо провести натурным, чтобы уточнить
область экстремума (в. действительности
при пятом опыте находились вблизи этой
области). Шестой опыт показывает, что
область экстремума еще не достигнута,
так как
.
Следовательно, тот факт, что в пятом
опыте расчетное значение
больше
значения, полученного опытным путем
,
можно
объяснить только тем, что уравнение
регрессии хорошо аппроксимирует
поверхность отклика лишь в области
базовой точки (об этом можно судить о
совпадении расчетных и опытных данных
при реализации ДФЭ 27-4).
Это следует из того, что ДФЭ 27-4
дает смешивание оценок и поэтому линия
регрессии во всех точках будет давать
значения функции отклика больше, чем
в экспериментальных данных (на рис. 4.4
данная ситуация представлена
пунктирной линией). В дальнейшем
проводим только натурные опыты. Так
как значение выходной величины,
полученное в шестом опыте, будет больше
значений, полученных в седьмом, а также
в девятом и десятом опытах, то точка
восьмого опыта находится в области
частного экстремума в найденном по ДФЭ
27—4
направлении
градиента. На этом заканчивается первый
цикл крутого восхождения, из рассмотрения
которого следует, что даже за один цикл
достигнуто значение функции отклика
(
),
которое в 2,5 раза превосходит значение
в базовой точке
,
что свидетельствует об эффективности
МКВ.
После достижения области экстремума проводится ее исследование. Для этой цели строятся планы более высокого порядка, так как поверхность отклика вблизи экстремума плохо аппроксимируется гиперплоскостью. Как уже отмечалось, о достижении экстремальной области свидетельствует уменьшение по абсолютной величине коэффициентов при факторах и резкое возрастание коэффициентов модели, полученной на основании ПФЭ или ДФЭ в области текущей базовой точки.
