![](/user_photo/_userpic.png)
книги из ГПНТБ / Кориков А.М. Математические методы планирования эксперимента учеб. пособие
.pdfГЛАВА-17
ПОИСК ОПТИМАЛЬНОЙ ОБЛАСТИ
§ 4 - 1 . В в о д н ы е |
з а м е ч а н и я |
Решение большого числа |
разнообразных задач управления, |
проектирования и планирования, а также разработки техноло гии различных процессов (ггамических, физических и металлур гических'! в той или иной мере связано с оптимизацией, т . в . нахождением наилучших в определенном смысл" значений раз личных параметров (факторов). Задача оптимизации может быть решена путем исследования математической зависимости, описы вающей область факторного пространства в широком интервале изменения факторов.
Однако такие зависимости часто бывают очень сложны,и их исследование для определения оптимума является гсрайне труд ной задачей, Исследователи идут обычно другим путем: внача ле тем или иным способен цаходят оптимальную область, а за тем описывают её уравнением второго или третьего порядка. В настоящее вреда существует много различных,методов поиска оптимальной области. -Их можно разбить на две группы: детер минированные и статистические. В детерминированных методах поиска движение к оптимальному осуществляется на основе ин формации, получаемых от пробных движений, совершаемых в опре деленной последовательности. В статистических методах поис-
-91 -
ка пробные движения производятся в той или иной мере случай ным образом, а движение к оптимуму является вполне оп ределенным следствием реакций на случайные пробы. В прак тике планирования эксперимента наиболее широко применяются детерминированные методы псзска.
§ 4 - 2 . М е т о д Г а у с с а-3 е й д е л я Среди детерминированных методов поиска оптимальной сб-
ласти наиболее старым является метод Iaycca-Зейделя, при ко тором все факторы, кроме одного, поочередно фиксируются. Это известная нам из § В-3 схеыа сднофакаорного эксперимента.
Здесь исследователь изучает поведение каждого фактора в от дельности. Ставится серия опытов при различных значениях не зафиксированного фактора и таким образом, двигаясь парал лельно одной из осей факторного пространства, исследователь находит наилучшее для рассматриваемого разреза поверхности отклика значение параметра оптимизации. Затем в этой наилуч шей точке он поворачивается и ставит следующую серию опытов при различных значениях следующего фактора (остальные фак торы при этом зафиксированы). Таким образом осуществляется движение параллельно следувярй оси факторного пространства. Последовательнее прохождение всех осей факторного простран ства составляет первый цикл исследования. Процедуру повто ряют до получения оптимум ЕЛИ ДС попадания в некоторую гочку, любое движение из которой "ухудшает" значение параметра оптимизации. Распространенным недостатком проведения экспе римента по этому методу является прекращение работы после
|
- э |
г |
- |
|
|
выполнения первого цикла. |
|
|
|
|
|
Метод Гаусеа-Зейделя требует |
большого |
количества |
опытов. |
||
§ 4 - 3 . М е т о д |
к р у т о г о |
в о с х о ж д е н и я |
|||
В 1 9 5 I году Бокс |
и Уилсон предложили |
использовать |
после |
||
довательный— "шаговый" - метод |
изучения поверхности |
откли- . |
ка, напоминающий итерационный метод .решения задач вычисли
тельной математики. Вначале давится небольшая серия опытов (дробный факторный эксперимент) для локального описания не
большого участка поверхности отклика полиномом первой сте
пени. Далее движение осуществляется по поверхности отклика
в направлении градиента линейного приближения. Это движение
сопровождается одновременным изменением значений в с е х
факторов. Если одного линейного приближения оказывается не
достаточно, то ставится новая небольшая серия опытов и нахо
дится новое направление для движения по поверхности отклика.
Такой шаговый процесс движения по поверхности отклика про
должается до тех пор, пока исследователь не попадет в "почти
стационарную область", где линейное приближение сказывается
уже недостаточным ; здесь ставится большая серия опытов и по
верхность отклика описывается полиномом второго, а иногда
третьего порядка. При таком подходе к задаче достигается
весьма высокая концентрация опытов в той части поверхности
отклика, которая преимущественно интересует исследователя.
Движение по градиенту давно известно в науке. Существен
но новым в м е т о д е Б о к с а - У и л с о н а |
(так |
иногда называют1 этот метод) является использование |
метода |
9 »
градиента в сочетании о дрсбннм факторный экспериментом для локального описания поЛрхности отклика. Этим, собственно^ определился успех метода.
Известно, что движение в направлении градиента - это
движение по кратчайшему, наиболее крутому пути ; отсюда наз
вание |
к р у т о е |
в о с х о ж д е н и е . Вели поверхность |
отклика |
локально может быть описана линейным уравнением, то |
|
частные производные |
будут равны коэффициентам регрессии. В |
этом случае для движения в напрахлении крутого восхождения нужно будет независимые переменные изменять пропорционально величине соответствующих коэффициентов регрессии, с учетом их знака. При постановке эксперимента всегда пригодится пе реходить к натуральным переменным. В натуральных переменных величина вага должна быть пропорциональна произведению $-и на интервал изменения ь - го фактора.
Сравнение метода Гаусса-Зейделя с методом крутого вос хождения иллюстрирует рис . 4 . 1 .
Рис. 4. /
- 9 4 -
На рисунке пунктирной линией показано движение по мето
ду Гаусса-Зейделя, а сплошной - по методу крутого восхозде- , -• ния. Из рисунка ясно, что при использовании метода крутого восхождения путь, который необходимо пройти экспериыентато-
ру, значительно сокращается. С возрастанием числа факторов эффект от применения метода крутого восхождения возрастает.
Практическое применение метода Бокса-Уилсона неразрывно связано с принятием решений после построения линейного при ближения (линейной модели) и после крутого восхождения.Оче
видно, что рассмотрение этих вопросов может оказаться по лезным и для других методов поиска оптимальной области.
4 - 3 . 1 . П р и н я т и е |
р е ш е н и й п о с л е |
л о - |
|
о т р о е н и я |
л и н е й н о й |
м о д е л и |
|
Решения зависят от чисда факторов, дробности |
плана, |
цели |
исследования (достижение оптимума, построение интерполяцион ной формулы) и т . д . Пр*дМерное количество возможных решений достигает нескольких десятков тысяч. Поэтому ниже обсудим только "типичные" решения. Ситуации будем разлсчать по адек ватности и неадекватности модели, значимости и незначимости коэффициентов регрессии в модели, информации о положении оп тимума.
Обсудим сначала принятие решения для случая |
а д е к |
||
в а т н о й |
л и н е й н о й |
м о д е л и . Здесь |
возможны |
3 варианта: |
|
|
|
1 . Все коэффициенты регрессии значимы. |
|
||
2 . Часть |
коэффициентов |
регрессии значима, часть назначдаа. |
- 9 5 -
3 . Все коэффициента регрессии незначимы.
В каждом варианте оптимум может быть близко, далеко
или о его положении нет информации (неопределенная ситуа
ция).
Рассмотрим п е р в ы й вариант.
Если область оптимума близка, возможно 3 решения: окон
чание исследования, переход к планам второго порядка и дви
жение по градиенту.
Решение при неопределенной ситуации или удаленной об
ласти оптимума одно и то же: движение по градиенту.
Известно, что движение по градиенту наиболее эффективно,
если коэффициенты значимы, поэтому во в т о р о м вариан
те выбираются решения, реализация которых приводит к полу
чению значимых коэффициентов:
1)изменение интервалов варьирования;
2)перенос центра плана ;
3)отсеивание незначимых факторов }
4)увеличение числа параллельных опытов ;
5 ) достройка плана.
Достройка плана осуществляется несколькими способами.
1 . Методом "перевала" - у исходной реплики изменяют зна
ки на обратные.
2 . Переходом к полному факторному эксперименту.
3 . Переходом к реплике меньшей дробности. . -
4 . Переходом к плану второго порядка (если область опти мума близка).
Реализация любого из этих решений требует больших аксяе-
- 9 6 -
риментальшх усилий. Поэтому иногда стоит пойти на некото
рый риск и двигаться только |
по |
значимым факторам. ' |
Рассмотрим т р е т и й |
вариант: все коэффициенты |
|
регрессии незначимн (кроме |
Ь0 |
) . Чаще всего это происходит |
из-за большой ошибки эксперимента или из-за узких интерва
лов варьирования. Поэтому возможные решения направлены на увеличение точности эксперимента путем улучшения методики
исследования или постановкой параллельных опытов, а тайке на расширение интервалов варьирования. Если область оптиму ма близка, то возможно также окончание исследования или
построение плана второго |
порядка. |
|
Рассмотрим принятие |
решений в случае |
н е а д е к в а т |
н о й л и н е й н о й |
п о д е л и . Если |
линейная модель |
неадекватна, значит не удается аппроксимировать поверхность отклика плоскостью. Формальные признаки (кроме величины
Б -критерия), по которым можно установить неадекватность
линейной |
модели, |
следующие; |
|
|
|
|
|
Значимость |
хотя бы одного эффекта |
взаимодействия. |
|||||
2 . Значимость суммы коэффициентов регрессии при квадра |
|||||||
тичных членах Т |
л . • . Оценкой этой |
суммы служит разность |
|||||
j |
с 1 |
" |
|
|
|
|
|
между 0 0 |
и значением |
в |
центра |
плана |
i j a . Ее ни |
разность |
|
превосходит ошибку опыта, |
то |
гипотеза о незначиыости |
I I |
не может быть принята. Однако надо учесть, что сумма может быть незначима и при значимых квадратичных эффектах, если они имеют разные знаки.
Если область оптимума близка, то либо доследование з*—
- 97 -
канчивается, либо реализуется план второго порядка. Такие ре шения, как изменение интервалов варьирования, перенос центра плана и достройка плана, применяются для получения линейной модели. Иногда отказываются от построения адекватной модели, чтобы ценой нескольких опытов проверить возможность движения по градиенту. Еще одно решение: включение в модель эффектов взаимодействия и движение с помощью неполного полинома второ го порядка. Этот прием связан с получением и анализом уравне ний второго порядка. Направление градиента будет меняться от точки к точке.
Наконец, если поставлена задача построения интерполяцион ной фор*7лы, то на получении адекватной модели исследование
заканчивается, а в случае неадекватной модели принимается од-
*
но из следующих решений: включение в модель эффектов взаимо действия, достройка плана, преобразование переменно, изме нение интервалов варьирования. Если не удалось все же полу чить адекватную модель, то остается разбить область экспери мента на несколько подобластей и описать отдельно каждую из
них.
4 - 3 . 2 . П р и н я т и е р е ш е н и й п о с л е к р у т о г о в о с х о ж д е н и я
После завершения крутого восхождения исследователя ожидают довольно разнообразные ситуации, требующие принятия решений о дальнейших действиях. Ситуации различаются по признакам: ока залось крутое восхождение эффективным или нет ; положение опти мума (близко, далеко, неопределенно). В некоторых случаях нужно
- 98 -
учитывать адекватность (или неадекватность) линейной модели.
Об эффективности дваяеяш по градиенту судят по величи
не параметра оптимизации. Движение по градиенту считается эф фективным, если реализация масленных опытов, рассчитанных на стадии крутого восхождения, приводит к улучшению значения параметра оптимизации по сравнении с самым хорошим результа том в матрице планирования.
Если |
к р у т о , е |
в о с х о ж д е н и е |
э ф ф е к т и в |
н о й область оптимума |
близка, то возмозность 2 решения: |
||
окончание |
исследования |
и достройка линейного |
плана |
до плана второго порядка в целях описания области оптимума. Какое решение выбрать - это зависит от того, как сформулиро вана задача оптимизации. Если область оптимума далека, то ре шение одно: построение линейного приближения нового цикла. Б неопределенной ситуации, когда экспериментатор не может опре делить степень близости оптимума, также можно переходить к
построению новой линейной модели. |
|
||
Если |
к р у т о е |
в о с х о ж д е н и е |
н е э ф ф е к |
т и в н о |
и область |
оптимума близка, наиболее |
типичные реше |
ния: окончание исследования (выбирается лучший опыт) или пост роение плана второго порядка для описания области оптимума.
Если линейная модель была неадекватна, то возможно и третье решение: выяснение причин неадекватности линейной модели.
Если область оптимума далека и линейная модель адекватна, но все же крутое восхождение оказалось неэффективным, то воз можное объяснение - в характере поверхности отклика (см.рис.
4 . 2 ) .
- 99 -
1 л
Рис. 4 . 2 .
I - исследованная область факторного простран ства в 1-ом цикле крутого восхождения ; П - исследованная область факторного простран ства во 2-ом цикле крутого восхождения.
И в таких случаях целесообразно передвинуться в другую об ласть факторного пространства и построить линейный план вто рого цикла крутого восхождения.
Если область оптимума далека, линейная модель неадекват на я крутое восхождение неэффективно, то следует выяснить причины неадекватности модели.
Если крутое восхождение неэффективно и положение оптиму ма неопределенное, то рекомендуется поставить опыты в центре эксперимента для оценки вклада квадратичных членов. Если сум ма квадратичных членов значима, это может свидетельствовать о близости к почти стационарной области. Тогда следует при
ступить к построению плана второго порядка или кончать иссле дования.