Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методология1.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
651.78 Кб
Скачать

2.4. Основы планирования эксперимента

Планирование эксперимента возникло в 20–30 годах XX века из потребностей устранить или хотя бы уменьшить систематические ошибки в сельскохозяйственных исследованиях путем рандомизации условий проведения эксперимента.

Рандомизация условий проведения эксперимента на сегодняшний день - это основное требование при постановке всякого грамотного исследования в любой области знания. Рандомизированный эксперимент, если процедура рандомизации хорошо продумана, должен полностью избавить результаты исследования от влияния скрытых переменных.

Все возможные эксперименты в принципе можно разделить на две группы. К одной из них относятся те задачи, в которых нужно решить вопрос, как наилучшим образом расположить экспериментальные точки в пространстве независимых переменных. Такие задачи можно условно назвать пространственно локализованными, или статическими. Другую группу, соответственно, составляют динамические задачи, в которых приходится заботиться о стратегии исследования в целом, полагая, что в этом случае исследование распадается на серию последовательно проводимых локальных экспериментов.

Попытаемся сначала понять, что такое хороший и плохой эксперимент, и формализуем наши представления о хорошем эксперименте. Рассмотрим простой пример, предложенный В.В. Налимовым - классический случай взвешивания трех объектов a, b, c на аналитических весах. Традиционно экспериментатор стал бы взвешивать эти объекты по схеме, приведенной в табл.2.1. Вначале он делает холостое взвешивание, определяя нулевую точку весов, затем по очереди взвешивают каждый из объектов. Это пример традиционно используемого однофакторного эксперимента. Здесь исследователь изучает поведение каждого фактора

Таблица 2.1

Традиционная схема взвешивания трех образцов1

Номер опыта

a

b

c

Результат взвешивания

1

- 1

- 1

- 1

y0

2

+ 1

- 1

- 1

y1

3

- 1

+ 1

- 1

y2

4

- 1

- 1

+ 1

y3

1 Здесь и в табл. 2.2 обозначение «+1» указывает, что объект взвешивания положен на весы; обозначение «-1» указывает на отсутствие объекта на весах.

в отдельности. Масса каждого объекта оценивается только по результатам двух опытов: того опыта, в котором на весы был положен изучаемый объект, и холостого опыта. Например, масса объекта a равна

.

Дисперсия результата взвешивания запишется в виде

,

где - ошибка взвешивания.

Приведем теперь тот же эксперимент по несколько иной схеме, задаваемой матрицей планирования, приведенной в табл.2.2. Здесь, как и в предыдущем случае, каждая строка задает условия проведения одного опыта.

Таблица 2.2

Планирование эксперимента при взвешивании трех объектов

Номер опыта

a

b

c

Результат взвешивания

1

+ 1

- 1

- 1

y1

2

- 1

+ 1

- 1

y2

3

- 1

- 1

+ 1

y3

4

+ 1

+ 1

+ 1

y4

В первых трех опытах последовательно взвешиваются объекты a, b, c; в последнем опыте взвешиваются все три объекта вместе – «холостое» взвешивание не проводится. Легко видеть, что масса каждого объекта будет задаваться формулами

,

,

.

Здесь числители получены путем умножения элементов последнего столбца на элементы столбцов a, b, c. Видно, что при вычислении, скажем, массы объекта a она входит в числитель 2 раза, и потому в знаменателе стоит число 2. Масса объекта a, вычисленная по приведенной выше формуле, оказывается не искаженной массами объектов в и с, так как масса каждого из них входит в формулу для массы a дважды и с разными знаками.

Найдем теперь дисперсию, связанную с ошибкой взвешивания при новой схеме постановки экспериментов. Она равна

.

Аналогичным образом находим

и .

Мы видим, что при новой схеме дисперсии взвешивания получается вдвое меньше, чем при традиционном методе, хотя в обоих случаях на взвешивание трех объектов затрачивалось четыре опыта. При традиционном взвешивании необходимо все четыре опыта повторить дважды, чтобы получить результаты с такой же точностью. При новой схеме эксперимента каждая масса вычислялась уже из результатов всех четырех взвешиваний. Вторую схему эксперимента можно назвать многофакторной. Здесь оперируют всеми факторами (объектами взвешивания) так, чтобы каждая масса вычислялась по результатам всех опытов, проведенных в данной серии экспериментов. Рассмотренная задача взвешивания решается с помощью простой процедуры и вряд ли здесь нужно применять сложные схемы планирования эксперимента.

Однако пример со взвешиванием показывает, что даже в простых задачах можно с удивительной отчетливостью противопоставить плохой эксперимент хорошему. Преимущество многофакторного эксперимента подтверждается и на более сложных задачах.

Таким образом, очевидно, что планирование эксперимента позволяет существенно повысить его качество и эффективность.

Рассмотрим основные принципы математического планирования эксперимента.

Если существует стандартный метод измерений искомой величины y с постоянной воспроизводимостью, известен набор влияющих на нее факторов x1, x2,… xn (вектор аргумента ) и определена интересующая нас область существования аргумента, возможно определение оптимального числа, условий, последовательности и группировки однотипных единичных экспериментов методами математической статистики. Критерии оптимальности — наименьшее число измерений для описания за­висимости у( ) с заданной надежностью (или максимум надежности при данном объеме измерений). Объем определяется либо прямо числом или временем измерений, либо через некоторую функцию трудности - зависимость затрат на измерения от координаты или величины у при неизменной точности.

Планирование эксперимента наиболее эффективно, когда факторов хi много (задача многомерная), а вид зависимости у( ) – простой (или допускает безболез­ненное упрощение). Такая ситуация обычна для техноло­гических экспериментов. Полная задача: определить вид зависимости у у( ). Частные задачи: отсеять факторы хi , влияние которых не превышает ошибки эксперимента, или найти точку экстремума у( ).

В полной задаче поверхность отклика у( ) обычно ищут в виде полинома. Например, в трехмерном пространстве { }

y=b0+ b1x1+ b2x2+ b3x3+ b4x1 x2+ b5x1 x3+ b6x2 x3+ b7x1 x2 x3+ +b8x12+… (2.1)

отклик складывается из линейного влияния каждого аргумента хj , их «перекрестных» парных воздействий (xj , xl ), тройного взаимодействия х1 , х2 , х3 , затем - квад­ратичных эффектов i2) и т. д.

Если известно, что для описания у( ) достаточно в полиноме (2.1) оставить n данных (обычно - «первых») членов, то измерение у в N = п любых точках хk в прин­ципе достаточно, чтобы из N линейных относительно bj уравнений (2.1) найти все коэффициенты bj, т. е. описать всю зависимость. Однако желательно эти N точек отсчета выбрать так, чтобы удовлетворить и до­полнительные требования. Во-первых, требование орто­гональности: ошибки найденных bj должны быть не связаны (статистически независимы) - если все bj будут отклоняться от своих истинных значений согласованно, то суммарная ошибка поверхности отклика у( ) может быть катастрофической. Во-вторых, хорошо иметь «лишние» точки (N>п), чтобы по их отклонению от поверхности отклика судить о приемлемости уравнения (2.1) («адекватности модели»). В-третьих, план должен быть оптимальным (ошибка окончательного результата при данном N наименьшей). Поскольку ищут сразу несколько величин bj возможны разные критерии опти­мальности, например, минимум наибольшей ошибки предсказания у во всей области (G - оптимальность), минимум наибольшей из ошибок коэффициентов bj (E - оптимальность), минимум суммы дисперсий всех коэффициентов (A -оптимальность) или минимум произведения всех дисперсий bj : (D - оптимальность, означающая максимум информации). Обычно добиваются D - оптимального размещения наименьшего возможного числа точек.

Если область наблюдений по всем координатам ограничена плоскостями Аi хi Вi , то преобразованием х’ = [2x – (A+B)]/(В – А) она отображается в единичный куб |x’| 1. Если каждому из т аргументов (факторов) xi задавать по k значений (уровней), то перебор всех их сочетаний - полный факторный план - содержит N=km точек наблюдения. При двух уровнях (xi = 1) и трех факторах N=23=8 точек (в восьми вершинах куба <111>). Но если ищут линейную зависимость у (x1, x2 , x3), то в ней всего четыре коэффициента bj и доста­точно четырех точек отсчета, т. е. можно оставить от плана 23 его половину - дробную реплику.

Долгое время считали очевидным, что влияние фак­тора x1 (коэффициент b1) надо искать, меняя только х1, при постоянных остальных факторах: b1 = [у (1, 0, 0) - у(-1, 0, 0)]/2. Если изменять факторы хj поодиночке, каждое bj будет найдено из двух отсчетов у. Если дис­персия каждого отсчета , то дисперсия каждого коэф­фициента b . Существует, однако, более эконом­ный (D - оптимальный) способ: надо измерить у в четырех вершинах куба, образующих правильный тетраэдр, и определить сразу три bj (при m факторах - надо соот­ветственно мерить у в вершинах правильного m - мерного многогранника с m+1 вершиной - симплекса). Тогда дисперсия , то есть, при равном числе изме­рений получается выигрыш в точности в раз потому, что для определения каждого bj использованы, например, при m=3 все четыре отсчета у вместо двух. Так:

,

а точки отсчета расставлены по диагоналям куба. В m-мерном кубе диагональ в раз длиннее ребра; соответственно точнее находится и «наклон» у(хj), т. е. коэффициент bj.

Когда число точек N равно числу п искомых коэффи­циентов bj, «план насыщен». Чтобы судить, насколько

хорошо найденные коэффициенты описывают реальную зависимость у( ), нужен ненасыщенный план (N > п). Так, добавив к симплексу еще одну точку в центре куба [000], мы прямо измерим величину у(0, 0, 0) = b0 и можем сравнить её с b0 , вычисленным по всем остальным у. Лишние степени свободы (N - п >0) позволяют проверить, отражает ли уравнение (2.1) при выбранном п действительный вид поверхности у( ).

Если уравнение “не адекватно”, в него надо включить дальнейшие члены - перекрестные или квадратичные, добавив точки отсчета. Чтобы менять план по ходу измерений, надо заранее иметь такой композиционный план, который будет оптимальным и с «малым», и с «большим» набором точек. Существуют таблицы D - оптимальных планов на разное число факторов и уровней, в том числе и композиционных.

Иногда сама поверхность отклика у(х) и не имеет физического смысла, а задача эксперимента - выяснить, какие из факторов хj влияют на величину у (т. е. какие bj 0). При этом все или часть факторов могут быть качественными (да и нет - 0 и 1) - например, - с предварительным подогревом, а х1 = 0 – без подогрева. D - оптимальный план с дробными репликами эффективен и в этих случаях, где цель - не поиск уравнения, а лишь выделение значимых факторов по величине невязки - «остаточной дисперсии» (диспер­сионный анализ).

Бывают факторы - помехи: их влияние надо не изу­чить, а исключить (например, разницу в шихтовом ма­териале, если одной его партии заведомо не хватит на все плавки). Тогда цель плана - так расставить факторы помехи по вариантам эксперимента, чтобы неоднород­ность равномерно перешла в случайную ошибку, не искажая вида искомой зависимости у( ). Так, если зависимость у от двух переменных х1 , х2 при трех уровнях каждой осложнена использованием разнородного исходного материала (варианты А, В, (3), то систематиче­скую ошибку устраняет ортогональный план в виде ла­тинского квадрата:

Латинский Греко-латинский

x1 = 1 2 3 x1

x2 = 1 A B C x2

2 B C A

3 C A B

Так, если надо выяснить влияние и формы слитка (х1 = 1, 2, 3) и смазки изложницы (х2 = 1, 2, 3), а из одной плавки выходит всего три слитка, то латинский квадрат задает такое сочетание х1 и х2 для каждой из плавок (А, В, С), чтобы влияние этих факторов не искажалось, например, разницей в температуре разливки или коле­баниях состава между плавками. Аналогично размещение двух факторов помех (А, В, С и , , ) задает греко-латинский квадрат. Существуют таблицы подобных ортогональных квадратов (кубов и гиперкубов) на разное число факторов.

Малоизвестны возможности планирования пассивного эксперимента – использования данных производственного контроля для выделения главных факторов и поиска оптимума. Это большие массивы зачастую не вполне надежных данных. Трудность их обработки в том, что точки размещены сильно неравномерно («кучками», «полосами»). Эта корреляция аргументов «перекашивает» и функцию отклика у( ). Можно, изучив сначала закономерность в размещении аргументов , выделить главные компоненты: такие линейные комбинации , что между ними статистической зависимости нет. Задача представления отклика в виде у(zk) - факторный анализ. Однако нередко zk определяются настолько плохо, что даже линейная зависимость у(zk) сильно размыта. Другой путь - ввести обучающий массив: отобрать только точки (или их группы), правильно расположенные «по плану», а затем, построив по ним у(х), убедиться, что множество «прочих» точек не ухудшает зависимости.

Особенность эксперимента с непрерывным производственным процессом в цехе (например на агрегате непрерывного отжига) в том, что условия разрешено менять лишь в узких пределах (чтобы не шел брак), а отклик у зависит не только от и времени , но и от производных dxj /dt . Тогда задача заключается в том, чтобы, задавая малые изменения , определить вид уравнения у( , dx/dt), описывающего процесс. Для такой «задачи идентификации» существуют «D - оптимальные тестирующие сигналы»: малые изменения задают в виде серии коротких возмущений аргумента (например, х =1, 1, -1, -1, -1, 1, -1, 1, 1, -1), которым ставят в соответствие отсчеты отклика у(х) в другие моменты.

Каким бы планом ни пользоваться, эксперимент отражает реальную картину лишь тогда, когда в число изучаемых аргументов включены все существенные фак­торы. «Подозреваемых» факторов обычно больше, чем действующих, а объем эксперимента и при оптимальном плане растет с числом факторов т пропорционально 2m. Чем больше факторов, тем менее заметно влияние каж­дого из них, и тем труднее реализовать даже дробную реплику от 2m. При m 10 все факторы нельзя учесть, но можно - в случае удачи - отсеять неважные из них за N < m экспериментов методом случайного баланса. Для этого, выделив k факторов в качестве значимых, все остальные складывают в один х = хk+1+ хk+2+…+ хm. Если незначимые факторы угаданы правильно, то их сложение ни на чем не отразится, зависимость у(х1 , х2 ,…, хk) окажется адекватной, и все факторы от хk+1 до xт можно вместе отбросить. Если же среди них попал хотя бы один существенный, нужно на­чать сначала, выбрав другой «хвост». Тупой перебор со­четаний xj в «хвосте» не дешевле полного факторного эксперимента 2m - успех здесь зависит от интуиции.

Сходные идеи перебора факторов реализует «метод группового учета аргументов». В нем план сверхнасы­щенный (М<т), проверить адекватность модели по рас­сеянию точек относительно поверхности отклика нельзя, критерием истинности считают совпадение моделей у ( ), полученных для одной и для другой половины экс­периментальных данных (критерий минимума смещения моделей между «обучающей» и «проверочной» выбор­кой). Такие методы облегчают интуитивный поиск моде­ли, но они в принципе не могут гарантировать единст­венность найденного решения.

Иногда нужно знать не вид отклика у ( ), а только положение или величину его экстремума - оптимум со­става, значение свойств в оптимуме и т. п. Если у ( ) линейно во всей области существования , то опти­мум лежит на краю этой области (и всегда находится методом линейного программирования).

Чтобы найти оптимум внутри области по уравнению у( ), в нем часто не хватит даже и членов с - реаль­ная поверхность отклика обычно сложнее, чем гладкая поверхность второго порядка. Поэтому оптимум находят, не определяя саму функцию у( ) - методом крутого восхождения. Для этого достаточно в одной точке най­ти градиент у( ) и двигаться вдоль него «в гору» - до максимума, время от времени уточняя направление гра­диента. Выигрыш в том, что градиент укажет уже линей­ное приближение: чтобы определить grad у в одной точ­ке в принципе достаточно при m факторах измерить у в m+1 точках - вершинах симплекса с центром . Кро­ме того, соседний симплекс, куда указывает градиент, имеет с данным всего одну необщую точку, где и надо добавить одно

измерение у, чтобы сделать следующий шаг. Только вблизи максимума, когда градиент станет незначим, надо усложнить план и найти поверхность второго порядка вблизи экстремума.

При бесспорной идее успех эксперимента по матема­тическому плану определяется, прежде всего, понимани­ем существа задачи и метода экспериментатором. Во-первых, нужен физически обоснованный вид аргументов. Так, если в описание кинетики температура входит линейно (или лучше как х1=1/Т), то время не может входить линейно - аргументом должно быть x2 = lg t, ибо для термически активируемых процессов teQ/kT. Если положить x2=t , то «оптимальный» план при малом шаге охватит малый отрезок процесса, при большом - пропустит наиболее интересную «середину». В обоих случаях согласие с наблюдениями будет хорошее, а предсказание - никуда не годное (не там стояли точки).

Во-вторых, даже для переменных одной размерности важен выбор масштаба: если х1 - размер детали в мм; а х2 - шероховатость ее поверхности тоже в мм, но на три порядка меньше), то при любом описании у{х1, х2) градиент будет направлен строго вдоль х1. Чтобы сде­лать наклоны у(хi) в обе стороны сравнимыми, нужно ввести переменные хj = хjj . Масштабы Mj задают равными ошибке определения хj или диапазону изменения хj.

В-третьих, размер симплекса для определения градиента хj ) надо сделать достаточно большим, чтобы у изменялось значимо (иначе градиент неопределенный), и достаточно малым, чтобы поверхность у( ) на площадке ±хj была сначала примерно линейной.

В-четвертых, надо правильно выбрать длину шага вдоль градиента (существуют многие усовершенствования метода с переменным шагом, корректировкой направления, ограничением шага пространст­вом сильнейших переменных (меньшей размерности) так как коротким шагом долго идти до мак­симума, длинным легко перескочить через него.

Наконец, всякое описание отклика достаточно гладкой поверхностью равносильно допущению, что не будет не­ожиданностей: разрывов от смены механизма процесса, острых пиков, гребней и т. п. Процедура направлена на сглаживание, а не на поиск скачков. Поэтому, решая прос­тые задачи, она может запутывать сложные. Математи­ческое планирование эксперимента - полезный вспомо­гательный инструмент, а не самодовлеющий аппарат.

Нельзя забывать также, что все методы оптималь­ного планирования уязвимы при потере точек (от брака при обработке, промахов при испытаниях и т. п.). Даже при ненасыщенном плане от пропуска наблюдений появляет­ся взаимосвязь ошибок в искомых bj , а учет потерянного как нового неизвестного ухудшает надежность выводов.

Математическое планирование облегчает поиск экстре­мума одного свойства у. В технике же обычно ищут ком­промисс - возможно лучший уровень сразу нескольких переменных уk (например, и прочности, и пластичности). Задачу можно свести к предыдущей, вводя одну функцию желательности Y(yk). Синтез одного критерия Y из нескольких уk — задача квалиметрии, и главное здесь в том, как по здравому смыслу задать вид функции Y(yk), чтобы ее наибольшее значение действительно со­ответствовало наилучшему: для нас сочетанию свойств уk. Естественно использовать объединение критериев в безразмерные комбинации (например, физические кри­терии подобия или просто отношения двух величин од­ной размерности: предела прочности к пределу текуче­сти). Если есть сильная корреляция между двумя уk , следует оставить один из них.

При пассивном эксперименте, когда все измерения сделаны заранее, можно и не вводить «синтетический» критерий, а вместо этого по поверхности отклика нане­сти на плоскости горизонтали уk=const, очерчиваю­щие область «хороших» и «приемлемых» результатов. Пересечение областей для уk оставит, быть может, столь узкую область, «приятную во всех отношениях», что да­лее не понадобится никакая оптимизация (компромисс естественный). Даже если компромисса нет, его поиск приводит к четкой постановке дальнейшей задачи: «ну­жен способ поднять у4 в области , или снизить у3 в об­ласти , все другие подходы еще труднее» (требуют улучшения сразу нескольких параметров).

Другой класс задач планирования - оптимизация физического эксперимента. Цель такого эксперимента — доказать существование зависимости именно данного вида (против четко сформулированной альтернативы), измерить параметры такой зависимости, обнаружить различие параметров либо согласие их с теорией. Прин­ципиальное отличие от предыдущего в том, что вид функции отклика у( ) задан наперед. Иногда задана также и функция трудности - зависимость «цены изме­рений» (трудоемкости, стоимости, времени) от значений аргумента (например, измерять интенсивность рассея­ния излучения тем труднее, чем ближе к первичному пуч­ку). Оптимальный план указывает координаты точек измерения и распределение на них ресурса (доли цены), чтобы получить наилучший при данном ресурсе резуль­тат (и указать объем измерений для заданной надежно­сти результата). Поэтому аппарат оптимизации физического эксперимента с единообразной методикой, исходящий из принципа максимума правдоподобия, отличен от планирования факторного эксперимента.

В любом случае математическое планирование - не первооснова, а лишь составная часть плана, требующая нешаблонного выбора приемов для каждой задачи. Жа­лоба «от математического планирования мало пользы» часто означает, что для данного объекта выбор метода планирования противоречил здравому смыслу, и это можно было видеть еще до эксперимента.