- •1. Научное знание и методы научных исследований
- •1.1. Структура научного знания
- •Методы научных исследований
- •2. Общие принципы организации
- •2.1. Постановка цели и задач исследования
- •2.2. Обзор литературы
- •2.3. Выбор метода и схемы измерения
- •2.4. Основы планирования эксперимента
- •2.5. Запись и первичная обработка
- •2.6. Обработка результатов эксперимента
- •Ошибки измерений
- •2.6.2. Статистическая обработка результатов испытаний
- •3. Методы исследования свойств металлов
- •3.1. Методика металлографических исследований
2.4. Основы планирования эксперимента
Планирование эксперимента возникло в 20–30 годах XX века из потребностей устранить или хотя бы уменьшить систематические ошибки в сельскохозяйственных исследованиях путем рандомизации условий проведения эксперимента.
Рандомизация условий проведения эксперимента на сегодняшний день - это основное требование при постановке всякого грамотного исследования в любой области знания. Рандомизированный эксперимент, если процедура рандомизации хорошо продумана, должен полностью избавить результаты исследования от влияния скрытых переменных.
Все возможные эксперименты в принципе можно разделить на две группы. К одной из них относятся те задачи, в которых нужно решить вопрос, как наилучшим образом расположить экспериментальные точки в пространстве независимых переменных. Такие задачи можно условно назвать пространственно локализованными, или статическими. Другую группу, соответственно, составляют динамические задачи, в которых приходится заботиться о стратегии исследования в целом, полагая, что в этом случае исследование распадается на серию последовательно проводимых локальных экспериментов.
Попытаемся сначала понять, что такое хороший и плохой эксперимент, и формализуем наши представления о хорошем эксперименте. Рассмотрим простой пример, предложенный В.В. Налимовым - классический случай взвешивания трех объектов a, b, c на аналитических весах. Традиционно экспериментатор стал бы взвешивать эти объекты по схеме, приведенной в табл.2.1. Вначале он делает холостое взвешивание, определяя нулевую точку весов, затем по очереди взвешивают каждый из объектов. Это пример традиционно используемого однофакторного эксперимента. Здесь исследователь изучает поведение каждого фактора
Таблица 2.1
Традиционная схема взвешивания трех образцов1
Номер опыта |
a |
b |
c |
Результат взвешивания |
1 |
- 1 |
- 1 |
- 1 |
y0 |
2 |
+ 1 |
- 1 |
- 1 |
y1 |
3 |
- 1 |
+ 1 |
- 1 |
y2 |
4 |
- 1 |
- 1 |
+ 1 |
y3 |
1 Здесь и в табл. 2.2 обозначение «+1» указывает, что объект взвешивания положен на весы; обозначение «-1» указывает на отсутствие объекта на весах. |
||||
в отдельности. Масса каждого объекта оценивается только по результатам двух опытов: того опыта, в котором на весы был положен изучаемый объект, и холостого опыта. Например, масса объекта a равна
.
Дисперсия результата взвешивания запишется в виде
,
где
- ошибка взвешивания.
Приведем теперь тот же эксперимент по несколько иной схеме, задаваемой матрицей планирования, приведенной в табл.2.2. Здесь, как и в предыдущем случае, каждая строка задает условия проведения одного опыта.
Таблица 2.2
Планирование эксперимента при взвешивании трех объектов
Номер опыта |
a |
b |
c |
Результат взвешивания |
1 |
+ 1 |
- 1 |
- 1 |
y1 |
2 |
- 1 |
+ 1 |
- 1 |
y2 |
3 |
- 1 |
- 1 |
+ 1 |
y3 |
4 |
+ 1 |
+ 1 |
+ 1 |
y4 |
В первых трех опытах последовательно взвешиваются объекты a, b, c; в последнем опыте взвешиваются все три объекта вместе – «холостое» взвешивание не проводится. Легко видеть, что масса каждого объекта будет задаваться формулами
,
,
.
Здесь числители получены путем умножения элементов последнего столбца на элементы столбцов a, b, c. Видно, что при вычислении, скажем, массы объекта a она входит в числитель 2 раза, и потому в знаменателе стоит число 2. Масса объекта a, вычисленная по приведенной выше формуле, оказывается не искаженной массами объектов в и с, так как масса каждого из них входит в формулу для массы a дважды и с разными знаками.
Найдем теперь дисперсию, связанную с ошибкой взвешивания при новой схеме постановки экспериментов. Она равна
.
Аналогичным образом находим
и
.
Мы видим, что при новой схеме дисперсии взвешивания получается вдвое меньше, чем при традиционном методе, хотя в обоих случаях на взвешивание трех объектов затрачивалось четыре опыта. При традиционном взвешивании необходимо все четыре опыта повторить дважды, чтобы получить результаты с такой же точностью. При новой схеме эксперимента каждая масса вычислялась уже из результатов всех четырех взвешиваний. Вторую схему эксперимента можно назвать многофакторной. Здесь оперируют всеми факторами (объектами взвешивания) так, чтобы каждая масса вычислялась по результатам всех опытов, проведенных в данной серии экспериментов. Рассмотренная задача взвешивания решается с помощью простой процедуры и вряд ли здесь нужно применять сложные схемы планирования эксперимента.
Однако пример со взвешиванием показывает, что даже в простых задачах можно с удивительной отчетливостью противопоставить плохой эксперимент хорошему. Преимущество многофакторного эксперимента подтверждается и на более сложных задачах.
Таким образом, очевидно, что планирование эксперимента позволяет существенно повысить его качество и эффективность.
Рассмотрим основные принципы математического планирования эксперимента.
Если существует стандартный
метод измерений искомой величины y
с постоянной воспроизводимостью,
известен набор влияющих на нее факторов
x1,
x2,…
xn
(вектор аргумента
)
и определена интересующая нас область
существования аргумента, возможно
определение оптимального числа, условий,
последовательности и группировки
однотипных единичных экспериментов
методами математической статистики.
Критерии оптимальности — наименьшее
число измерений для описания зависимости
у(
)
с заданной надежностью (или максимум
надежности при данном объеме измерений).
Объем определяется либо прямо числом
или временем измерений, либо через
некоторую функцию
трудности - зависимость
затрат на измерения от координаты
или
величины у при
неизменной точности.
Планирование эксперимента наиболее эффективно, когда факторов хi много (задача многомерная), а вид зависимости у( ) – простой (или допускает безболезненное упрощение). Такая ситуация обычна для технологических экспериментов. Полная задача: определить вид зависимости у у( ). Частные задачи: отсеять факторы хi , влияние которых не превышает ошибки эксперимента, или найти точку экстремума у( ).
В полной задаче поверхность отклика у( ) обычно ищут в виде полинома. Например, в трехмерном пространстве { }
y=b0+ b1x1+ b2x2+ b3x3+ b4x1 x2+ b5x1 x3+ b6x2 x3+ b7x1 x2 x3+ +b8x12+… (2.1)
отклик складывается из линейного влияния каждого аргумента хj , их «перекрестных» парных воздействий (xj , xl ), тройного взаимодействия х1 , х2 , х3 , затем - квадратичных эффектов (хi2) и т. д.
Если известно, что для
описания у(
)
достаточно в полиноме (2.1) оставить n
данных (обычно - «первых») членов, то
измерение у
в N
= п любых
точках хk
в принципе достаточно, чтобы из N
линейных относительно bj
уравнений (2.1) найти все коэффициенты
bj,
т. е. описать всю
зависимость. Однако желательно эти N
точек отсчета выбрать
так, чтобы удовлетворить и дополнительные
требования. Во-первых, требование
ортогональности: ошибки найденных
bj
должны быть не
связаны (статистически независимы) -
если все bj
будут отклоняться от своих истинных
значений согласованно, то суммарная
ошибка поверхности отклика у(
)
может быть катастрофической. Во-вторых,
хорошо иметь «лишние» точки (N>п),
чтобы по их отклонению от поверхности
отклика судить о приемлемости уравнения
(2.1) («адекватности модели»). В-третьих,
план должен быть оптимальным (ошибка
окончательного результата при данном
N
наименьшей). Поскольку ищут сразу
несколько величин bj
возможны разные критерии оптимальности,
например, минимум наибольшей ошибки
предсказания у
во всей области (G
- оптимальность), минимум наибольшей
из ошибок коэффициентов bj
(E
- оптимальность),
минимум суммы дисперсий всех коэффициентов
(A
-оптимальность) или
минимум произведения всех дисперсий
bj
:
(D
- оптимальность,
означающая максимум информации). Обычно
добиваются D
- оптимального размещения наименьшего
возможного числа точек.
Если область наблюдений по
всем координатам ограничена плоскостями
Аi
хi
Вi
, то преобразованием
х’
= [2x
– (A+B)]/(В
– А)
она отображается в единичный куб |x’|
1. Если каждому из т
аргументов (факторов)
xi
задавать по k
значений
(уровней), то перебор
всех их сочетаний - полный
факторный план -
содержит N=km
точек наблюдения. При двух уровнях (xi
=
1)
и трех факторах N=23=8
точек (в восьми вершинах куба
<111>). Но если ищут линейную зависимость
у (x1,
x2
, x3),
то в ней всего четыре коэффициента bj
и достаточно
четырех точек отсчета, т. е. можно оставить
от плана 23
его половину - дробную
реплику.
Долгое время считали
очевидным, что влияние фактора x1
(коэффициент b1)
надо искать, меняя только х1,
при постоянных остальных факторах: b1
= [у
(1, 0, 0) - у(-1,
0, 0)]/2. Если изменять факторы хj
поодиночке, каждое
bj
будет найдено из двух отсчетов у. Если
дисперсия каждого отсчета
,
то дисперсия каждого коэффициента
b
.
Существует, однако, более экономный
(D
- оптимальный) способ:
надо измерить у
в четырех вершинах куба, образующих
правильный тетраэдр, и определить сразу
три bj
(при m
факторах - надо соответственно мерить
у в
вершинах правильного m
- мерного многогранника
с m+1
вершиной - симплекса).
Тогда дисперсия
,
то есть, при равном числе измерений
получается выигрыш в точности в
раз потому, что для определения каждого
bj
использованы, например, при m=3
все четыре отсчета у
вместо двух. Так:
,
а точки отсчета расставлены
по диагоналям куба. В m-мерном
кубе диагональ в
раз длиннее ребра; соответственно точнее
находится и «наклон» у(хj),
т. е. коэффициент bj.
Когда число точек N равно числу п искомых коэффициентов bj, «план насыщен». Чтобы судить, насколько
хорошо найденные коэффициенты описывают реальную зависимость у( ), нужен ненасыщенный план (N > п). Так, добавив к симплексу еще одну точку в центре куба [000], мы прямо измерим величину у(0, 0, 0) = b0 и можем сравнить её с b0 , вычисленным по всем остальным у. Лишние степени свободы (N - п >0) позволяют проверить, отражает ли уравнение (2.1) при выбранном п действительный вид поверхности у( ).
Если уравнение “не адекватно”, в него надо включить дальнейшие члены - перекрестные или квадратичные, добавив точки отсчета. Чтобы менять план по ходу измерений, надо заранее иметь такой композиционный план, который будет оптимальным и с «малым», и с «большим» набором точек. Существуют таблицы D - оптимальных планов на разное число факторов и уровней, в том числе и композиционных.
Иногда сама поверхность
отклика у(х)
и не имеет физического смысла, а задача
эксперимента - выяснить, какие из факторов
хj
влияют на величину
у
(т. е. какие bj
0). При этом все или
часть факторов могут быть качественными
(да и нет - 0 и 1) - например,
-
с предварительным подогревом, а х1
= 0 – без подогрева. D
- оптимальный план с
дробными репликами эффективен и в
этих случаях, где
цель - не поиск уравнения, а лишь выделение
значимых факторов по величине невязки
- «остаточной дисперсии» (дисперсионный
анализ).
Бывают факторы - помехи: их влияние надо не изучить, а исключить (например, разницу в шихтовом материале, если одной его партии заведомо не хватит на все плавки). Тогда цель плана - так расставить факторы помехи по вариантам эксперимента, чтобы неоднородность равномерно перешла в случайную ошибку, не искажая вида искомой зависимости у( ). Так, если зависимость у от двух переменных х1 , х2 при трех уровнях каждой осложнена использованием разнородного исходного материала (варианты А, В, (3), то систематическую ошибку устраняет ортогональный план в виде латинского квадрата:
Латинский Греко-латинский
x1
=
1 2 3
x1
x2
= 1 A
B C x2
2 B C A
3 C A B
Так, если надо выяснить влияние и формы слитка (х1 = 1, 2, 3) и смазки изложницы (х2 = 1, 2, 3), а из одной плавки выходит всего три слитка, то латинский квадрат задает такое сочетание х1 и х2 для каждой из плавок (А, В, С), чтобы влияние этих факторов не искажалось, например, разницей в температуре разливки или колебаниях состава между плавками. Аналогично размещение двух факторов помех (А, В, С и , , ) задает греко-латинский квадрат. Существуют таблицы подобных ортогональных квадратов (кубов и гиперкубов) на разное число факторов.
Малоизвестны возможности
планирования пассивного эксперимента
– использования данных производственного
контроля для выделения главных факторов
и поиска оптимума. Это большие массивы
зачастую не вполне надежных данных.
Трудность их обработки в том, что точки
размещены сильно неравномерно («кучками»,
«полосами»). Эта корреляция аргументов
«перекашивает» и функцию отклика у(
).
Можно, изучив сначала закономерность
в размещении аргументов
,
выделить главные
компоненты: такие
линейные комбинации
,
что между ними статистической зависимости
нет. Задача представления отклика в
виде у(zk)
- факторный анализ.
Однако нередко zk
определяются настолько плохо, что даже
линейная зависимость у(zk)
сильно размыта. Другой путь - ввести
обучающий массив:
отобрать только точки (или их группы),
правильно расположенные «по плану», а
затем, построив по ним у(х),
убедиться, что множество «прочих» точек
не ухудшает зависимости.
Особенность эксперимента
с непрерывным производственным процессом
в цехе (например на агрегате непрерывного
отжига) в том, что условия
разрешено менять лишь в узких пределах
(чтобы не шел брак), а отклик у
зависит не только от
и времени
,
но и от производных dxj
/dt
.
Тогда задача заключается в том, чтобы,
задавая малые изменения
,
определить вид уравнения у(
,
dx/dt),
описывающего процесс. Для такой «задачи
идентификации» существуют «D
- оптимальные тестирующие сигналы»:
малые изменения
задают в виде серии
коротких возмущений аргумента (например,
х =1,
1, -1, -1, -1, 1, -1, 1, 1, -1), которым ставят в
соответствие отсчеты отклика у(х)
в другие моменты.
Каким бы планом ни пользоваться, эксперимент отражает реальную картину лишь тогда, когда в число изучаемых аргументов включены все существенные факторы. «Подозреваемых» факторов обычно больше, чем действующих, а объем эксперимента и при оптимальном плане растет с числом факторов т пропорционально 2m. Чем больше факторов, тем менее заметно влияние каждого из них, и тем труднее реализовать даже дробную реплику от 2m. При m 10 все факторы нельзя учесть, но можно - в случае удачи - отсеять неважные из них за N < m экспериментов методом случайного баланса. Для этого, выделив k<М факторов в качестве значимых, все остальные складывают в один х = хk+1+ хk+2+…+ хm. Если незначимые факторы угаданы правильно, то их сложение ни на чем не отразится, зависимость у(х1 , х2 ,…, хk) окажется адекватной, и все факторы от хk+1 до xт можно вместе отбросить. Если же среди них попал хотя бы один существенный, нужно начать сначала, выбрав другой «хвост». Тупой перебор сочетаний xj в «хвосте» не дешевле полного факторного эксперимента 2m - успех здесь зависит от интуиции.
Сходные идеи перебора факторов реализует «метод группового учета аргументов». В нем план сверхнасыщенный (М<т), проверить адекватность модели по рассеянию точек относительно поверхности отклика нельзя, критерием истинности считают совпадение моделей у ( ), полученных для одной и для другой половины экспериментальных данных (критерий минимума смещения моделей между «обучающей» и «проверочной» выборкой). Такие методы облегчают интуитивный поиск модели, но они в принципе не могут гарантировать единственность найденного решения.
Иногда нужно знать не вид отклика у ( ), а только положение или величину его экстремума - оптимум состава, значение свойств в оптимуме и т. п. Если у ( ) линейно во всей области существования , то оптимум лежит на краю этой области (и всегда находится методом линейного программирования).
Чтобы найти оптимум внутри
области по уравнению у(
),
в нем часто не хватит даже и членов с
- реальная поверхность отклика обычно
сложнее, чем гладкая поверхность второго
порядка. Поэтому оптимум находят, не
определяя саму функцию у(
)
- методом крутого восхождения. Для этого
достаточно в одной точке найти
градиент у(
)
и двигаться вдоль него «в гору» - до
максимума, время от времени уточняя
направление градиента. Выигрыш в
том, что градиент укажет уже линейное
приближение: чтобы определить grad
у в
одной точке
в принципе достаточно при m
факторах измерить у
в m+1
точках - вершинах симплекса с центром
.
Кроме того, соседний симплекс, куда
указывает градиент, имеет с данным всего
одну необщую точку, где и надо
добавить одно
измерение у, чтобы сделать следующий шаг. Только вблизи максимума, когда градиент станет незначим, надо усложнить план и найти поверхность второго порядка вблизи экстремума.
При бесспорной идее успех эксперимента по математическому плану определяется, прежде всего, пониманием существа задачи и метода экспериментатором. Во-первых, нужен физически обоснованный вид аргументов. Так, если в описание кинетики температура входит линейно (или лучше как х1=1/Т), то время не может входить линейно - аргументом должно быть x2 = lg t, ибо для термически активируемых процессов teQ/kT. Если положить x2=t , то «оптимальный» план при малом шаге охватит малый отрезок процесса, при большом - пропустит наиболее интересную «середину». В обоих случаях согласие с наблюдениями будет хорошее, а предсказание - никуда не годное (не там стояли точки).
Во-вторых, даже для переменных одной размерности важен выбор масштаба: если х1 - размер детали в мм; а х2 - шероховатость ее поверхности тоже в мм, но на три порядка меньше), то при любом описании у{х1, х2) градиент будет направлен строго вдоль х1. Чтобы сделать наклоны у(хi) в обе стороны сравнимыми, нужно ввести переменные хj = хj /Мj . Масштабы Mj задают равными ошибке определения хj или диапазону изменения хj.
В-третьих, размер симплекса для определения градиента (± хj ) надо сделать достаточно большим, чтобы у изменялось значимо (иначе градиент неопределенный), и достаточно малым, чтобы поверхность у( ) на площадке ±хj была сначала примерно линейной.
В-четвертых, надо правильно выбрать длину шага вдоль градиента (существуют многие усовершенствования метода с переменным шагом, корректировкой направления, ограничением шага пространством сильнейших переменных (меньшей размерности) так как коротким шагом долго идти до максимума, длинным легко перескочить через него.
Наконец, всякое описание отклика достаточно гладкой поверхностью равносильно допущению, что не будет неожиданностей: разрывов от смены механизма процесса, острых пиков, гребней и т. п. Процедура направлена на сглаживание, а не на поиск скачков. Поэтому, решая простые задачи, она может запутывать сложные. Математическое планирование эксперимента - полезный вспомогательный инструмент, а не самодовлеющий аппарат.
Нельзя забывать также, что все методы оптимального планирования уязвимы при потере точек (от брака при обработке, промахов при испытаниях и т. п.). Даже при ненасыщенном плане от пропуска наблюдений появляется взаимосвязь ошибок в искомых bj , а учет потерянного как нового неизвестного ухудшает надежность выводов.
Математическое планирование облегчает поиск экстремума одного свойства у. В технике же обычно ищут компромисс - возможно лучший уровень сразу нескольких переменных уk (например, и прочности, и пластичности). Задачу можно свести к предыдущей, вводя одну функцию желательности Y(yk). Синтез одного критерия Y из нескольких уk — задача квалиметрии, и главное здесь в том, как по здравому смыслу задать вид функции Y(yk), чтобы ее наибольшее значение действительно соответствовало наилучшему: для нас сочетанию свойств уk. Естественно использовать объединение критериев в безразмерные комбинации (например, физические критерии подобия или просто отношения двух величин одной размерности: предела прочности к пределу текучести). Если есть сильная корреляция между двумя уk , следует оставить один из них.
При пассивном эксперименте,
когда все измерения сделаны заранее,
можно и не вводить «синтетический»
критерий, а вместо этого по поверхности
отклика нанести на плоскости
горизонтали уk=const,
очерчивающие область «хороших» и
«приемлемых» результатов. Пересечение
областей для уk
оставит, быть может, столь узкую область,
«приятную во всех отношениях», что
далее не понадобится никакая
оптимизация (компромисс естественный).
Даже если компромисса нет, его поиск
приводит к четкой постановке дальнейшей
задачи: «нужен способ поднять у4
в области
,
или снизить у3
в области
,
все другие подходы еще труднее» (требуют
улучшения сразу нескольких параметров).
Другой класс задач планирования - оптимизация физического эксперимента. Цель такого эксперимента — доказать существование зависимости именно данного вида (против четко сформулированной альтернативы), измерить параметры такой зависимости, обнаружить различие параметров либо согласие их с теорией. Принципиальное отличие от предыдущего в том, что вид функции отклика у( ) задан наперед. Иногда задана также и функция трудности - зависимость «цены измерений» (трудоемкости, стоимости, времени) от значений аргумента (например, измерять интенсивность рассеяния излучения тем труднее, чем ближе к первичному пучку). Оптимальный план указывает координаты точек измерения и распределение на них ресурса (доли цены), чтобы получить наилучший при данном ресурсе результат (и указать объем измерений для заданной надежности результата). Поэтому аппарат оптимизации физического эксперимента с единообразной методикой, исходящий из принципа максимума правдоподобия, отличен от планирования факторного эксперимента.
В любом случае математическое планирование - не первооснова, а лишь составная часть плана, требующая нешаблонного выбора приемов для каждой задачи. Жалоба «от математического планирования мало пользы» часто означает, что для данного объекта выбор метода планирования противоречил здравому смыслу, и это можно было видеть еще до эксперимента.
