Конспект_2часть
.pdfЛекция 22. ЛОГИКА ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА
Для оценки влияния каждого фактора на функцию отклика можно зафиксиро- вать все факторы на каком-либо одном уровне и поочередно изменять каждый из
факторов, отслеживая изменения функции и определяя таким образом зависи- мость функции отклика от данного фактора. Такой подход имеет право на сущест- вование и используется довольно часто. Однако этот метод имеет ряд принципи-
альных недостатков:
1.С увеличением количества факторов стремительно возрастает количество
опытов, необходимых для получения требуемой информации, что в свою очередь приводит к значительным затратам материальных средств и вре- мени на проведение экспериментов.
2.При последовательной оценке влияния каждого из факторов довольно
сложно оценить суммарные эффекты, связанные с взаимодействием фак- торов.
3.При определении значений коэффициентов, отражающих в математиче-
ской модели влияние конкретных факторов на функцию отклика, использу- ются результаты только тех опытов, в которых данный фактор менял свое значение. Результаты большинства опытов в вычислении данных коэффи- циентов не участвуют. Поскольку величина случайной ошибки при расчете
среднего значения результата в эксперименте обратно пропорциональна корню квадратному из количества дублирующих опытов
δ ≈ δ1 ,
n
где δ1 – вероятная случайная ошибка в единичном опыте, то формальное сокращение количества опытов приводит к увеличению погрешностей в вы- числении коэффициентов уравнения.
Указанные недостатки могут быть значительно нейтрализованы одновремен- ном варьировании всех факторов. Рассмотрим простейший пример.
Пусть химику необходимо взвесить два небольших предмета. В его распоря- жении находятся рычажные весы и набор разновесов. Требуется возможно более
точно определить вес каждого предмета с помощью двух взвешиваний. Опыт, привычки и здравый смысл подсказывают взвесить сначала один предмет (обо- значим его через P), а затем второй Q. Каждому предмету в этом случае будет
107
соответствовать одно взвешивание, один результат, один вес, случайная погреш-
ность одного взвешивания.
Можно, однако, указать способ нахождения веса каждого предмета, но с такой
точностью, как если бы каждый взвешивался дважды и полученные два результа- та были усреднены. Для этого каждый предмет действительно должен быть взве- шен дважды. Но разрешается произвести всего два взвешивания. Следовательно,
каждый предмет должен побывать на чашках весов дважды. Если поместить оба предмета на одну чашку и взвесить их, то получим оценку суммы их весов S = P + Q . Чтобы разделить сумму на компоненты, необходимо или взвесить один
предмет, или же найти разницу весов компонентов. Поместив предметы на чашки, с помощью гирь уравновесим весы и найдем разность D = P − Q . Используя ре- зультаты двух взвешиваний, найдем веса каждого из предметов:
P = S + D ,
2
Q = S − D . 2
При такой схеме каждый предмет взвешивается дважды, используются всего
два взвешивания, при этом вес каждого предмета оценивается с точностью, соот-
ветствующей усреднению результатов двух взвешиваний. Недостаток этой стра- тегии взвешивания состоит в том, что до окончания всех взвешиваний мы не по-
лучаем информации о весе предметов. Вознаграждением за задержку в данном
случае является повышенная точность результатов.
Основная идея выбора условий проведения опытов при планировании экспе- римента заключается в том, чтобы каждое наблюдение давало информацию не- скольких параметрах. Поэтому условия проведения опытов не могут выбираться
произвольным образом, необходимо построение соответствующих планов экспе-
римента.
Планирование эксперимента начинают с выбора факторов, существенных для
исследуемого объекта. Этот этап неформализован, т.е. нет формальных критери- ев для того, считать ли данный параметр существенным фактором, или можно им
пренебречь. Если в эксперименте исследовать все возможные факторы, то про- грамма эксперимента будет непомерно громоздкой. С другой стороны, если какие-
либо факторы исключаются из списка существенных слишком поспешно, то могут
быть получены неверные выводы о реальной ситуации или исследователь может затратить слишком много времени для поиска истинных связей.
108
Рекомендуется с самого начала составить полный перечень всех факторов,
которые могут оказать влияние на интересующие свойства объекта. Далее на ос- новании имеющихся данных следует факторы на две группы. В первую группу
войдут наиболее существенные факторы, значения которых в эксперименте будут изменяться целенаправленным образом. Изменения факторов второй группы, от- несенных к разряду несущественных, в эксперименте не планируется, но их зна-
чения контролируются. При появлении новой информации о степени влияния факторов они могут быть перемещены из одной группы в другую.
Следующим этапом является выбор интервалов варьирования существенных факторов. По возможности желательно просмотреть эффект каждого фактора в широких пределах изменения условий или уровней других факторов. Устойчивый
эффект, даже нулевой, в широкой области варьирования других факторов явля- ется достаточно убедительным. Вместе с тем области определения факторов имеют свои ограничения. Различают следующие типы ограничений:
1.Принципиальные ограничения, которые не могут быть нарушены ни при ка- ких обстоятельствах. Например, нижний предел варьирования температу-
ры – абсолютный нуль.
2.Ограничения, связанные с технико-экономическими соображениями, опре- деляются стоимостью сырья, дефицитом отдельных компонентов, необхо-
димой продолжительностью опытов.
3.Ограничения, связанные с конкретными условиями. В качестве ограничи- телей выступает наличие соответствующей измерительной аппаратуры, технология переработки, предельная температура металла и т.д. Напри- мер, если пытаемся определить содержание кислорода в дымовых газах и используем наиболее распространенный газоанализатор типа ГХП-3М, то концентрацию кислорода ниже 0,1% определить не сможем, поскольку чув- ствительность и погрешность прибора не позволяют измерять такие вели-
чины. Также не можем проводить испытания промышленного парового кот-
ла при температуре горения 3000°С, так как обмуровка и металл труб не
выдержат подобной нагрузки, хотя принципиально этого можно достичь. Для определения допустимых пределов отдельных факторов могут быть про-
ведены специальные эксперименты. На этой стадии нет необходимости варьиро-
вания всеми факторами, здесь определяются возможности изменения только от- дельных факторов. Однако при этом следует оценивать возможности появления
109
несовместимых комбинаций факторов. Это ограничение также может сузить диа-
пазон варьирования.
После определения границ изменения факторов определяется область для
планирования эксперимента. Эта область должна входить в область допустимых значений, но она, как правило, уже. Например, при изучении теплоотдачи от воды к стенке при атмосферном давлении интервал допустимых температур лежит ме- жду 0 и 100°С. Но в точке, близкой к нулю, жидкость ведет себя совершенно ина-
че, чем при 30°С. Также существенные отличия свойств воды при температуре,
близкой к 100°С. С другой стороны, если необходима информация для разработки
теплообменника с температурой воды 30-60°С, то нет необходимости охватывать весь диапазон 0-100°С. В этом случае опыты планируются вокруг средней точки, наиболее близко лежащей к интересующей области практического использования.
Наиболее часто используются центральные композиционные планы, пред-
ставляющие собой наборы точек, расположенных симметрично относительно
центра изучаемой области факторного пространства. Для каждого фактора выби-
рают базовую точку xi0 и от ее в разные стороны откладывают интервал величи- ной Dxi. Этим самым определяются области проведения эксперимента:
ì |
|
min |
= xi0 |
- Dxi , |
|||
ï x |
i |
||||||
í |
|
= x |
|
+ Dx |
|
. |
|
ïxmax |
i0 |
i |
|||||
î |
i |
|
|
|
Выбор интервала варьирования также ограничен:
1.Интервал варьирования не может быть меньше той ошибки, с которой в эксперименте фиксируется фактор, иначе верхний и нижний уровни ока- жутся неразличимыми.
2.Интервал варьирования не может выходить за границы допустимой облас-
ти изменения параметров. Если при исследовании теплоотдачи от воды к стенке взята базовая точка t=70°C, то нельзя выбрать интервал варьиро-
вания Dt=40°С.
3.При выборе интервалов варьирования факторов необходимо учитывать точность в определении функции отклика. Изменение функции отклика
должно быть заметно на фоне погрешностей при небольшом числе парал- лельных опытов.
110
4.При выборе интервалов варьирования факторов необходимо согласовать
свойства математической модели и возможное поведение функции откли- ка. Если для описания функции отклика используется линейная модель, но
в общем случае искомая зависимость нелинейна, то излишне широкий
у |
|
|
|
|
|
|
х |
х1 |
х2 |
х3 |
х4 |
диапазон варьирования х1- х4 может привести к полу-
чению неадекватной моде- ли. Однако при более узком
диапазоне х2-х3 линейная
модель может адекватно представлять нелинейную
зависимость.
Уменьшение шага варьирова-
ния приводит к своим трудностям:
1.При малом шаге увеличивается отношение величины помех к полезному сигналу, что потребует увеличения количества параллельных опытов для
выделения сигнала на фоне шума.
2.Уменьшение интервала варьирования приводит к уменьшению значений коэффициентов в уравнении регрессии, отражающих влияние соответст-
вующих факторов. Эти коэффициенты могут оказаться статистически не-
значимыми.
Обычно шаг варьирования выбирают равным 0,05-0,3 от диапазона определе- ния, т.е. область варьирования составляет 10-60% от всей области определения.
После выбора центральных точек и интервалов варьирования проводится ко- дирование значений факторов, т.е. взамен значений факторов xi вводятся новые переменные zi. Центральным точкам, т.е. значениям факторов в центре, присваи- вается значение 0, верхнему значению +1, нижнему –1, значения новых перемен-
ных внутри диапазона варьирования рассчитываются во формуле: zi = xi −xxi 0i .
Для качественных факторов, имеющих два уровня, одному фактору присваи-
вается значение +1, другому –1. Порядок присвоения не имеет значения.
111
В качестве примера кодирования рассмотрим уровни варьирования для четы-
рех факторов.
Натураль- |
ные |
В ко- |
дах |
ФАКТОРЫ |
|
x1/z1 |
x2/z2 |
x3/z3 |
x4/z4 |
Основной уровень |
x0i |
2 |
5 |
15 |
25 |
|
|
|
|
|
|
Интервал варьирования |
xi |
0,5 |
3 |
2 |
5 |
|
|
|
|
|
|
Верхний уровень |
ximax |
2,5 |
8 |
17 |
30 |
Нижний уровень |
ximin |
1,5 |
2 |
13 |
20 |
Верхний уровень |
zimax |
+1 |
+1 |
+1 |
+1 |
Нижний уровень |
zimin |
-1 |
-1 |
-1 |
-1 |
112
Лекция 23. ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ
Для получения линейной модели, т.е. модели первого порядка, все факторы
варьируются только на двух уровнях, верхнем и нижнем.
Полным факторным экспериментом (ПФЭ) называется эксперимент, в котором
реализуются все возможные неповторяющиеся комбинации уровней факторов, причем каждый фактор варьируется только на двух уровнях.
Количество опытов, которые необходимо провести в ПФЭ, определяется вы-
ражением N = 2n , где n- число факторов. |
|
Для 2х факторов |
N=4, |
для 3х факторов |
N=8, |
для 4х факторов |
N=16, |
для 5х факторов |
N=32. |
Существует геометрическая интерпретация ПФЭ. В случае двух факторов
опыты проводятся в вершинах квадрата
|
|
|
|
В 3х-факторном эксперименте опыты про- |
-1,+ 1 |
+ 1,+ 1 |
водятся в вершинах куба. Центр области явля- |
||
|
|
|
|
ется центром куба. Для числа факторов более |
|
|
|
|
|
|
|
|
|
3х наглядно представить область определения |
|
|
|
|
факторов нельзя. Говорят, область экспери- |
-1,-1 |
|
+ 1,-1 |
мента представляется гиперкубом. |
|
|
|
|
|
Условия эксперимента записывают в виде таблицы, где строки соответствуют различным опытам, а столбцы – значениям факторов. Такие таблицы называются матрицами планирования эксперимента.
Матрица составляется по следующим правилам:
1.Каждая строка представляет набор координат точки, в которой проводится
опыт.
2.Вводится фиктивная переменная x0 = z0 = 1.
3.Так как переменные в ПФЭ принимают значения только +1 и –1, то пишут
«+» и «-».
113
4.Первая строка выбирается таким образом, чтобы все управляемые пере-
менные z1, z2, …, zn находятся на нижнем уровне. Последующие точки, т.е. строки, выбираются по правилу: при построчном переборе всех вариантов
частота смены знака управляемых переменных для каждой последующей переменной вдвое меньше, чем для предыдущей. Столбцы управляемых переменных образуют план эксперимента, а остальные столбцы матрицы
получаются перемножением соответствующих значений управляющих пе-
ременных.
В качестве примера приведена матрица для трехфакторного эксперимента
|
|
Управляемые пара- |
|
|
|
|
||
|
|
|
метры |
|
|
|
|
|
№ |
Z |
Z1 |
Z2 |
Z3 |
Z4 |
Z5 |
Z6 |
Z7 |
|
X0 |
X1 |
X2 |
X3 |
X1X2 |
X1X3 |
X2X3 |
X1X2X3 |
1 |
+ |
- |
- |
- |
+ |
+ |
+ |
- |
2 |
+ |
+ |
- |
- |
- |
- |
+ |
+ |
3 |
+ |
- |
+ |
- |
- |
+ |
- |
+ |
4 |
+ |
+ |
+ |
- |
+ |
- |
- |
- |
5 |
+ |
- |
- |
+ |
+ |
- |
- |
+ |
6 |
+ |
+ |
- |
+ |
- |
+ |
- |
- |
7 |
+ |
- |
+ |
+ |
- |
- |
+ |
- |
8 |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
(ПФЭ 23).
Матрица ПФЭ обладает следующими свойствами:
1. Сумма элементов вектор-столбца каждого фактора равна нулю
N
å zji = 0.
j=1
Это означает, что влияние верхнего и нижнего уровней одинаково.
2. Сумма квадратов элементов каждого столбца равна числу опытов:
N
å z2ji = N.
j=1
Это обеспечивает максимальную точность определения коэффициентов уравнения, так как в вычислении каждого из коэффициентов используются ре- зультаты всех опытов.
3. Сумма почленных произведений любых вектор-столбцов равна нулю:
N
å zjizjk = 0.
j=1
114
Это условие называется ортогональностью или взаимной перпендикулярно-
стью. В этом случае оценки влияния каждого фактора не зависят от оценок влия- ния других факторов.
4.Матрица ПФЭ обладает рототабельностью, т.е. точность предсказания
значений функции отклика одинакова на равных расстояниях от центра
плана и не зависит от направления.
Определение последовательности проведения опытов.
Результаты измерения функции отклика содержат случайные погрешности,
поэтому в каждой точке плана опыты обычно дублируются. Допустим, что в каж- дой точке проводится m дублирующих опытов. Количество опытов при этом воз- растает и становится равным Nm. Для уменьшения влияния случайных факторов
производится рандомизация последовательности проведения опытов, т. е. Слу- чайный выбор последовательности проведения.
Рандомизация проводится для всех Nm опытов или отдельно для каждой се- рии N опытов. Для выбранной схемы рандомизации из таблицы случайных чисел
с любого места любого столбца выбираются по порядку все числа в диапазоне от
0 до Nm или N и записываются в отдельный столбец матрицы, при этом уже
встретившиеся ранее числа пропускаются. Эти числа означают порядковый номер проведения эксперимента в данной точке плана. Если планируется последова-
тельное проведение серий опытов, то рандомизация выполняется отдельно для
каждой серии.
Проведение рандомизации опытов является желательной, однако встречается много случаев где рандомизация затруднена, дорога и неудобна. Случайное че-
редование экспериментальных условий может существенно увеличить затраты времени на проведение экспериментов, если изучаемая система требует много времени для возврата в состояние равновесия после изменения какого-либо фак- тора. Например, при исследовании характеристик работы отдельных элементов
оборудования при различной нагрузке энергоблока опыты проводятся при после- довательном снижении или увеличении нагрузки, эксперименты со случайным
выбором нагрузки становятся слишком дорогими и продолжительными. Частично эффекта рандомизации можно достичь, проводя одну серию опытов с последова- тельным снижением нагрузки, а другую – с подъемом. Однако, в этом случае сле-
дует особо обратить внимание на возможность появления эффекта гистерезиса, при котором значение функции отклика зависит не только от уровней факторов, но и от направления их изменения. Точно также может оказаться неприемлемым
115
случайное изменение конструктивных параметров установки в дублирующих опы-
тах, если это изменение требует соответствующей реконструкции.
Проверка воспроизводимости результатов эксперимента.
После реализации всех запланированных опытов для каждой точки плана по-
лучаем m значений функций отклика: yi1, yi2,..., yim , которые затем усредняются
m
å yik yi = k =1 .
m
Далее для каждой точки вычисляются значения дисперсий по формуле
|
|
|
åm (yik − |
|
i )2 |
|
|
|
|
y |
|
||||
|
2 |
= |
k =1 |
. |
|||
S |
|||||||
m − 1 |
|||||||
|
yi |
|
|
Проверку однородности дисперсий проводят по критерию Кохрена:
(S2 )
G = yi max .
N
å Syi2 i=1
В соответствующей таблице для уровня значимости α, числа степеней свобо- ды f1=m-1 и f2=N находится критическое значение Gкр.
Если G<Gкр, то можно считать, что точность воспроизведения опытов в каждой точке одинакова. В этом случае определяют дисперсию воспроизводимости экс-
перимента по формуле
|
|
|
N |
|
2 |
|
|
|
å |
S |
|
||
|
вос2 |
= |
i=1 |
yi |
||
S |
|
. |
||||
N |
|
|||||
|
|
|
|
|
Если G>Gкр, то это означает, что точность воспроизводимости опытов из-за
случайных колебаний каких-то факторов в разных точках различна, поэтому необ-
ходимо увеличить число дублирующих опытов для точек с большим значением дисперсии.
Получение математической модели.
Полный факторный эксперимент позволяет получить математическое описа-
ние функции отклика в виде
y = b0 + b1z1 + b2z2 + .. + bnzn + b12 z1z2 + b13 z1z3 + .. + bn−1,nzn−1zn + b12...nz1z2..zn
Количество коэффициентов в уравнении равно количеству опытов в одной серии опытов или количеству строк в матрице планирования эксперимента. В частности,
для трехфакторного эксперимента можно получить уравнение в виде
116