
- •В.А. Чуфистов планирование и организация эксперимента
- •1. Введение
- •1.1.Основные понятия и определения в области научных исследований.
- •1.2. Сбор и обработка информации при выполнении научных исследований
- •1.3. Роль эксперимента при выполнении научных исследований
- •2. Объекты исследований, параметры оптимизации
- •2.1. Объекты исследования, факторы и способы воздействия на объекты
- •2.2. Требования к параметру оптимизации
- •2.3. О задачах с несколькими выходными параметрами
- •3. Обобщенный параметр оптимизации
- •3.1. Простейшие способы построения обобщенного отклика
- •3.2. Шкала желательности
- •3.3. Преобразование частных откликов в частные функции желательности
- •3.4. Обобщенная функция желательности
- •4. Факторы
- •4.1. Определение фактора
- •4.2. Требования, предъявляемые к факторам при планировании эксперимента
- •4.3. Требования к совокупности факторов
- •5. Выбор модели
- •5.1. Шаговый принцип
- •5.2. Требования к модели
- •5.3. Полиномиальные модели
- •6. Полный факторный эксперимент
- •6.1. Особенности полного факторного эксперимента
- •6.2. Принятие решений перед планированием эксперимента
- •6.3. Полный факторный эксперимент типа 2k
- •6.4. Свойства полного факторного эксперимента типа 2k
- •6.5. Полный факторный эксперимент и математическая модель
- •7. Дробный факторный эксперимент
- •7.1. Минимизация числа опытов
- •7.2. Дробная реплика
- •7.3. Выбор полуреплик. Генерирующие соотношения и определяющие контрасты
- •8. Проведение эксперимента
- •8.1. Ошибки параллельных опытов
- •8.2. Дисперсия параметра оптимизации
- •8.3. Проверка однородности дисперсий
- •8.4. Рандомизация
- •8.5. Разбиение матрицы типа 2k на блоки
- •9. Обработка результатов эксперимента
- •9.1. Метод наименьших квадратов
- •9.2. Регрессионный анализ
- •9.3. Проверка адекватности модели
- •9.4. Проверка значимости коэффициентов
- •10. Матричный подход к регрессионному анализу
- •10.1. Метод наименьших квадратов для одного фактора
- •10.2. Обобщение метода наименьших квадратов на многофакторный линейный случай
- •10.3. Статистический анализ
- •10.4. Взвешенный метод наименьших квадратов и статистический анализ
- •10.5 Обработка результатов при различных способах дублирования
- •Обработка результатов эксперимента при неравномерном дублировании опытов
- •Равномерное дублирование.
- •Неравномерное дублирование
- •10.6. Применение планирования эксперимента для зависимостей степенного вида
- •10.7 Принятие решений после проверки адекватности линейной модели
- •11. Крутое восхождение по поверхности отклика
- •12. Планирование экстремальных экспериментов. Планы второго порядка
- •12.1 Центральные композиционные планы
- •12.2 Ортогональные планы второго порядка
- •12.3. Ротатабельное планирование второго порядка
- •12.4. Применение ротатабельного планирования второго порядка для исследования процесса торцового фрезерования
- •Приложение
- •Критические значения коэффициента парной корреляции
- •Значения t-критерия Стьюдента при 5%-м уровне значимости
- •Значения f-критерия Фишера при 5%-ном уровне значимости
- •Значения g-критерия при 5%-м уровне значимости
- •Литература
- •Владимир Алексеевич Чуфистов планирование и организация эксперимента
- •109240, Москва, Берниковская наб., 14.
- •1 09240, Москва, Берниковская наб., 14.
8.2. Дисперсия параметра оптимизации
Мы рассмотрели, как подсчитывается дисперсия в каждом опыте,
т.
е. в каждой горизонтальной строке матрицы
планирования.
Матрица
планирования состоит из серии опытов,
и дисперсия всего эксперимента получается
в результате усреднения дисперсий всех
опытов. По терминологии, принятой в
планировании эксперимента,
речь идет о подсчете дисперсии параметра
оптимизации
или, что то же самое, дисперсии
воспроизводимости эксперимента
.
Дисперсия в каждом опыте, состоящем из n повторных наблюдений, подсчитывается по формуле (8.2).
При подсчете дисперсии параметра оптимизации квадрат разности между значением yq в каждом опыте и средним значением из n повторных наблюдений у нужно просуммировать по числу опытов в матрице N, а затем разделить на N(n—I):
. (8.6)
Такой формулой можно пользоваться в случаях, когда число повторных опытов одинаково во всей матрице.
Для двух повторных опытов формула принимает совсем простой вид:
.
Дисперсию воспроизводимости проще всего рассчитывать, когда соблюдается равенство числа повторных опытов во всех экспериментальных точках. На практике часто приходится сталкиваться со случаями, когда число повторных опытов различно. Это происходит вследствие отброса грубых наблюдений, неуверенности экспериментатора в правильности некоторых результатов (в таких случаях возникает желание еще и еще раз повторить опыт) и т. п. Тогда при усреднении дисперсий приходится пользоваться средним взвешенным значением дисперсий, взятым с учетом числа степеней свободы:
(8.7)
где
— дисперсия первого опыта,
— дисперсия второго опыта и т. д.; f1
- число степеней свободы в первом опыте,
равное числу параллельных опытов n1
минус 1, т. е. f1
=
n1-
1; f2
— число степеней
свободы во втором опыте и т. д. Число
степеней свободы средней дисперсии
принимается равным
сумме чисел степеней свободы дисперсий,
из которых она вычислена.
Приведенными формулами для расчета дисперсии воспроизводимости эксперимента можно пользоваться только в том случае, если дисперсии отдельных опытов однородны. Последнее означает, что среди всех суммируемых дисперсий нет таких, которые бы значительно превышали все остальные. Для проверки неоднородности дисперсий нужны количественные критерии.
8.3. Проверка однородности дисперсий
Проверка однородности дисперсий производится с помощью различных статистических критериев. Простейшим из них является критерий Фишера, предназначенный для сравнения двух дисперсий. Критерий Фишера (F-критерий, табл.П.4) представляет собою отношение большей дисперсии к меньшей. Полученная величина сравнивается с табличной величиной F-критерия. Если полученное значение дисперсионного отношения больше приведенного в таблице для соответствующих степеней свободы и выбранного уровня значимости, это означает, что дисперсии значимо отличаются друг от друга, т. е. что они неоднородны.
Пример
3.
Пусть
=5,14,
n1=7
и
f1
=
6;
=0,324
для n2
=
6 и f2
=
5. В данном примере отношение дисперсий
равно 5,14/0,324=15,9 при f1=6
и f2=5.
Используем
таблицу отношений
дисперсий для различных степеней свободы
и различного уровня значимости.
Выбираем наиболее популярный уровень
значимости 0,05. В таблице по горизонтали
отложены числа степеней
свободы для большей дисперсии f1,
а по вертикали — числа степеней свободы
для меньшей дисперсии f2.
Для
f1=6
и f2=5
Fтабл
=
5,0. Это значит: вероятность
того, что экспериментальное значение
F
будет
больше чем 5,0, равна
0,05 или 5%. Наше Fэксп
=15,90. Оно значительно превышает табличное
значение, т.е. дисперсии неоднородны.
Если сравниваемое количество дисперсий больше двух и одна дисперсия значительно превышает остальные, можно воспользоваться критерием Кохрена (табл.П.5). Этот критерий пригоден для случаев, когда во всех точках имеется одинаковое число повторных опытов. При этом подсчитывается дисперсия в каждой горизонтальной строке матрицы
,
а
затем из всех дисперсий находится
наибольшая
,
которая делится
на сумму всех дисперсий. Критерий Кохрена
— это отношение максимальной дисперсии
к сумме всех дисперсий
. (8.8)
С этим критерием связаны числа степеней свободы f1=n1— 1 и f2 = N. Гипотеза об однородности дисперсий подтверждается, если экспериментальное значение критерия Кохрена не превышает табличного значения. Тогда можно усреднять дисперсии и пользоваться формулой:
.
Пример 4. В табл. 8.1 приведены данные для расчета дисперсии воспроизводимости.
Таблица 8.1
Номер опыта |
Матрица планирования |
|
|
|
|
|
|
1 |
(1) |
80,23 |
81,93 |
81,08 |
-0,85 |
0,722 |
1,444 |
2 |
а |
86,50 |
84,80 |
85,65 |
0,85 |
0,722 |
1,444 |
3 |
b |
82,45 |
82,10 |
82,27 |
0,18 |
0,031 |
0,062 |
4 |
аb |
89,50 |
91,30 |
90,40 |
-0,90 |
0,810 |
1,620 |
5 |
с |
85,10 |
84,80 |
84,95 |
0,15 |
0,023 |
0,046 |
6 |
ас |
90,30 |
89,60 |
89,95 |
0,35 |
0,123 |
0,246 |
7 |
bс |
85,60 |
84,90 |
85,25 |
0,35 |
0,123 |
0,246 |
8 |
аbс |
88,02 |
88,48 |
88,25 |
-0,23 |
0,053 |
0,106 |
|
|
|
|
|
|
2,607 |
|
Дисперсия в каждом опыте равна:
.
Максимальная дисперсия оказалась в опыте № 4.
Экспериментальный критерий Кохрена равен G=1,620/5,214=0,31. Табличный критерий Кохрена при f1 = 1, f2 = 8 и = 0,05 равен: G=0,68. Экспериментальный критерий Кохрена не превышает значения табличного. Гипотеза об однородности дисперсий подтверждается. Дисперсия воспроизводимости равна:
.
Пример 5. Теперь обратимся к примеру с различным числом повторных опытов (табл. 8.2). Проведем подсчет дисперсии в каждом опыте и дисперсию воспроизводимости (если не возникнет предположение, что дисперсии неоднородны).
Матрица планирования 23-1 с различным числом повторных опытов
Таблица 8.2
Номер опыта |
Матрица планиро-вания |
y1 |
y2 |
y3 |
y4 |
|
|
1 2 3 4 |
c abc b a |
87,31 92,3 87,2 84,0 |
86,01 91,8 88,7 84,9 |
-- -- 87,5 84,2 |
-- -- 88,0 -- |
86,66 92,05 87,85 84,37 |
0,65 0,25 -0,65 -0,37 |
Таблица 8.2 (окончание)
Номер опыта |
|
|
|
|
|
|
|
f |
1 2 3 4 |
-0,65 -0,25 0,85 0,53 |
-0,35 -0,17 |
0,15
|
0,422 0,062 0,422 0,137 |
0,422 0,062 0,723 0,281 |
0,122 0,029 |
0,022 |
1 1 3 2 |
=
(0,422 + 0,422)/(2 -
1) =0,844;
=
(0,062 + 0,062)/(2 - 1) =0,124;
=
(0,422 + 0,723+
0,122 + 0,022)/(4 - 1) = 0,429;
=
(0,137 + 0,281 + 0,029)/(3 - 1) = 0,223;
;
.
В данном примере не возникает предположение о неоднородности дисперсий, поскольку все они имеют одинаковый порядок.
Если возникает предположение о наличии неоднородности, следует попытаться его проверить. Для этой цели можно воспользоваться критерием Бартлета. По уже знакомой формуле подсчитывается дисперсия воспроизводимости. Далее находится величина:
,
где
.
Здесь
число степеней свободы равно N
— 1,
где N
— число
сравниваемых
дисперсий. При планировании эксперимента
типа 2k
это число равно числу опытов в матрице.
Величина
приближенно
подчиняется
-
распределению с (N
— 1)
степенями свободы
(табл. П.6). Значимость критерия Бартлета
проверяется обычным способом. Критерий
Бартлета базируется на нормальном
распределении.
Если имеются отклонения от нормального
распределения, то
проверка неоднородности дисперсий
может привести к ошибочным
результатам.
Пример 6. В четырех опытах с неравным числом повторных наблюдений получены результаты, приведенные в табл. 8.3.
Исходные данные для расчета критерия Бартлета.
Таблица 8.3
Номер опыта |
|
fi |
Номер опыта |
|
fi |
1 |
3,50 |
4 |
3 |
5,88 |
3 |
2 |
4,22 |
5 |
4 |
11,36 |
3 |
Рассчитаем
и
воспользуемся критерием Бартлета, а
затем ответим на вопрос, верна ли гипотеза
об однородности дисперсии. По данным
табл. 8.3 получим
и
= 5,79. Находим величину с:
Теперь
мы можем определить
.
Экспериментальное значение - критерия равно 1,567. Табличное значение для трех степеней свободы и уровня значимости 0,05 равно 7,815 (табл.П.6), и мы приходим к выводу, что дисперсии однородны.
Приступать к расчету ошибки воспроизводимости, к регрессионному анализу (а также к дисперсионному анализу) можно только после того, как дисперсии выдержали проверку на однородность.
Экспериментаторы часто пренебрегают такой проверкой из-за трудоемкости расчетов. В этом случае можно предложить использование F-критерия даже тогда, когда число дисперсий больше двух. Для этого из всех дисперсий выделяются наибольшая и наименьшая дисперси. По F-критерию производится проверка, значимо ли они различаются между собой. Ясно, что если наибольшая и наименьшая дисперсии не отличаются значимо, то дисперсии, имеющие промежуточные значения, также не могут значимо отличаться друг от друга.
Если при проверке гипотезы об однородности дисперсий они оказались неоднородными, то в таких случаях часто оказывается полезным изменение масштаба для параметра оптимизации. При этом вводится некоторая математическая функция от параметра оптимизации, например квадратный корень или логарифм.