- •Основы научных исследований
- •Введение
- •Общие представления
- •О науке1
- •Термины и определения
- •Классификация научных исследований
- •История науки и ее роль в жизни общества
- •Организация научной деятельности в России
- •Методы научных
- •Исследований1
- •Классификация методов научных исследований
- •Количественные измерения
- •Характеристика результатов измерений как случайных величин
- •Погрешности измерений
- •Формы представления конечных результатов измерений
- •Примеры статистической оценки результатов наблюдений и экспериментов Сравнение двух дисперсий
- •Сравнение нескольких дисперсий выборок одинакового объема
- •Сравнение двух средних
- •Контрольные вопросы и задания
- •Тема 3 основные этапы прикладных научных исследований
- •Основные этапы нир
- •Рекомендации по составлению аналитического обзора
- •Поиск и хранение информации
- •Определение предмета поиска информациизачастую определяется источниками информации и особенностями третичных документов, облегчающих поиск первичных и вторичных документов.
- •Выбор источников информации во многом зависит от "возраста" информации в этих источниках.
- •Отбор и хранение найденной информации.Рекомендуется всю найденную информацию сохранять, так как она может пригодиться не только для данного, но и последующих исследований.
- •Составление аналитического обзора
- •Тема 4 выбор и составление плана эксперимента
- •Планирование эксперимента для применения корреляционного анализа Общие положения корреляционного анализа
- •Составление планов эксперимента с учетом возможности проведения корреляционного анализа
- •Анализ поля корреляции. При использовании этого метода выполняем две операции:
- •Анализ выборочного коэффициента парной линейной корреляции. Выполняем следующие операции:
- •Окончательные выводы корреляционного анализа.
- •Планирование эксперимента для применения дисперсионного анализа Общие положения дисперсионного анализа
- •Составление планов эксперимента для проведения дисперсионного анализа
- •Однофакторный дисперсионный анализ.
- •Планирование эксперимента для применения регрессионного анализа Некоторые общие положения регрессионного анализа
- •Составление планов эксперимента для проведения
- •Регрессионного анализа
- •Составление планов эксперимента для проведения
- •Классического регрессионного анализа
- •Математическое планирование эксперимента для проведения регрессионного анализа
- •Планы первого порядка
- •Планы второго порядка
- •Планирование эксперимента для решения оптимизационных задач
- •Метод крутого восхождения или наискорейшего спуска по поверхности функции отклика объекта
- •Метод симплекс-планирования
- •Особенности планирования эксперимента в производственных условиях
- •Тема 6 основные задачи, решаемые при выполнении опытно-конструкторских работ
- •Тема 7 охрана интеллектуальной собственности, создаваемой при выполнении научных исследований
- •Библиографический список
- •Приложение а табличные формы некоторых законов распределения
- •Содержание
- •Глухих Виктор Владимирович Основы научных исследований
Составление планов эксперимента для проведения дисперсионного анализа
Общим требованием к планированию любого эксперимента для проведения дисперсионного анализа является выполнение условия mj> 1. Желательно, чтобы план эксперимента для проведения дисперсионного анализа предусматривал:
- широкую область изменения значений факторов xj,
- большое число mjзначений (уровней) факторовxj, при этом разница между уровнями должна быть больше абсолютной погрешности их измерения.
Остальные требования к составлению плана эксперимента зависят от числа исследуемых факторов и выбранного числа опытов.
Однофакторный дисперсионный анализ.
Введем следующие обозначения:
А |
– и сследуемый фактор; |
m |
– максимальное число разных уровней фактора А; |
v |
– номер уровня фактора А; |
аv |
– конкретное значение (качественное или количественное) уровня фактора А(v= 1…m); |
n |
– максимальное число повторений каждого опыта при одном значении фактора А; |
i |
– номер повторного опыта при одном значении фактора А; |
N |
– общее число опытов при эксперименте. |
При одинаковом числе повторений опытов для каждого уровня фактора А:N = mn.
Классической формой плана для проведения однофакторного дисперсионного анализа является табл. 7. Условные обозначения уровней фактора часто называют "кодированными" значениями фактора, а реальные значения (качественные или количественные) – натуральными значениями.
Таблица 7
План эксперимента для проведения однофакторного дисперсионного анализа с кодированными значениями уровней фактора А
Номер повторного опыта |
Значения y при уровне фактора А | ||||||
a1 |
a2 |
... |
az |
... |
am-1 |
am | |
1 |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
... |
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
... |
|
|
|
|
|
|
|
n-1 |
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
Очевидно, что число пустых клеточек в таблице соответствует общему числу опытов в эксперименте (N). В эти клеточки после проведения соответствующего опыта заносят измеренное значение свойства объектаy.
Двухфакторный дисперсионный анализ предусматривает возможность проведения экспериментов без повторения опытов. Если обозначить второй фактор В, максимальное число его уровней w и номер уровня q, то общее число опытов в плане эксперимента без повторения опытов будет равно:
N = mw.
Классический план такого эксперимента (табл. 8) является планом полного факторного эксперимента(ПФЭ), так как в нем предусмотрены опыты со всеми возможными сочетаниями различных уровней всех факторов.
Более понятным для выполнения является развернутый план эксперимента. Развернутый план получают из классического плана, присвоив в случайном порядке (принцип рандомизации) номера опытов каждой пустой ячейке табл. 8. Условия проведения каждого опыта (табл. 9) определяются, исходя из того, какие столбец и строка (уровни фактора АиВ) пересекаются в ячейке с данным номером опыта.
Таблица 8
План эксперимента для проведения двухфакторного дисперсионного анализа с кодированными значениями уровней факторов
без повторения опытов
Уровень |
Значения y при уровне фактора А | ||||||
фактора В |
a1 |
a2 |
... |
az |
... |
am-1 |
am |
b1 |
№ 8 |
№ 3 |
... |
№1 |
... |
... |
... |
b2 |
... |
№5 |
... |
... |
... |
... |
№ 7 |
... |
... |
... |
... |
... |
... |
... |
... |
bq |
№ 4 |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
bw-1 |
№ 2 |
№ mw |
... |
... |
... |
... |
... |
bw |
... |
№ 6 |
... |
... |
... |
... |
... |
Если в плане эксперимента предусмотреть повторение каждого опыта, то тогда при проведении дисперсионного анализа результатов измерений yможно оценить влияние на данное свойство объекта эффекта одновременного изменения двух факторов (эффектоввзаимодействия факторов). Эффекты взаимодействия могут иметь синергетический (взаимоусиливающий) или антагонистический (взаимоослабляющий) характер влияния одновременного изменения факторовxjна свойствоy.
Таблица 9
Развернутый план эксперимента для проведения двухфакторного дисперсионного анализа с кодированными значениями уровней факторов без повторения опытов
Номер опыта |
Кодированные значения уровня фактора |
Значение y | |
А |
В |
| |
1 |
az |
b1 |
|
2 |
a1 |
bw-1 |
|
3 |
a2 |
b1 |
|
4 |
a1 |
bq |
|
5 |
a2 |
b2 |
|
6 |
a2 |
bw |
|
7 |
am |
b2 |
|
8 |
a1 |
b1 |
|
... |
... |
... |
|
mw |
a2 |
bw-1 |
|
Многофакторный дисперсионный анализ.При многофакторном эксперименте одновременно изменяются три и более факторов. Общее число опытов (без их повторения) для ПФЭ с k изменяемыми факторами (если каждый из них имеет одно и то же максимальное число уровней m) будет равно:
NПФЭ=mk.
Очевидно, что с увеличением числа исследуемых факторов (k) общее число опытов в эксперименте будет резко возрастать. Поэтому при многофакторных экспериментах часто применяютпланы дробных факторных экспериментов(ДФЭ), которые предусматривают выполнение опытов только с частью всех возможных сочетаний различных уровней всех факторов (дробные реплики ПФЭ). Долю общего числа опытов ДФЭ (NДФЭ) отNПФЭназывают степенью дробности ДФЭ.
Необходимо помнить, что сокращение числа опытовв эксперименте, т.е. переход от ПФЭ к ДФЭ, всегдаприводит к снижению точностидисперсионного анализа результатов эксперимента.
Существуют различные принципы составления и типы планов ДФЭ: составление планов по принципу дробных реплик, латинских квадратов и кубов, планы ПлакеттаБермана и др. Эти планы относятся кпланам математического планирования эксперимента,так как при их построении сочетание уровней факторов в опытах (выбор части опытов из планов ПФЭ) происходит не произвольно, а по определенным принципам математической комбинаторики.
Планы ДФЭ широко применяются при отсеивающих экспериментах, т.е. тогда, когда необходимо изучить достаточно большое число факторов при небольшом числе опытов и определить те факторы, которые оказывают наиболее сильное влияние на свойство y. Одними из самых экономичных по числу опытов и эффективных для дисперсионного анализа из известных планов ДФЭ являются планы ПлакеттаБермана.
В качестве примера приведу порядок выбора и составления плана 10-факторного эксперимента (k=10).
С целью экономии числа опытов в эксперименте возьмем двухуровневые планы с одинаковым числом уровней для всех факторов (mj=m= 2) и откажемся от проведения повторных опытов (n= 1). Тогда для проведения ПФЭ необходимо будет выполнить следующее число опытов:
NПФЭ=mk= 210= 1024.
Из известных 2-уровневых планов ДФЭ рассмотрим возможное число опытов в эксперименте по планам по принципу дробных реплик ПФЭ (NДР) и планам ПлакеттаБермана (NПБ):
NДР = 2k-a = 210-a;
NПБ = 4b,
где а равно 1, 2, 3, ...,10 (NДРравно 512, 256, 128, 64, 32, 16, 8, 4, 2, соответственно), аbравно 1, 2, 3, ..,(NПБравно 4, 8, 12, ..,, соответственно).
Из таких 2-уровневых планов можно выбирать только те, для которых выполняется соотношение
Nk+110+111.
Требованиям этого соотношения и минимального числа опытов лучше всех удовлетворяет план ПлакеттаБермана сNПБ= 12.
Построим такой план с кодированными значениями факторов, обозначая знаком "+" одно максимальное значений каждого из факторов, а знаком "-" минимальное значение.
При построении данного плана (табл. 10) в ячейки последнего опыта (№ 12) заносится кодированное значение (-) для всех факторов. Затем во втором столбце плана (для х1), по рекомендациям литературы [4, 5], в ячейках располагается 6 (k/2) знаков (+) и 5 (k/2-1) знаков (-).
Таблица 10
План Плакетта-Бермана с 12 опытами без их повторений
Номер опыта n |
Кодированные значения факторов |
| |||||||||||
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
x9 |
x10 |
x11(*) |
x12(*) |
y | |
|
|
|
|
|
|
|
|
|
|
|
|
| |
1 |
+ |
- |
+ |
- |
- |
- |
+ |
+ |
+ |
- |
+ |
+ |
|
2 |
+ |
+ |
- |
+ |
- |
- |
- |
+ |
+ |
+ |
- |
+ |
|
3 |
- |
+ |
+ |
- |
+ |
- |
- |
- |
+ |
+ |
+ |
- |
|
4 |
+ |
- |
+ |
+ |
- |
+ |
- |
- |
- |
+ |
+ |
+ |
|
5 |
+ |
+ |
- |
+ |
+ |
- |
+ |
- |
- |
- |
+ |
+ |
|
6 |
+ |
+ |
+ |
- |
+ |
+ |
- |
+ |
- |
- |
- |
+ |
|
7 |
- |
+ |
+ |
+ |
- |
+ |
+ |
- |
+ |
- |
- |
- |
|
8 |
- |
- |
+ |
+ |
+ |
- |
+ |
+ |
- |
+ |
- |
- |
|
9 |
- |
- |
- |
+ |
+ |
+ |
- |
+ |
+ |
- |
+ |
- |
|
10 |
+ |
- |
- |
- |
+ |
+ |
+ |
- |
+ |
+ |
- |
+ |
|
11 |
- |
+ |
- |
- |
- |
+ |
+ |
+ |
- |
+ |
+ |
- |
|
12 |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
- |
|
* Фиктивные факторы, используемые для расчета случайных ошибок эксперимента. |
Ячейки следующего столбца получаются из предыдущего. Первая ячейка третьего столбца (для х2) является предпоследней ячейкой второго столбца (опыт № 11), а остальные первые 10 ячеек второго столбца копируются под первую ячейку третьего столбца (т.е. происходит их сдвиг по диагонали плана слева-направо-вниз).
Правильность построения плана ПлакеттаБермана определяется двумя признаками:
- диагональным расположением одинаковых знаков в ячейках плана;
- равенством количества знаков (+) и (-) в каждом столбце плана.
План с натуральными значениями факторов получается из плана с кодированными значениями путем замены знаков (+) и (-) на соответствующие им натуральные значения для каждого фактора.
Примеры составления других планов многофакторного ДФЭ для проведения дисперсионного анализа и алгоритмы математической обработки результатов эксперимента изучите самостоятельно [4,5].
Проведение дисперсионного анализа можно легко осуществить с помощью ПЭВМ с использованием различных общепризнанных статистических программных продуктов: STATGRAPHICS,STADIA[11],STATISTICAи др.
Пример.С целью определения влияния типа катализатора (х) на выход пентозанов (y) при гидролизе березовых опилок был спланирован и проведен однофакторный (k = 1) четырехуровневый (m = 4) эксперимент с двукратным повторением каждого опыта (n = 2) и получены следующие единичные результаты измерений (табл. 11).
Расчеты однофакторного дисперсионного анализа полученных результатов эксперимента были выполнены на ПЭВМ с помощью Excel и их итоги представлены в табл. 12.
Таблица 11
План и результаты однофакторного эксперимента
Номер повторного опыта, i |
Выход пентозанов (y), отн.%, при использовании катализатора (х) | |||
х0 (без катализатора) |
х1 (катализатор № 1) |
х2 (катализатор № 2) |
х3 (катализатор № 3) | |
1 |
25 |
52 |
40 |
61 |
2 |
15 |
48 |
40 |
59 |
Таблица 12
Итоги расчетов
Источник дисперсии |
Сумма квадратов |
Число степеней свободы |
Средний квадрат |
Fp |
Уровень значимости, |
Критическое значение F (Fт) |
Фактор х |
1750 |
3 |
583,3333 |
38,88889 |
0,002037 |
|
Случайные факторы |
60 |
4 |
15,0000 |
- |
- |
|
Данные табл. 12 показывают, что тип катализатора влияет на выход пентозанов с вероятностью Р более 0,997 (Р = 1- = 0,099763).
Применим метод попарного сравнения средних арифметических результатов измерений для определения уровня фактора х, при котором влияние на свойство y превышает ошибки эксперимента.
Алгоритм расчетов зависит от соблюдения равенства выборочных дисперсий единичных значений (и).
Первоначально сравним выход пентозанов при реакции без катализатора (v =0) и с катализатором № 2 (v = 2). Выполним расчеты соответствующих параметров:
отн. %;отн. %;
(отн. %)2;
(отн. %)2.
Проверим равенство (однородность) выборочных дисперсий единичных значений:
;
FТ (Р = 0,95; f1 = f2 = n–1 = 2–1 =1) = 161,5 (прил. А);
Fp > FТ ( > 161,5).
Таким образом, с вероятностью 0,95 сравниваемые дисперсии инеоднородны, т.е.не равны друг другу (различия между ними "значимы"). Поскольку дисперсии неоднородны, то для сравнения средних арифметических значений ивоспользуемсяT-критерием [4]:
; ; ;
(отн. %)2; (отн. %)2;
tт (Р = 0,95; f = n–1 = 2–1 =1) = 12,71; [4, 6]
отн. %;
< T.
Таким образом, исходя из полученного неравенства с вероятностью 0,95 следует считать, что катализатор № 2 (х2) не влияет на выход пентозанов при гидролизе березовых опилок.
Сравнение других пар средних арифметических значений yv показало, что с вероятностью 0,95 можно утверждать об увеличении выхода пентозанов при введении в реакцию гидролиза катализатора № 1 (х1) и катализатора № 3 (х3). По величине Fp следует, что катализатор № 3 имеет более высокую эффективность действия в исследованной реакции по сравнению с катализатором № 1.
Следует иметь в виду, что применение дисперсионного анализа дает более точные выводы, если величиныyиxjимеют нормальное распределение. В противном случае для качественной оценки зависимостилучше использоватьнепараметрические методы факторного анализа.
Контрольные вопросы и задания
Для каких целей применяют дисперсионный анализ в научных исследованиях?
Приведите название вида зависимости (качественная или количественная) свойства объекта Yот значений фактораX, которое можно определить с помощью дисперсионного анализа.
Приведите названия планов и методов дисперсионного анализа по числу одновременно изменяемых в эксперименте факторов Х.
Приведите определение сути дисперсионного анализа.
Укажите единственное обязательное условие при планировании эксперимента для последующей обработки его результатов методами дисперсионного анализа.