Методическое пособие 347
.pdfСледовательно, дробную реплику с генерирующим соотношением X4=X1X2 имеет смысл использовать, если нас более всего интересуют коэффициенты β12, β23, β34.
Дробную реплику, в которой Р линейных эффектов приравнены к эффектам взаимодействия, обозначают 2k-P
Таким образом, планы первого порядка, оптимальные двухуровневые планы ПФЭ 2K и ДФЭ 2k-P имеют следующие преимущества:
1 – планы ортогональны, поэтому все вычисления просты; 2 – все коэффициенты определяются независимо один от
другого; 3 – каждый коэффициент определяется по результатам
всех n опытов;
4 – все коэффициенты регрессии определяются с одинаковой дисперсией, т.е. эти планы обладают и свойством ротатабельности.
19
2 Регрессионный анализ
Ниже излагаются основные положения регрессионного анализа, применение которого для обработки результатов наблюдений связано с меньшим числом ограничений, чем при корреляционном анализе. Как и корреляционный анализ, регрессионный анализ включает в себя построение уравнения регрессии, например, методом наименьших квадратов и статистическую оценку результатов. Если в регрессионном анализе расчет коэффициентов ведется теми же методами, например наименьших квадратов, то его теоретические предпосылки требуют других способов статистической оценки результатов.
При проведении регрессионного анализа примем следующие допущения:
1)входной параметр x измеряется с пренебрежимо малой ошибкой. Появление ошибки в определении y объясняется наличием в процессе не выявленных переменных и случайных воздействий, не вошедших в уравнение регрессии;
2)результаты наблюдений y1, y12,..., yi,..., yn над выходной величиной представляют собой независимые нормально распределенные случайные величины;
3)при проведении эксперимента с объемом выборки n при
условии, что каждый опыт повторен m* раз, выборочные дисперсии S12,..., Si2,..., Sn2 должны быть однородны. При выполнении измерений в различных условиях возникает задача сравнения точности измерений. При этом следует подчеркнуть, что экспериментальные данные можно сравнивать только тогда, когда их дисперсии однородны. Это означает принадлежность экспериментальных данных к одной
итой же генеральной совокупности. Напомним: однородность дисперсий свидетельствует о том, что среди сравниваемых дисперсий нет таких, которые с заданной надежностью превышали бы все остальные, т.е. была бы большая ошибка. При одинаковом числе параллельных опытов однородность
20
дисперсии, как мы уже показали, можно оценить по критерию Кохрена, а для сравнения двух дисперсий целесообразно воспользоваться F-критерием Фишера.
После того как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ состоит в следующем: проверяется значимость всех коэффициентов и устанавливается адекватность уравнения.
2.1 Проверка адекватности модели
При моделировании приходится формализовать связи исследуемого явления (процесса), из-за чего возможна потеря некоторой информации об объекте. Иногда некоторые связи не учитываются. В то же время основное требование к математической модели заключается в ее пригодности для решения поставленной задачи и адекватности процессу. Регрессионную модель называют адекватной, если предсказанные по ней значения у согласуются с результатами наблюдений. Так, построив модель в виде линейного уравнения регрессии, мы хотим, в частности, убедиться, что никакие другие модели не дадут значительного улучшения в описании предсказания значений у. В основе процедуры проверки адекватности модели лежат предположения, что случайные ошибки наблюдений являются независимыми, нормально распределенными случайными величинами с нулевыми средними значениями и одинаковыми дисперсиями.
Сформулируем нуль-гипотезу Н0: "Уравнение регрессии адекватно".
Альтернативная гипотеза Н1: "Уравнение регрессии неадекватно".
Для проверки этих гипотез принято использовать F- критерий Фишера.
При этом общую дисперсию (дисперсию выходного параметра) S y2 cравнивают с остаточной дисперсией Sуост2.
Напомним, что
21
(2.1)
где l=k+1 – число членов аппроксимирующего полинома, а k – число факторов. Так, например, для линейной зависимости k=1, l=2.
В дальнейшем определяется экспериментальное значение F-критерия
(2.2)
который в данном случае показывает, во сколько раз уравнение регрессии предсказывает результаты опытов лучше,
|
|
1 |
n |
|
чем среднее |
y |
|
yi C const |
|
|
||||
|
|
n i 1 |
|
|
Если F |
F ;m1;m2 , |
то уравнение регрессии адекватно. Чем |
||
больше значение |
F |
превышает F ;m1;m2 для выбранного α и |
числа степеней свободы m1=n-1, m2=n-l, тем эффективнее
уравнение регрессии.
Рассмотрим также случай, когда в каждой i-й точке xi для повышения надежности и достоверности осуществляется не одно, а m* параллельных измерений (примем для простоты, что m* одинаково для каждого фактора). Тогда число экспериментальных значений величины у составит nΣ=n m*.
В этом случае оценка адекватности модели производится следующим образом:
22
|
m |
|
|
1) определяется yi |
j |
yij / m |
– среднее из серии |
|
1 |
|
параллельных опытов при x=xi, где yij – значение параметра у при x=xi в j-м случае;
2)рассчитываются значения параметра yˆi по уравнению регрессии при x=xi;
3)рассчитывается дисперсия адекватности
где n – число значений xi; l – число членов аппроксимирующего полинома (коэффициентов bi), для линейной зависимости l=2;
4)определяется выборочная дисперсия Y при x=xi:
5)определяется дисперсия воспроизводимости
Число степеней свободы этой дисперсии равно m=n(m*-1);
6)определяется экспериментальное значение критерия Фишера
7)определяется теоретическое значение этого же критерия
F ;m1;m2
где m1=n-l; m2= n (m*-1);
23
8) если F F ;m1;m2 , то уравнение регрессии адекватно, в противном случае – нет.
2.2 Проверка значимости коэффициентов уравнения регрессии
Надежность оценок bi уравнения регрессии можно охарактеризовать их доверительными интервалами Δbi, в которых с заданной вероятностью находится истинное значение этого параметра.
Наиболее просто построить доверительные интервалы для параметров линейного уравнения регрессии, т.е. коэффициентов b0 и b1. При этом предполагается, что для каждого значения случайной величины x=xi имеется распре-
деление |
со |
средним |
значением |
yˆi |
b0 |
b1xi |
и |
|||
дисперсией S 2 |
S 2 |
|
. Иными словами, |
|
делается |
допущение, |
||||
|
yi |
восп |
|
|
|
|
|
|
|
|
что случайная величина Y распределена нормально при |
||||||||||
каждом |
значении |
x , а дисперсия S |
2 |
во всем |
интервале |
|||||
|
|
|
|
i |
|
yi |
|
|
|
|
изменения x постоянна: Syi2 |
const . |
|
|
|
|
|
Для линейного уравнения среднеквадратичное отклонение i-го коэффициента уравнения регрессии Sbi можно определить по закону накопления ошибок.
(2.3)
При условии, что Sy21 Sy22 ... Syi2 ... Syn2 Sвосп2 |
, |
получим
(2.4)
24
(2.4а)
Sb0 и Sb1 называются соответственно стандартной ошибкой
свободного члена и стандартной ошибкой коэффициента регрессии.
Проверка значимости коэффициентов выполняется по критерию Стьюдента. При этом проверяется нуль-гипотеза Н0: bi=0, т.е. i-й коэффициент генеральной совокупности при заданном уровне значимости α отличен от нуля.
Построим доверительный интервал для коэффициентов уравнения регрессии
(2.5)
где число степеней свободы в критерии Стьюдента определяется по соотношению n-l. Потеря l=k+1 степеней свободы обусловлена тем, что все коэффициенты bi рассчитываются зависимо друг от друга.
Тогда доверительный интервал для Δbi коэффициента уравнения регрессии составит (bi-Δbi; bi+Δbi). Чем уже доверительный интервал, тем с большей уверенностью можно говорить о значимости этого коэффициента.
Необходимо всегда помнить рабочее правило: "Если абсолютная вели-чина коэффициента регрессии больше, чем его доверительный интервал, то этот коэффициент значим".
Таким образом, если |bi|>|Δbi|, то bi коэффициент значим, в противном случае – нет.
Незначимые коэффициенты исключаются из уравнения регрессии, а оставшиеся коэффициенты пересчитываются заново, так как они зависимы.
25
3 Пример разработки математической модели
В качестве примера рассмотрим разработку математической модели гидравлического режима четырехзонной методической печи с использованием теории планирования эксперимента. При планировании опытов используем методику проведения дробного факторного эксперимента (ДФЭ) первого порядка с двухуровневым варьированием факторов.
Перед разработкой плана эксперимента на основе априорной информации были выявлены факторы, влияющие на величину давления в томильной зоне печи. К числу таких факторов относятся расходы топлива на каждую зону нагрева и угол поворота дымового клапана. Расходы воздуха на каждую зону в качестве факторов не фигурировали, поскольку схема управления горением топлива автоматически меняет расход воздуха при изменении расхода газа.
Обозначим факторы: X1 — расход газа в томильной зоне, м3/ч; X2 — расход газа во второй сварочной зоне, м3/ч; X3 — расход газа в первой сварочной зоне, м3/ч; X4 — расход газа в нижней сварочной зоне, м3/ч; X5 — положение дымового клапана, % хода исполнительного механизма (рис.3.1).
Рисунок 3.1 – Положение факторов (Х1, …, Х5) и отклика (Y) при проведении исследования на методической печи
26
Реализация ПФЭ в этом случае при варьировании всех факторов на двух уровнях потребовала бы постановки 25=32 опытов.
Будем предполагать, что эффекты взаимодействия факторов в исследуемом объекте маловероятны и пренебрежимо малы. Воспользуемся 1/4 репликой ПФЭ, т.е. ДФЭ типа 25-2, где формально 2 фактора заменены соответствующими произведениями остальных факторов (x4=x1 x2, x5=x1 x2 x3 ). Это позволит сократить число опытов до 23=8. Уровни варьирования факторов представлены в табл. 4.
Таблица 4 - Уровни варьирования факторов
|
|
|
Факторы |
|
|
Уровни |
X1, |
X2, |
X3, |
X4, |
X5, |
факторов |
м3/ч |
м3/ч |
м3/ч |
м3/ч |
% хода |
|
|
|
|
|
ИМ |
Основной |
5250 |
3900 |
2650 |
1100 |
74 |
(нулевой) |
|
|
|
|
|
Нижний |
4000 |
3100 |
1750 |
700 |
50 |
|
|
|
|
|
|
Верхний |
6500 |
4700 |
3500 |
1500 |
98 |
Интервал |
1250 |
800 |
900 |
400 |
24 |
варьирования
В табл. 5 приведены матрица планирования ДФЭ 25-2 и результаты эксперимента — значения выходной переменной (давления в томильной зоне методической печи).
Для обработки результатов эксперимента используем методику, изложенную ранее во втором разделе методических указаний.
1. Расчет построчных средних:
где m* — число повторных опытов (m*=2). Например,
27
Результаты расчета представлены в табл. 5.
|
|
|
|
|
|
|
|
|
5-2 |
|
|
|
|
|
Таблица 5 - Матрица ДФЭ |
2 |
|
с двумя |
параллельными |
||||||||||
опытами |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
Переменная состояния (отклик), |
|
||||||
Факторы (кодированные |
|
|
|
кПа |
|
Построчная |
||||||||
|
|
значения) |
|
|
Опыт |
|
Опыт |
|
Средне |
|
Моде |
дисперсия |
||
|
|
|
|
|
|
|
1 |
|
2 |
|
е |
|
ль |
S 2 |
X |
X |
X |
X |
|
X |
X |
|
|
|
|
y j |
|
yˆ j |
j |
|
Y1 |
|
Y2 |
|
|
|
||||||||
0 |
1 |
2 |
3 |
|
4 |
5 |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
||||||
1 |
1 |
1 |
1 |
|
1 |
1 |
-2,5 |
|
-2,6 |
|
-2,55 |
|
-2,41 |
0,005 |
1 |
-1 |
1 |
1 |
|
-1 |
-1 |
2,2 |
|
2,3 |
|
2,25 |
|
2,26 |
0,005 |
1 |
1 |
-1 |
1 |
|
-1 |
-1 |
5,1 |
|
4,7 |
|
4,90 |
|
4,74 |
0,080 |
1 |
-1 |
-1 |
1 |
|
1 |
1 |
-1,1 |
|
0,5 |
|
-0,30 |
|
0,08 |
1,280 |
1 |
1 |
1 |
-1 |
|
1 |
-1 |
2,1 |
|
2,3 |
|
2,20 |
|
2,26 |
0,020 |
1 |
-1 |
1 |
-1 |
|
-1 |
1 |
-2,0 |
|
-2,4 |
|
-2,20 |
|
-2,41 |
0,080 |
1 |
1 |
-1 |
-1 |
|
-1 |
1 |
0,0 |
|
0,8 |
|
0,40 |
|
0,08 |
0,320 |
1 |
-1 |
-1 |
-1 |
|
1 |
-1 |
4,2 |
|
5,1 |
|
4,65 |
|
4,74 |
0,405 |
2. Определение построчных (выборочных) дисперсий:
Аналогично S22=0,005; S32=0,08; S42=1,28; S52=0,02; S62=0,08; S72=0,32; S82=0,405. Сумма построчных (выборочных) дисперсий:
S 2 =0,005+0,005+0,08+1,28+0,02+0,08+0,32+0,405=2,195.
3. Определение однородности дисперсий по критерию Кохрена:
28