Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методическое пособие 347

.pdf
Скачиваний:
3
Добавлен:
30.04.2022
Размер:
958.59 Кб
Скачать

Следовательно, дробную реплику с генерирующим соотношением X4=X1X2 имеет смысл использовать, если нас более всего интересуют коэффициенты β12, β23, β34.

Дробную реплику, в которой Р линейных эффектов приравнены к эффектам взаимодействия, обозначают 2k-P

Таким образом, планы первого порядка, оптимальные двухуровневые планы ПФЭ 2K и ДФЭ 2k-P имеют следующие преимущества:

1 – планы ортогональны, поэтому все вычисления просты; 2 – все коэффициенты определяются независимо один от

другого; 3 – каждый коэффициент определяется по результатам

всех n опытов;

4 – все коэффициенты регрессии определяются с одинаковой дисперсией, т.е. эти планы обладают и свойством ротатабельности.

19

2 Регрессионный анализ

Ниже излагаются основные положения регрессионного анализа, применение которого для обработки результатов наблюдений связано с меньшим числом ограничений, чем при корреляционном анализе. Как и корреляционный анализ, регрессионный анализ включает в себя построение уравнения регрессии, например, методом наименьших квадратов и статистическую оценку результатов. Если в регрессионном анализе расчет коэффициентов ведется теми же методами, например наименьших квадратов, то его теоретические предпосылки требуют других способов статистической оценки результатов.

При проведении регрессионного анализа примем следующие допущения:

1)входной параметр x измеряется с пренебрежимо малой ошибкой. Появление ошибки в определении y объясняется наличием в процессе не выявленных переменных и случайных воздействий, не вошедших в уравнение регрессии;

2)результаты наблюдений y1, y12,..., yi,..., yn над выходной величиной представляют собой независимые нормально распределенные случайные величины;

3)при проведении эксперимента с объемом выборки n при

условии, что каждый опыт повторен m* раз, выборочные дисперсии S12,..., Si2,..., Sn2 должны быть однородны. При выполнении измерений в различных условиях возникает задача сравнения точности измерений. При этом следует подчеркнуть, что экспериментальные данные можно сравнивать только тогда, когда их дисперсии однородны. Это означает принадлежность экспериментальных данных к одной

итой же генеральной совокупности. Напомним: однородность дисперсий свидетельствует о том, что среди сравниваемых дисперсий нет таких, которые с заданной надежностью превышали бы все остальные, т.е. была бы большая ошибка. При одинаковом числе параллельных опытов однородность

20

дисперсии, как мы уже показали, можно оценить по критерию Кохрена, а для сравнения двух дисперсий целесообразно воспользоваться F-критерием Фишера.

После того как уравнение регрессии найдено, необходимо провести статистический анализ результатов. Этот анализ состоит в следующем: проверяется значимость всех коэффициентов и устанавливается адекватность уравнения.

2.1 Проверка адекватности модели

При моделировании приходится формализовать связи исследуемого явления (процесса), из-за чего возможна потеря некоторой информации об объекте. Иногда некоторые связи не учитываются. В то же время основное требование к математической модели заключается в ее пригодности для решения поставленной задачи и адекватности процессу. Регрессионную модель называют адекватной, если предсказанные по ней значения у согласуются с результатами наблюдений. Так, построив модель в виде линейного уравнения регрессии, мы хотим, в частности, убедиться, что никакие другие модели не дадут значительного улучшения в описании предсказания значений у. В основе процедуры проверки адекватности модели лежат предположения, что случайные ошибки наблюдений являются независимыми, нормально распределенными случайными величинами с нулевыми средними значениями и одинаковыми дисперсиями.

Сформулируем нуль-гипотезу Н0: "Уравнение регрессии адекватно".

Альтернативная гипотеза Н1: "Уравнение регрессии неадекватно".

Для проверки этих гипотез принято использовать F- критерий Фишера.

При этом общую дисперсию (дисперсию выходного параметра) S y2 cравнивают с остаточной дисперсией Sуост2.

Напомним, что

21

(2.1)

где l=k+1 – число членов аппроксимирующего полинома, а k – число факторов. Так, например, для линейной зависимости k=1, l=2.

В дальнейшем определяется экспериментальное значение F-критерия

(2.2)

который в данном случае показывает, во сколько раз уравнение регрессии предсказывает результаты опытов лучше,

 

 

1

n

 

чем среднее

y

 

yi C const

 

 

 

n i 1

 

Если F

F ;m1;m2 ,

то уравнение регрессии адекватно. Чем

больше значение

F

превышает F ;m1;m2 для выбранного α и

числа степеней свободы m1=n-1, m2=n-l, тем эффективнее

уравнение регрессии.

Рассмотрим также случай, когда в каждой i-й точке xi для повышения надежности и достоверности осуществляется не одно, а m* параллельных измерений (примем для простоты, что m* одинаково для каждого фактора). Тогда число экспериментальных значений величины у составит nΣ=n m*.

В этом случае оценка адекватности модели производится следующим образом:

22

 

m

 

 

1) определяется yi

j

yij / m

– среднее из серии

 

1

 

параллельных опытов при x=xi, где yij – значение параметра у при x=xi в j-м случае;

2)рассчитываются значения параметра yˆi по уравнению регрессии при x=xi;

3)рассчитывается дисперсия адекватности

где n – число значений xi; l – число членов аппроксимирующего полинома (коэффициентов bi), для линейной зависимости l=2;

4)определяется выборочная дисперсия Y при x=xi:

5)определяется дисперсия воспроизводимости

Число степеней свободы этой дисперсии равно m=n(m*-1);

6)определяется экспериментальное значение критерия Фишера

7)определяется теоретическое значение этого же критерия

F ;m1;m2

где m1=n-l; m2= n (m*-1);

23

8) если F F ;m1;m2 , то уравнение регрессии адекватно, в противном случае – нет.

2.2 Проверка значимости коэффициентов уравнения регрессии

Надежность оценок bi уравнения регрессии можно охарактеризовать их доверительными интервалами Δbi, в которых с заданной вероятностью находится истинное значение этого параметра.

Наиболее просто построить доверительные интервалы для параметров линейного уравнения регрессии, т.е. коэффициентов b0 и b1. При этом предполагается, что для каждого значения случайной величины x=xi имеется распре-

деление

со

средним

значением

yˆi

b0

b1xi

и

дисперсией S 2

S 2

 

. Иными словами,

 

делается

допущение,

 

yi

восп

 

 

 

 

 

 

 

что случайная величина Y распределена нормально при

каждом

значении

x , а дисперсия S

2

во всем

интервале

 

 

 

 

i

 

yi

 

 

 

 

изменения x постоянна: Syi2

const .

 

 

 

 

 

Для линейного уравнения среднеквадратичное отклонение i-го коэффициента уравнения регрессии Sbi можно определить по закону накопления ошибок.

(2.3)

При условии, что Sy21 Sy22 ... Syi2 ... Syn2 Sвосп2

,

получим

(2.4)

24

(2.4а)

Sb0 и Sb1 называются соответственно стандартной ошибкой

свободного члена и стандартной ошибкой коэффициента регрессии.

Проверка значимости коэффициентов выполняется по критерию Стьюдента. При этом проверяется нуль-гипотеза Н0: bi=0, т.е. i-й коэффициент генеральной совокупности при заданном уровне значимости α отличен от нуля.

Построим доверительный интервал для коэффициентов уравнения регрессии

(2.5)

где число степеней свободы в критерии Стьюдента определяется по соотношению n-l. Потеря l=k+1 степеней свободы обусловлена тем, что все коэффициенты bi рассчитываются зависимо друг от друга.

Тогда доверительный интервал для Δbi коэффициента уравнения регрессии составит (bi-Δbi; bi+Δbi). Чем уже доверительный интервал, тем с большей уверенностью можно говорить о значимости этого коэффициента.

Необходимо всегда помнить рабочее правило: "Если абсолютная вели-чина коэффициента регрессии больше, чем его доверительный интервал, то этот коэффициент значим".

Таким образом, если |bi|>|Δbi|, то bi коэффициент значим, в противном случае – нет.

Незначимые коэффициенты исключаются из уравнения регрессии, а оставшиеся коэффициенты пересчитываются заново, так как они зависимы.

25

3 Пример разработки математической модели

В качестве примера рассмотрим разработку математической модели гидравлического режима четырехзонной методической печи с использованием теории планирования эксперимента. При планировании опытов используем методику проведения дробного факторного эксперимента (ДФЭ) первого порядка с двухуровневым варьированием факторов.

Перед разработкой плана эксперимента на основе априорной информации были выявлены факторы, влияющие на величину давления в томильной зоне печи. К числу таких факторов относятся расходы топлива на каждую зону нагрева и угол поворота дымового клапана. Расходы воздуха на каждую зону в качестве факторов не фигурировали, поскольку схема управления горением топлива автоматически меняет расход воздуха при изменении расхода газа.

Обозначим факторы: X1 — расход газа в томильной зоне, м3/ч; X2 — расход газа во второй сварочной зоне, м3/ч; X3 — расход газа в первой сварочной зоне, м3/ч; X4 — расход газа в нижней сварочной зоне, м3/ч; X5 — положение дымового клапана, % хода исполнительного механизма (рис.3.1).

Рисунок 3.1 – Положение факторов (Х1, …, Х5) и отклика (Y) при проведении исследования на методической печи

26

Реализация ПФЭ в этом случае при варьировании всех факторов на двух уровнях потребовала бы постановки 25=32 опытов.

Будем предполагать, что эффекты взаимодействия факторов в исследуемом объекте маловероятны и пренебрежимо малы. Воспользуемся 1/4 репликой ПФЭ, т.е. ДФЭ типа 25-2, где формально 2 фактора заменены соответствующими произведениями остальных факторов (x4=x1 x2, x5=x1 x2 x3 ). Это позволит сократить число опытов до 23=8. Уровни варьирования факторов представлены в табл. 4.

Таблица 4 - Уровни варьирования факторов

 

 

 

Факторы

 

 

Уровни

X1,

X2,

X3,

X4,

X5,

факторов

м3

м3

м3

м3

% хода

 

 

 

 

 

ИМ

Основной

5250

3900

2650

1100

74

(нулевой)

 

 

 

 

 

Нижний

4000

3100

1750

700

50

 

 

 

 

 

 

Верхний

6500

4700

3500

1500

98

Интервал

1250

800

900

400

24

варьирования

В табл. 5 приведены матрица планирования ДФЭ 25-2 и результаты эксперимента — значения выходной переменной (давления в томильной зоне методической печи).

Для обработки результатов эксперимента используем методику, изложенную ранее во втором разделе методических указаний.

1. Расчет построчных средних:

где m* — число повторных опытов (m*=2). Например,

27

Результаты расчета представлены в табл. 5.

 

 

 

 

 

 

 

 

 

5-2

 

 

 

 

Таблица 5 - Матрица ДФЭ

2

 

с двумя

параллельными

опытами

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Переменная состояния (отклик),

 

Факторы (кодированные

 

 

 

кПа

 

Построчная

 

 

значения)

 

 

Опыт

 

Опыт

 

Средне

 

Моде

дисперсия

 

 

 

 

 

 

 

1

 

2

 

е

 

ль

S 2

X

X

X

X

 

X

X

 

 

 

 

y j

 

yˆ j

j

 

Y1

 

Y2

 

 

 

0

1

2

3

 

4

5

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

1

1

 

1

1

-2,5

 

-2,6

 

-2,55

 

-2,41

0,005

1

-1

1

1

 

-1

-1

2,2

 

2,3

 

2,25

 

2,26

0,005

1

1

-1

1

 

-1

-1

5,1

 

4,7

 

4,90

 

4,74

0,080

1

-1

-1

1

 

1

1

-1,1

 

0,5

 

-0,30

 

0,08

1,280

1

1

1

-1

 

1

-1

2,1

 

2,3

 

2,20

 

2,26

0,020

1

-1

1

-1

 

-1

1

-2,0

 

-2,4

 

-2,20

 

-2,41

0,080

1

1

-1

-1

 

-1

1

0,0

 

0,8

 

0,40

 

0,08

0,320

1

-1

-1

-1

 

1

-1

4,2

 

5,1

 

4,65

 

4,74

0,405

2. Определение построчных (выборочных) дисперсий:

Аналогично S22=0,005; S32=0,08; S42=1,28; S52=0,02; S62=0,08; S72=0,32; S82=0,405. Сумма построчных (выборочных) дисперсий:

S 2 =0,005+0,005+0,08+1,28+0,02+0,08+0,32+0,405=2,195.

3. Определение однородности дисперсий по критерию Кохрена:

28