Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Планирование эксперимента при оптимизации процессов химической техн

..pdf
Скачиваний:
15
Добавлен:
15.11.2022
Размер:
9.83 Mб
Скачать

Метод скорее эвристический, чем обоснованно-стати­ стический, и поэтому пригоден для грубых оценок конку­ рирующих моделей.

2.4.2.Байесов подход к выбору моделей. Выбор моде­

ли строится на основе известной т е о р е м ы Б а й е с а , связывающей априорную и апостериорную вероятности. Априорная вероятность выражается исследователем, как мера его уверенности в распределении параметра 0 соответствующей модели.

Предположим, что модель характеризуется уравне­ нием

y i = f(Xi,*t) + е и

(2.47)

гд^ у{ — значение /-го измерения (Z =

1, 2, ..., Л/); 0* —

вектор-столбец параметров модели; Xt — вектор-столбец факторов; о* — погрешность /-го измерения.

Предположим также, что априорное распределение вектора параметров модели является многомерным нор­ мальным распределением со средним 6 0 и матрицей ко­ вариаций D. Это распределение характеризует степень предварительных знаний о векторе параметров 0.

Если уравнение (2.47) нелинейное, то его можно ли­

неаризовать так:

 

 

U = Х(0—е0) + е,

(2.48)

где U — вектор-столбец с элементами

 

[ * / * - / ( 0 о ; Х г ) ] ;

(2.49)

X матрица с элементами

 

 

ЩЬХ,)

I

(2.50)

^0

Je=60

 

е —' вектор погрешности.

Допустим, что вектор погрешности имеет многомер­ ное нормальное распределение с нулевым математиче­ ским ожиданием и матрицей ковариаций Jo2 {I — еди­ ничная матрица). Тогда U имеет нулевое математиче­ ское ожидание и матрицу ковариаций X D X T-+-Уа2 (сло­ жение ошибок возможно вследствие линейности U). Исхода из этих данных, легко рассчитать условную ве-

роятность для /'-ой модели Р(и/г) — она отражает влия­ ние опытных данных

Р( “1г) ——

1

- —

 

е21

V2jiimVT— /а 21

DA'T + J(S2\ j

(2.51)

где элемент U TU имеет вид

[ 2 { ^ - / ( 0 о , X ) ] 2] .

(2.52)

i = 1

 

Если учесть априорные вероятности г-ых моделей Р(г), то апостериорные вероятности можно рассчитать в соответствии с формулой Байеса

Р(г)Р(и1г)

(2.53)

2гР(г)Р(и/г)

Выбирается та модель, апостериорная вероятность которой увеличилась по сравнению с априорной.

2.4.3. Постановка эксперимента по выбору математи­ ческих моделей. Вопрос выбора моделей успешно реша­ ется в той области эксперимента, где различие между ними максимально. Поэтому разработка критериев для выбора наиболее благоприятных условий эксперимента является важнейшей задачей качественного анализа моделей. Известны три критерия постановки оптималь­ ного эксперимента — Рота, Бокса и Хилла, энтропийный. Суть подхода объясним' на примере использования кри­ терия Рота.

Критерий Рота определяет взвешенное среднее пол­ ного отличия между моделями. В качестве весов исполь­ зуются байесовские апостериорные вероятности (их рас­ чет приведен в предыдущем разделе). Расчет ведут по ( N — 1)-экспериментам. Условие эксперимента для N-ro

опыта определяется выражением

 

*

ш

Л

Л

(2.54)

Z(X,) = S [/>(£,

iV— 1) П IЫ *в) - Ы * э)1],

i= 1

j=l

 

 

где Хэ— вектор условий эксперимента; P(i, N — 1) — апостериорные байесовские вероятности выбора 7-ой мо-

Дели после (/V— 1)-го эксперимента; t j j ( X э) — прогно­ зируемое значение выходной переменной для условий Хэ и при использовании модели / с оценками параметров 0J, полученных по ( N — 1)-экспериментам (любым под­

ходящим методом).

Условия Хэ, где значение Z(X0) будет максимальным. Дают максимальное различие между моделями и потому следующий JV - ы й эксперимент должен ставиться в этой точке.

Доказано, что перечисленные выше критерии (Рота, Бокса и Хилла,энтропийные) дают идентичные резуль­ таты.

2.5. Алгоритмы идентификации математических моделей

Введение. Задача идентификации математического описания становится в последнее время одной из цен­ тральных задач исследования химико-технологических процессов. Это вызвано необходимостью «привязки» об­ щей математической модели, которая в большинстве случаев существует, к реальному объекту. «Привязка» осуществляется расчетом параметров математической модели по результатам эксперимента на реальном объ­ екте.

Если химико-технологический объект характеризует­ ся /2 -мерным вектором состояния Y(t), /л-мерным векто­ ром управления U(t), то математическое описание про­ цесса можно представить в канонической или нормаль­ ной форме:

Y - — = f(Y (/h

U(l), А (/), е(0, 0.

(2-55)

dt

 

 

где А (<) — /-мерный вектор

неизвестных параметров си­

стемы, состоящей из коэффициентов системы дифферен­ циальных уравнений; в( / ) — помехи объекта и измери­ тельных приборов; t — время.

Решение задачи идентификации предполагает по данным наблюдения векторов У (/), U(i) и, возможно, при наличии некоторых характеристик помехи е(!/), опре­ деление неизвестных параметров и оценку внутренних, не доступных для измерения выходных переменных объекта (например, концентраций промежуточных про­ дуктов) .

Задача идентификации принадлежит к так называе­ мым некорректно поставленным задачам, и ее решение возможно только приближенно.

Классификация методов идентификации. По мнению В. В. Кафарова и И. Н. Дорохова [12], методы иденти­ фикации удобно разделить на две большие группы по типу математического описания той системы, к которой они применяются. К первой группе относятся все методы идентификации, применяемые только к линейным си­ стемам, ко второй — методы, применяемые как к линей­ ным, так и к существенно нелинейным системам.

Впервую группу можно включить: нахождение ве­ совых функций непосредственным решением интеграль­ ного уравнения свертки; определение параметров диф­ ференциальных уравнений и передаточных функций по экспериментальным функциям отклика на входные воз­ мущения стандартного типа (импульсное, ступенчатое, синусоидальное и др.). Ко второй группе относят: метод адаптирующейся модели; методы статистической теории нелинейных систем; методы теории оптимальной филь­ трации Калмана; методы байесовской идентификации; методы стохастической аппроксимации.

Для объектов химической технологии характерны большие степени нелинейности, распределенность пара­ метров, нестационарность переменных (дрейф основных показателей процесса). В этих условиях для идентифи­ кации объектов исследователи чаще всего применяют методы второй группы. Особенно эффективны методы статистической идентификации объектов на основе тео­ рии случайных процессов и решения задачи поиска импульсной функции по уравнению Винера—Хопфа. Собственно в теории управления применение этих мето­ дов и составляет суть методов идентификации.

Всвязи с этим представляется целесообразным рас­ смотреть основные алгоритмы статистической идентифи­ кации: оценки характеристик случайных процессов,

сглаживания случайных процессов, решения ийтегральиого уравнения Винера—Хопфа, расчета моментов.

2.5.1. Алгоритм оценки стационарности и эргодично­ сти. Введение. Эта оценка осуществляется с целью про­ верки исходных предпосылок теории случайных функ­ ций. Если случайные функции удовлетворяют требова­ ниям стационарности и эргодичности, то в последующих расчетах можно пользоваться более простым математи­

ческим аппаратом (см. приложение 2). Известно, что реальные химико-технологические объекты не могут полностью удовлетворять требованиям стационарности и эргодичности, поэтому задачу оценки необходимо фор­ мулировать так: в какой мере свойства объекта отвеча­ ют требованиям стационарности и эргодичности?

Исходные данные. В результате наблюдения за объ­

ектом

получены реализации входных U (t)

и выходных

Y(t)

переменных во времени (случайные

функции).

Предполагается, что наблюдение возможно (объект оснащен приборам^) и получена достаточно длительная реализация.

Определение. Случайные функции обладают свойст­ вом стационарности, если все их статистические харак­

теристики

(оценки математического

ожидания М[ц(^)]

и

оценки дисперсий D[u(t)]

и D[y(t)]) посто­

янны во

времени. Если случайная функция обладает

свойством

эргодичности, то статистические характери­

стики можно рассчитывать по одной достаточно длин­ ной реализации (а не по множеству реализаций).

Допущение J. Если исследуемые случайные процессы стационарны, то статистические характеристики, вычис­

ляемые

на коротких

интервалах

(частях реализации),

не будут существенно

меняться

от

интервала к

интер­

валу.

 

большинства

технических

прило­

Допущение 2. Для

жений

достаточно проверить слабую стационарность и

эргодичность, т. е. тот факт, что средние значения слу­ чайных функций и квадратов случайных функций не за­ висят от времени.

Расчеты. 1. Реализация, например у (/), длиной Т (причем Т = N&t, где N — число участков разбиения реализации; Дt — интервал разбиения) делится на п частей так, чтобы каждую из них можно было считать независимой (рис. 2.3).

2.Вычисляются средние значения по i-ым частям^

реализации

M[yi(N)\ и

средние значения

квадрата

M [ y \ ( N ) ]

(* = 1,2,...,л):

 

 

 

M[yi (АО]

= 4 - 2 (/.■«;

(2.56)

 

 

N u=i

 

 

М\у\ (N)]

N u=i

(2.57)

 

 

 

Рис. 2.3. Реализация случайной функции.

3. Вычисляются средние значения для всей реализа­ ции:

M[y(N)}

(2.58)

 

N u=i

M[y*{N)]

(2.59)

4. Для проверки гипотезы о стационарности средние значения сравниваются попарно (для двух любых час­ тей реализации):

IM[iji (N) ] — М [ijj (N)] I

<

е;

(2.60)

1М[//2.(Л0] — M[y2 (N)] \

<

s',

(2.61)

где iy j = 1,2, ..., п\ i Ф /; е — заданное число или один из непараметрических критериев (критерий серий или тренда).

5. Для проверки гипотезы об эргодичности сравнива­ ются средние значения для всей реализации,и средние значения по всем частям реализации:

\ M[y(N)] - M[y(N)]\ <

е ';

(2.62)

IM[y>{N)} - ЛД//2(Л0]1 <

е'2, ^

(2.63)

где средние значения по всем участкам рассчитываются по формулам

МЫЛО] = — 2 МЫ(^)];

(2.64)

П г = 1

 

sa

M [ t / ( N ) } = — S M [ if . ( N ) ] -

(2.65)

/7 V_ «

1

 

Принятие решений. Если условия (2.60) — (2.63)

вы­

полняются, то случайные функции

(реализации перемен­

ных по времени) признаются стационарными и эргодичНыми. Тогда все дальнейшие расчеты ведутся с исполь­ зованием математического аппарата, рассмотренного Ниже. В противном случае проводится фильтрация ис­ ходных реализаций.

2.5.2. Алгоритм текущего центрирования случайной Функции. Введение. Текущее центрирование применяет­ ся в том случае, когда исследователь выясняет, что в ис­ следуемом случайном процессе имеются разночастотные Колебания. Это могут быть, например, низкочастотные (полезный сигнал) и высокочастотные колебания (шум). Последние устраняют с помощью фильтров. Рассмотрим Один из фильтров — текущее среднее.

Исходные данные. Имеются реализации случайных Процессов. Выяснено, что они слабо-нестационарные (не выполняется условие (2.60)). Предлагается «отфиль­ тровать» высокочастотные колебания, распределенные По всей длине реализации.

Расчет ординат по алгоритму текущее среднее про­ изводится так:

( 2.66)

где &(t) — центрированная и сглаженная случайная функция; u(t) — исходная реализация; т — интервал текущего усреднения (т = const). Обычно используют дискретный алгоритм (2.66)

 

 

й5(М) =и>(М)-Ч(М),

(2.67)

где U j ( N )

— ординаты центрированного случайного про­

цесса; / =

1, 2, ..., N — номер ординаты случайного про­

цесса;

j =

— /); ( 2/ +1) — интервал усред­

нения.

Текущее среднее в интервале

[( / — /)-=-(/+/)]:

( 2. 68)

Число ординат центрированного процесса

N = N — 21,

(2.69)

причем, очевидно, N должно быть значительно

боль­

ше 21.

слу­

Примечание. Если гипотеза о стационарности

чайных процессов. (2.60) -принимается, то центрирование проводится обычным вычитанием из ординат случайной функции по всей реализации:

ф )

= u(N) M[u(N)],

или

 

.

(2.70)

y(N)

= y ( N ) - M [ y ( N ) ] ,

где .М[«/(Л0] или М[м(Л()] рассчитывают по формуле

в(2.58).

2.5. 3. Алгоритм расчета корреляционных функций. Введение. Корреляционные функции оценивают связь между ординатами, одной случайной функции (автокор­ реляционная функция Ruu(t)) или ординатами различ­ ных случайных функций (взаимокорреляционная функ­

ция RUy(т)). Физически величина корреляционной функ­ ции для некоторого момента 4i показывает, насколько значение случайного процесса в момент времени ti свя^ зано со значением, отстоящим от последнего на время т = ( f , - * 2):

+оо

Яии(т) = П т —— \u(t)u(t + %)dty

271 J

 

—оо

 

+оо

Rvu(v) = Пт

f u(t)y(t + i)dt.

2T

*>

 

oo

(2.71)

(2.72)

Исходные данные. Имеются конечные реализации случайных процессов u(t) и y{t) объекта исследования. Реализации стационарны, эргодичны и уже подвергнуты

центрированию — u(t) и y(t). Требуется рассчитать кор­

реляционные функции для дискретных й(И) и y(N). Расчет корреляционных функций производится по

формулам автокорреляционной и взаимокорреляцион­

ной функции соответственно:

 

 

 

/?uu(M')

1

*-ц

 

 

(2.73)

 

 

 

 

У1 UjU-j+m

 

 

 

 

 

 

 

N—ц “

^

 

 

 

 

 

R w M

=

1

У

uili+n,

 

(2.74)

 

 

 

.,

 

 

 

 

 

 

 

N -H

£

 

 

 

где

ц — дискретный

аргумент

корреляционной функции

(р =

О,

1, 2,

р)\

 

j — номер

ординаты

случайной

функции (/ =

1, 2,

N).

 

по

формулам

производят

Примечание. Вычисления

до значения аргумента

рт ах =

(0,054-0,10)

(как для от­

рицательных,

так и для

положительных

значений р).

2.5.4.

Алгоритм

расчета

функции веса

по корреляци­

онным функциям. Введение. Определение функции веса (или импульсной функции) основано на ее связи с взаимокорреляционной функцией входной и выходной пере­ менных и автокорреляционной функцией входной пере­ менной (уравнение Винера—Хопфа):

Ryu (т) =

/ Ruu(t-T)k(t)dt.

(2.75)

 

—оо

 

Основная задача

идентификации

k (t) — решение

уравнения (2.75).

 

 

Исходные данные. По реализациям входных и выход­ ных переменных получены автокорреляционная и взаимокорреляционная функции. Необходимо решить урав­ нение (2.75) и определить функцию веса k (7).

Уравнение Винера—Хопфа можно решить несколь­ кими методами. Рассмотрим метод сведения уравнения

(2.75) к системе линейных

алгебраических

уравнений.

Для этого представим его в виде

 

 

—~г R}J U(т) = E H N M R u u i x — NiT),

 

(2.76)

iVj=о

 

 

где N1 — число участков

разбиения реализаций; Т

интервал времени участка

реализаций; t — время

(при­

мем равным N\T).'

(N — номер участка)

и учи­

Обозначив kN = k(NT)

тывая, что k0 = 0, можно для каждого т =

О, Т,

2Т,

NT записать систему N линейных уравнений с N неиз­ вестными:

= £,/?„„(0) + k2Ruu(T) + + kxRuu[(N— l)T];

k\Ruu{T) + ^2^ии(0) +

+ /tNRuu[(N-2)T]-,

(2.77)

- J r R u y (NT) = kxRuu[ ( N - 1)T] + k2Ruu[ (N - 2)T] +

+I I N R U U (Q) .

Вматричной форме это уравнение можно записать

так:

R u y = RuuK>

(2-78)

Т

где Ruu — квадратичная матрица с диагональю в виде корреляционной функции от нуля:

 

Ruu Ш ии (Т)

Ruu l (N — l)T]

“I

„ _

RUU(T)RUU(0)

RUU[(N — 2)7"]

(2.79)

Иии

 

 

 

_ Ruu[(Nl)7’]/?uu[(yv — 2)7’]

Ruu(0) _

К — вектор-столбец функции веса для принятой дискрет­ ности NT (N = 1,2, ..., Ni):

 

К =

ki

(2.80)

 

k?

 

 

 

 

 

liN -

 

R U1J— вектор-столбец:

 

 

 

 

1

Ruy(P)

 

R 'J-y

Ruy(2T)

(2.81)

 

T

L Ruy(NT) J

Уравнение (2.78) можно решать различными мето­ дами, которые, как известно, определяются методами обращения матриц (метод Гаусса, метод окаймления, метод главного элемента и др.):

К = Нйи Ruy.

(2.82)