Планирование эксперимента при оптимизации процессов химической техн
..pdfМетод скорее эвристический, чем обоснованно-стати стический, и поэтому пригоден для грубых оценок конку рирующих моделей.
2.4.2.Байесов подход к выбору моделей. Выбор моде
ли строится на основе известной т е о р е м ы Б а й е с а , связывающей априорную и апостериорную вероятности. Априорная вероятность выражается исследователем, как мера его уверенности в распределении параметра 0 соответствующей модели.
Предположим, что модель характеризуется уравне нием
y i = f(Xi,*t) + е и |
(2.47) |
гд^ у{ — значение /-го измерения (Z = |
1, 2, ..., Л/); 0* — |
вектор-столбец параметров модели; Xt — вектор-столбец факторов; о* — погрешность /-го измерения.
Предположим также, что априорное распределение вектора параметров модели является многомерным нор мальным распределением со средним 6 0 и матрицей ко вариаций D. Это распределение характеризует степень предварительных знаний о векторе параметров 0.
Если уравнение (2.47) нелинейное, то его можно ли
неаризовать так: |
|
|
|
U = Х(0—е0) + е, |
(2.48) |
||
где U — вектор-столбец с элементами |
|
||
[ * / * - / ( 0 о ; Х г ) ] ; |
(2.49) |
||
X матрица с элементами |
|
|
|
ЩЬХ,) |
I |
(2.50) |
|
^0 |
Je=60 |
||
|
е —' вектор погрешности.
Допустим, что вектор погрешности имеет многомер ное нормальное распределение с нулевым математиче ским ожиданием и матрицей ковариаций Jo2 {I — еди ничная матрица). Тогда U имеет нулевое математиче ское ожидание и матрицу ковариаций X D X T-+-Уа2 (сло жение ошибок возможно вследствие линейности U). Исхода из этих данных, легко рассчитать условную ве-
роятность для /'-ой модели Р(и/г) — она отражает влия ние опытных данных
Р( “1г) —— |
1 |
- — |
|
е21 |
V2jiimVT— /а 21
DA'T + J(S2\ j |
(2.51) |
где элемент U TU имеет вид
[ 2 { ^ - / ( 0 о , X ) ] 2] . |
(2.52) |
i = 1 |
|
Если учесть априорные вероятности г-ых моделей Р(г), то апостериорные вероятности можно рассчитать в соответствии с формулой Байеса
Р(г)Р(и1г)
(2.53)
2гР(г)Р(и/г)
Выбирается та модель, апостериорная вероятность которой увеличилась по сравнению с априорной.
2.4.3. Постановка эксперимента по выбору математи ческих моделей. Вопрос выбора моделей успешно реша ется в той области эксперимента, где различие между ними максимально. Поэтому разработка критериев для выбора наиболее благоприятных условий эксперимента является важнейшей задачей качественного анализа моделей. Известны три критерия постановки оптималь ного эксперимента — Рота, Бокса и Хилла, энтропийный. Суть подхода объясним' на примере использования кри терия Рота.
Критерий Рота определяет взвешенное среднее пол ного отличия между моделями. В качестве весов исполь зуются байесовские апостериорные вероятности (их рас чет приведен в предыдущем разделе). Расчет ведут по ( N — 1)-экспериментам. Условие эксперимента для N-ro
опыта определяется выражением |
|
* |
|
ш |
Л |
Л |
(2.54) |
Z(X,) = S [/>(£, |
iV— 1) П IЫ *в) - Ы * э)1], |
||
i= 1 |
j=l |
|
|
где Хэ— вектор условий эксперимента; P(i, N — 1) — апостериорные байесовские вероятности выбора 7-ой мо-
Дели после (/V— 1)-го эксперимента; t j j ( X э) — прогно зируемое значение выходной переменной для условий Хэ и при использовании модели / с оценками параметров 0J, полученных по ( N — 1)-экспериментам (любым под
ходящим методом).
Условия Хэ, где значение Z(X0) будет максимальным. Дают максимальное различие между моделями и потому следующий JV - ы й эксперимент должен ставиться в этой точке.
Доказано, что перечисленные выше критерии (Рота, Бокса и Хилла,энтропийные) дают идентичные резуль таты.
2.5. Алгоритмы идентификации математических моделей
Введение. Задача идентификации математического описания становится в последнее время одной из цен тральных задач исследования химико-технологических процессов. Это вызвано необходимостью «привязки» об щей математической модели, которая в большинстве случаев существует, к реальному объекту. «Привязка» осуществляется расчетом параметров математической модели по результатам эксперимента на реальном объ екте.
Если химико-технологический объект характеризует ся /2 -мерным вектором состояния Y(t), /л-мерным векто ром управления U(t), то математическое описание про цесса можно представить в канонической или нормаль ной форме:
Y - — = f(Y (/h |
U(l), А (/), е(0, 0. |
(2-55) |
dt |
|
|
где А (<) — /-мерный вектор |
неизвестных параметров си |
стемы, состоящей из коэффициентов системы дифферен циальных уравнений; в( / ) — помехи объекта и измери тельных приборов; t — время.
Решение задачи идентификации предполагает по данным наблюдения векторов У (/), U(i) и, возможно, при наличии некоторых характеристик помехи е(!/), опре деление неизвестных параметров и оценку внутренних, не доступных для измерения выходных переменных объекта (например, концентраций промежуточных про дуктов) .
Задача идентификации принадлежит к так называе мым некорректно поставленным задачам, и ее решение возможно только приближенно.
Классификация методов идентификации. По мнению В. В. Кафарова и И. Н. Дорохова [12], методы иденти фикации удобно разделить на две большие группы по типу математического описания той системы, к которой они применяются. К первой группе относятся все методы идентификации, применяемые только к линейным си стемам, ко второй — методы, применяемые как к линей ным, так и к существенно нелинейным системам.
Впервую группу можно включить: нахождение ве совых функций непосредственным решением интеграль ного уравнения свертки; определение параметров диф ференциальных уравнений и передаточных функций по экспериментальным функциям отклика на входные воз мущения стандартного типа (импульсное, ступенчатое, синусоидальное и др.). Ко второй группе относят: метод адаптирующейся модели; методы статистической теории нелинейных систем; методы теории оптимальной филь трации Калмана; методы байесовской идентификации; методы стохастической аппроксимации.
Для объектов химической технологии характерны большие степени нелинейности, распределенность пара метров, нестационарность переменных (дрейф основных показателей процесса). В этих условиях для идентифи кации объектов исследователи чаще всего применяют методы второй группы. Особенно эффективны методы статистической идентификации объектов на основе тео рии случайных процессов и решения задачи поиска импульсной функции по уравнению Винера—Хопфа. Собственно в теории управления применение этих мето дов и составляет суть методов идентификации.
Всвязи с этим представляется целесообразным рас смотреть основные алгоритмы статистической идентифи кации: оценки характеристик случайных процессов,
сглаживания случайных процессов, решения ийтегральиого уравнения Винера—Хопфа, расчета моментов.
2.5.1. Алгоритм оценки стационарности и эргодично сти. Введение. Эта оценка осуществляется с целью про верки исходных предпосылок теории случайных функ ций. Если случайные функции удовлетворяют требова ниям стационарности и эргодичности, то в последующих расчетах можно пользоваться более простым математи
ческим аппаратом (см. приложение 2). Известно, что реальные химико-технологические объекты не могут полностью удовлетворять требованиям стационарности и эргодичности, поэтому задачу оценки необходимо фор мулировать так: в какой мере свойства объекта отвеча ют требованиям стационарности и эргодичности?
Исходные данные. В результате наблюдения за объ
ектом |
получены реализации входных U (t) |
и выходных |
Y(t) |
переменных во времени (случайные |
функции). |
Предполагается, что наблюдение возможно (объект оснащен приборам^) и получена достаточно длительная реализация.
Определение. Случайные функции обладают свойст вом стационарности, если все их статистические харак
теристики |
(оценки математического |
ожидания М[ц(^)] |
и |
оценки дисперсий D[u(t)] |
и D[y(t)]) посто |
янны во |
времени. Если случайная функция обладает |
|
свойством |
эргодичности, то статистические характери |
стики можно рассчитывать по одной достаточно длин ной реализации (а не по множеству реализаций).
Допущение J. Если исследуемые случайные процессы стационарны, то статистические характеристики, вычис
ляемые |
на коротких |
интервалах |
(частях реализации), |
||
не будут существенно |
меняться |
от |
интервала к |
интер |
|
валу. |
|
большинства |
технических |
прило |
|
Допущение 2. Для |
|||||
жений |
достаточно проверить слабую стационарность и |
эргодичность, т. е. тот факт, что средние значения слу чайных функций и квадратов случайных функций не за висят от времени.
Расчеты. 1. Реализация, например у (/), длиной Т (причем Т = N&t, где N — число участков разбиения реализации; Дt — интервал разбиения) делится на п частей так, чтобы каждую из них можно было считать независимой (рис. 2.3).
2.Вычисляются средние значения по i-ым частям^
реализации |
M[yi(N)\ и |
средние значения |
квадрата |
M [ y \ ( N ) ] |
(* = 1,2,...,л): |
|
|
|
M[yi (АО] |
= 4 - 2 (/.■«; |
(2.56) |
|
|
N u=i |
|
|
М\у\ (N)] |
N u=i |
(2.57) |
|
|
|
Рис. 2.3. Реализация случайной функции.
3. Вычисляются средние значения для всей реализа ции:
M[y(N)} |
(2.58) |
|
N u=i |
M[y*{N)] |
(2.59) |
4. Для проверки гипотезы о стационарности средние значения сравниваются попарно (для двух любых час тей реализации):
IM[iji (N) ] — М [ijj (N)] I |
< |
е; |
(2.60) |
1М[//2.(Л0] — M[y2 (N)] \ |
< |
s', |
(2.61) |
где iy j = 1,2, ..., п\ i Ф /; е — заданное число или один из непараметрических критериев (критерий серий или тренда).
5. Для проверки гипотезы об эргодичности сравнива ются средние значения для всей реализации,и средние значения по всем частям реализации:
\ M[y(N)] - M[y(N)]\ < |
е '; |
(2.62) |
IM[y>{N)} - ЛД//2(Л0]1 < |
е'2, ^ |
(2.63) |
где средние значения по всем участкам рассчитываются по формулам
МЫЛО] = — 2 МЫ(^)]; |
(2.64) |
П г = 1 |
|
sa
M [ t / ( N ) } = — S M [ if . ( N ) ] - |
(2.65) |
|
/7 V_ « |
1 |
|
Принятие решений. Если условия (2.60) — (2.63) |
вы |
|
полняются, то случайные функции |
(реализации перемен |
ных по времени) признаются стационарными и эргодичНыми. Тогда все дальнейшие расчеты ведутся с исполь зованием математического аппарата, рассмотренного Ниже. В противном случае проводится фильтрация ис ходных реализаций.
2.5.2. Алгоритм текущего центрирования случайной Функции. Введение. Текущее центрирование применяет ся в том случае, когда исследователь выясняет, что в ис следуемом случайном процессе имеются разночастотные Колебания. Это могут быть, например, низкочастотные (полезный сигнал) и высокочастотные колебания (шум). Последние устраняют с помощью фильтров. Рассмотрим Один из фильтров — текущее среднее.
Исходные данные. Имеются реализации случайных Процессов. Выяснено, что они слабо-нестационарные (не выполняется условие (2.60)). Предлагается «отфиль тровать» высокочастотные колебания, распределенные По всей длине реализации.
Расчет ординат по алгоритму текущее среднее про изводится так:
( 2.66)
где &(t) — центрированная и сглаженная случайная функция; u(t) — исходная реализация; т — интервал текущего усреднения (т = const). Обычно используют дискретный алгоритм (2.66)
|
|
й5(М) =и>(М)-Ч(М), |
(2.67) |
где U j ( N ) |
— ординаты центрированного случайного про |
||
цесса; / = |
1, 2, ..., N — номер ординаты случайного про |
||
цесса; |
j = |
— /); ( 2/ +1) — интервал усред |
|
нения. |
Текущее среднее в интервале |
[( / — /)-=-(/+/)]: |
( 2. 68)
Число ординат центрированного процесса
N = N — 21, |
(2.69) |
причем, очевидно, N должно быть значительно |
боль |
ше 21. |
слу |
Примечание. Если гипотеза о стационарности |
чайных процессов. (2.60) -принимается, то центрирование проводится обычным вычитанием из ординат случайной функции по всей реализации:
ф ) |
= u(N) — M[u(N)], |
или |
|
. |
(2.70) |
y(N) |
= y ( N ) - M [ y ( N ) ] , |
где .М[«/(Л0] или М[м(Л()] рассчитывают по формуле
в(2.58).
2.5. 3. Алгоритм расчета корреляционных функций. Введение. Корреляционные функции оценивают связь между ординатами, одной случайной функции (автокор реляционная функция Ruu(t)) или ординатами различ ных случайных функций (взаимокорреляционная функ
ция RUy(т)). Физически величина корреляционной функ ции для некоторого момента 4i показывает, насколько значение случайного процесса в момент времени ti свя^ зано со значением, отстоящим от последнего на время т = ( f , - * 2):
+оо
Яии(т) = П т —— \u(t)u(t + %)dty |
|
271 J |
|
|
—оо |
|
+оо |
Rvu(v) = Пт — |
f u(t)y(t + i)dt. |
2T |
*> |
|
—oo |
(2.71)
(2.72)
Исходные данные. Имеются конечные реализации случайных процессов u(t) и y{t) объекта исследования. Реализации стационарны, эргодичны и уже подвергнуты
центрированию — u(t) и y(t). Требуется рассчитать кор
реляционные функции для дискретных й(И) и y(N). Расчет корреляционных функций производится по
формулам автокорреляционной и взаимокорреляцион
ной функции соответственно:
|
|
|
/?uu(M') |
— |
1 |
*-ц |
|
|
(2.73) |
|
|
|
|
|
У1 UjU-j+m |
|
|||||
|
|
|
|
|
|
N—ц “ |
^ |
|
|
|
|
|
|
R w M |
= |
1 |
У |
uili+n, |
|
(2.74) |
|
|
|
|
., |
|
||||||
|
|
|
|
|
|
N -H |
£ |
|
|
|
где |
ц — дискретный |
аргумент |
корреляционной функции |
|||||||
(р = |
О, |
1, 2, |
р)\ |
|
j — номер |
ординаты |
случайной |
|||
функции (/ = |
1, 2, |
N). |
|
по |
формулам |
производят |
||||
Примечание. Вычисления |
||||||||||
до значения аргумента |
рт ах = |
(0,054-0,10) |
(как для от |
|||||||
рицательных, |
так и для |
положительных |
значений р). |
|||||||
2.5.4. |
Алгоритм |
расчета |
функции веса |
по корреляци |
онным функциям. Введение. Определение функции веса (или импульсной функции) основано на ее связи с взаимокорреляционной функцией входной и выходной пере менных и автокорреляционной функцией входной пере менной (уравнение Винера—Хопфа):
Ryu (т) = |
/ Ruu(t-T)k(t)dt. |
(2.75) |
|
—оо |
|
Основная задача |
идентификации |
k (t) — решение |
уравнения (2.75). |
|
|
Исходные данные. По реализациям входных и выход ных переменных получены автокорреляционная и взаимокорреляционная функции. Необходимо решить урав нение (2.75) и определить функцию веса k (7).
Уравнение Винера—Хопфа можно решить несколь кими методами. Рассмотрим метод сведения уравнения
(2.75) к системе линейных |
алгебраических |
уравнений. |
|
Для этого представим его в виде |
|
|
|
—~г R}J U(т) = E H N M R u u i x — NiT), |
|
(2.76) |
|
iVj=о |
|
|
|
где N1 — число участков |
разбиения реализаций; Т — |
||
интервал времени участка |
реализаций; t — время |
(при |
|
мем равным N\T).' |
(N — номер участка) |
и учи |
|
Обозначив kN = k(NT) |
|||
тывая, что k0 = 0, можно для каждого т = |
О, Т, |
2Т, |
NT записать систему N линейных уравнений с N неиз вестными:
= £,/?„„(0) + k2Ruu(T) + + kxRuu[(N— l)T];
— k\Ruu{T) + ^2^ии(0) + |
+ /tNRuu[(N-2)T]-, |
(2.77)
- J r R u y (NT) = kxRuu[ ( N - 1)T] + k2Ruu[ (N - 2)T] +
+I I N R U U (Q) .
Вматричной форме это уравнение можно записать
так:
— R u y = RuuK> |
(2-78) |
Т
где Ruu — квадратичная матрица с диагональю в виде корреляционной функции от нуля:
|
Ruu Ш ии (Т) |
Ruu l (N — l)T] |
“I |
„ _ |
RUU(T)RUU(0) |
RUU[(N — 2)7"] |
(2.79) |
Иии — |
|
|
|
|
_ Ruu[(N— l)7’]/?uu[(yv — 2)7’] |
Ruu(0) _ |
К — вектор-столбец функции веса для принятой дискрет ности NT (N = 1,2, ..., Ni):
|
К = |
ki |
(2.80) |
|
|
k? |
|||
|
|
|
||
|
|
liN - |
|
|
R U1J— вектор-столбец: |
|
|
|
|
|
1 |
Ruy(P) |
|
|
R 'J-y |
Ruy(2T) |
(2.81) |
||
|
T
L Ruy(NT) J
Уравнение (2.78) можно решать различными мето дами, которые, как известно, определяются методами обращения матриц (метод Гаусса, метод окаймления, метод главного элемента и др.):
К = Нйи Ruy. |
(2.82) |