![](/user_photo/_userpic.png)
книги из ГПНТБ / Снапелев, Ю. М. Моделирование и управление в сложных системах
.pdfВ |
противном |
случае, т. е. когда k = |
0, |
/?[х(Х|/)) = |
У[0)|А; |
X ^ G lX ^ j. |
Для рассматриваемого |
X*/f |
найдем |
— |
=(Х(0)) и Y ^ — Ru (P^(X\i))). Здесь также приходится
иметь |
в виду два случая. |
Пусть v = 0, тогда |
мы полу |
чаем |
выходной контакт У|0) |
элемента С0, представляю |
|
щего внешнюю среду, поэтому |
|
||
|
R(Xl») = Rli(Pv(Xfy). |
|
|
Если же v=^0, то искомый контакт |
0 [7)ft)]v |
||
является выходным контактом элемента Ck |
Для по |
||
лученного y (.v) найдем У|й) = |
Q~’ (E[v)). |
|
|
Таким образом, |
|
|
Л =О Г' ( 'Щ Щ У ’»)-
Соотношения
^Cj> Cfc
R = (Ru(p^ i }m Q g V c * g s ,
решают поставленную задачу.
Рассмотренная формализация сопряжения элементов является удобным приемом описания сложных систем, ис пользуемым при решении задач композиции сложных си стем, анализе их структуры, а также для ввода ,в ЭВМ информации о взаимодействии элементов в сложных си стемах.
В заключение отметим, что теория агрегативных си стем делает лишь первые шаги, но те результаты, кото рые уже получены, эффективно используются на практике.
§ 1.6. Статистические методы обработки наблюдений
Важнейшая задача, предшествующая моделированию системы, — изучение поведения рассматриваемого реаль ного объекта и его описание. Универсальный способ ре шения такой задачи заключается в наблюдении за состо янием выходов системы в различные моменты времени в зависимости от состояния входов. Например, бывает необходимо найти зависимость между качеством про дукции и факторами, характеризующими технологиче ский процесс ее изготовления.
100
Объективный анализ связи между величинами в зна чительной степени должен основываться на статистиче ских методах. Это вызывается тем обстоятельством, что результаты наших наблюдений за входами и выходами си стемы должны рассматриваться как случайные, что мо жет иногда объясняться ошибками измерений (ниже бу дут приведены и другие причины).
Для простоты займемся вначале тем случаем, когда имеется один вход и один выход, являющиеся одномер ными величинами. Ввиду только что указанной случайно сти результатов наблюдений сформулированную выше
цель исследования необходимо понимать следующим об разом: как по значениям входной переменной [(аргумен та) предсказать соответствующие (усредненные или наи более вероятные) значения выходной переменной (функ ции).
Существуют различные способы решения этой зада чи, зависящие от характеристик наблюдений и от цели исследования. Ниже будут рассмотрены два статистиче ских метода обработки наблюдений—регрессионный ана лиз и корреляционный анализ. В некоторых случаях бы вают необходимы и другие методы, но здесь мы упомя нем лишь об одном из них — конфлюентном анализе.
1. Регрессионный анализ. В схеме регрессионного анализа предполагается, что независимая переменная х
101
является неслучайной -величиной, значения которой зада ются заранее, перед началом наблюдения за системой; зависимая переменная у — случайная величина. Обычно
кэтому приводят два случая:
1)х измеряется без ошибок (или же ими можно пре небречь), а при измерении у имеются случайные ошибки;
2)у зависит не только от х, но и еще от ряда некон
тролируемых факторов.
Нас интересует лишь среднее значение у при задан ном х—М[у(х)], т. е. функциональная зависимость сред него значения у от х: М[у(х)\ — $(х, а, р, у ...). В регрес сионном анализе вид функции предполагается известным и по заданным результатам наблюдений нужно найти оценки для неизвестных параметров а, р, у, ■■■
На плоскости (х,у) уравнение y = f(x, а , р, у ...) при фиксированных а, р, у ,... определяет некоторую кривую,
называемую теоретической кривой регрессии.
При изучении связи между величинами с помощью регрессионного анализа возникают следующие задачи: как наиболее точно (в некотором, заранее отоваривае мом смысле) провести кривую регрессии, если известны результаты наблюдений и гипотеза о виде /(х, а, р, у ...); как оценить степень точности; как построить довери тельные интервалы и границы, попадания в которые эм пирических индивидуальных (или средних) значений у при каждом фиксированном х гарантировали бы с зара нее заданной вероятностью.
Обоснованное применение регрессионного анализа требует выполнения ряда предпосылок:
1)при каждом значении х величина у распределена нормально;
2)дисперсия D[y\х] величины у постоянна (D{y|х]=
=<тг = const) |
или же пропорциональна известной функ |
|
ции х D[y\x]=azh2(x), где h(x) — известная |
функция х; |
|
3) наблюдения являются стохастически независи |
||
мыми. |
отмечалось, среднее значение |
величины |
Как уже |
у предполагается функцией величины х, содержащей не известные н подлежащие определению параметры, при чем тип этой функции известен.
Наилучшие оценки для параметров в уравнении ре грессии получаются при применении метода наимень ших квадратов, т. е. эти параметры определяются из условия минимизации суммы квадратов разностей меж
102
ду наблюдаемыми значениями у и соответствующими значениями теоретической кривой.
Наиболее простым является так называемый случай линейной регрессии, когда функция f(x) линейна отно сительно х. Оценки для параметров в этом случае рас пределены нормально со средними значениями, равными искомым параметрам, и с наименьшими возможными ди сперсиями [26]. В нелинейном случае сводят, если это
возможно, задачу к линейному регрессионному |
анализу |
с несколькими независимыми переменными |
(пример: |
если f(x) — a+ $x+y\nx, то полагая х\ = х, Х2= ]пх, по лучаем: f(x )= g (x u х2) =a+P% i+Y*2).
Остановимся на выборе вида кривой регрессии. При применении регрессионного анализа предполагается, как уже не раз подчеркивалось, что тип функции известен. Однако, когда в нашем распоряжении имеются лишь результаты наблюдений, вид кривой регрессии подлежит определению. Для этого наносим экспериментальные данные на график, т. е. строим так называемое «корре ляционное поле». С помощью частных средних (т. е. средних значений величины у, отвечающих фиксирован ному х) можно проследить основное направление вытя нутости. Обязательно следует использовать так называ емые экспертные оценки, т. е. совокупность сведений профессионального характера об изучаемой реальной системе.
■Принятую гипотезу о виде кривой регрессии необходи- . мо проверить с помощью специально разработанных ста- у тистических критериев, которые, правда, не позволяют установить, является ли данный гипотетический вид за висимости наилучшим, но могут подтвердить, что паши предположения о виде кривой не противоречат исход ным данным (или наоборот).
При определении какой-либо регрессионной зависи мости необходимо всегда указать обследованный диапа зон независимой переменной, ибо со статистической точ ки зрения всякая экстраполяция эмпирических регресси онных кривых незаконна. Даже если соображения профессионально-теоретического характера позволяют признать справедливость данного общего вида зависимо сти в более широком диапазоне, нежели обследованный, известный факт ослабления точности при удалении от среднего значения аргумента делает экстраполяцию эм пирических регрессионных зависимостей неэффективной.
103
2. Корреляционный анализ. Выше указывалось, что схема регрессионного анализа применима лишь в том случае, если независимую переменную х можно считать неслучайной величиной. Если же это не так, регрессион ный анализ использовать нельзя.
Итак, пусть ?]= !(£,), где Л* £— случайные величины. Как известно, связь между ними можно описать с по мощью двумерной функции распределения. Однако та кое описание часто оказывается весьма сложным, а для практических целей можно удовлетвориться зависи мостью среднего значения ц от |.
Рассмотрим вначале тот случай, когда случайность обусловлена зависимостью от неконтролируемых пара метров (схема корреляционного анализа), т. е. требует ся определить
у = М (ц\^=х).
Здесь возникает, кроме обычных задач регрессион ного анализа, необходимость исследования степени тес ноты связи между переменными.
Если заранее известно, что между исследуемыми ве личинами имеется линейная связь, а их совместное рас пределение нормально, характеристикой тесноты связи является коэффициент корреляции, определяемый соот ношением:
(S — A f( E )) (>1 — AfQ*]))
V D(l)D(ri)
(Второй смешанный центральный момент, стоящий в чи слителе, делится на произведение стандартных отклоне ний, чтобы иметь безразмерную величину, инвариантную относительно единицы измерения рассматриваемых слу чайных величин.)
Доказывается, что всегда |г|^Е При сделанных вы ше предположениях равенство г= 0 свидетельствует о взаимной независимости £ и ц; при |r| = 1 имеем функ циональную (нестохастическую — но об этом ниже) ли нейную зависимость т\= а%+Ъ (верно и обратное утвер ждение). Если г > 0, говорят о положительной корреля ции, т. е. большие значения одной случайной величины встречаются обычно вместе с большими значениями дру гой, а меньшие значения этих величин также сочетают ся друг с другом; при г < 0 имеем отрицательную корре ляцию, обладающую противоположными свойствами.
104
Еще раз отметим, что такое истолкование коэффици ента корреляции законно лишь при сделанных выше предположениях. Если совместное распределение не яв ляется нормальным, коэффициент корреляции может быть признан лишь в качестве одной из возможных ха рактеристик степени тесноты связи, а если допустить от клонение зависимости от линейной, можно даже по строить примеры, когда г= 0, хотя между переменными имеется функциональная связь. При нелинейных зависи мостях для определения степени тесноты связи исполь зуют более сложные характеристики, например, так на зываемое корреляционное отношение.
Несколько слов о различии между функциональным и стохастическим видами зависимости. Функциональная зависимость y = f(x ) означает (если / — однозначная функция), что каждому значению Хо (из области опреде ления функции f) отвечает одно и только одно значение Уо=,}(хо). Если же между случайными величинами £ и ц имеется стохастическая зависимость (положительная корреляция, например), то из этого следует, что при изменении | имеется лишь определенная тенденция к изменению ц (в нашем примере с ростом £ ц обнаружи вает тенденцию к увеличению, причем тенденция эта уси ливается, если г возрастает: от независимости при г=0 до жесткой функциональной связи при r = 1).
И, наконец, существенно отметить, что даже если удалось установить тесную зависимость между двумя величинами, отсюда еще непосредственно не следует их причинная взаимообусловленность. Возможна ситуация, когда %и г) стохастически зависимы, хотя причинно они независимы. Если, например, причинно независимые %и г| зависят (каждая в отдельности) от случайной величи ны е, но эта их зависимость от е не замечается, £ и ц часто кажутся стохастически зависимыми. Здесь возни кают задачи многомерного корреляционного анализа:
обнаружение и исключение «общих причинных факторов», расчет «очищенных», или частных, коэффициентов кор реляции и т. п.
3. Конфлюентный анализ. Остановимся вкратце на так называемом конфлюентном анализе. В этой схеме случайный характер величин £, ц объясняется тем, что, являясь неслучайными, величины х н у могут быть, од нако, измерены лишь с некоторыми погрешностями, т. е.
с некоторыми случайными ошибками бх и Ьу. Таким об
105
разом, каждую из этих величин можно представить как сумму двух компонент — «структурной» и стохастиче ской:
|= х + дх,
Ч = У + Ьу,
причем М (\)= х, М(ц) = у, так что М(бх) =М (8У) —0.
Здесь связь £ и ц обусловлена наличием функциональ ной связи между структурными компонентами: у =
—f(x, а, [3 ...)• В конфлюентном анализе определяются оценки для параметров а, [3, ... п для параметров в рас пределении стохастических компонент б*, 6У.
Чтобы указать на принципиальное отличие конф люэнтного анализа от регрессионного или корреляцион ного, предположим, для простоты, что у = а х + $. Тогда г]= (а|Ч-р) + (бу— абж). Как и всегда, М(ч\ \1 = х ) = си-Ир, но здесь стохастическая компонента т), равная (бу— и.Ьх), зависит от подлежащего оценке параметра а, а это мо жет приводить к смещенности, неэффективности и даже несостоятельности оценок.
Поэтому в случае конфлюэнтного анализа извест ные методы (например, метод наименьших квадратов) следует применять с большой осторожностью.
4. Линейный многомерный регрессионный анализ. До сих пор речь, в основном, шла лишь о линейной зависи мости. Выше мы указали один из приемов борьбы с не линейностями путем сведения задачи к многомерному линейному случаю. Здесь мы сделаем несколько замеча ний о частных случаях, допускающих более простое ис следование.
Если из диаграммы наблюдений следует, что кривая регрессии не может быть прямой линией, можно попы таться описать ее с помощью параболической зависимо сти некоторой степени (практически рассматривают лишь квадратичную и кубическую зависимости). Удобно искомую зависимость представлять в виде разложения по ортогональной системе полиномов Чебышева. Оценки неизвестных параметров ищутся с помощью метода наи меньших квадратов.
Если же параболическая зависимость неудовлетвори тельно описывает регрессионную кривую, поиски ведем в более широком классе функций, так как часто, путем простых преобразований, кривую регрессии можно пред ставить как линейное соотношение между преобразован-
106
ными величинами типа у(у = а+ Ь(х)). |
Это, |
например, |
||||
функции 'гиперболического типа |
|
|
|
|
|
|
(г/ — а+ х |
, У — а + |
?х, |
У— а + р *)’ |
|
||
показательного(у = |
а^х\ у = |
аер/л:; у = |
•- - -1- |
- |
-- V ло- |
|
V' |
|
|
|
а + р — е |
* ) |
|
гарифмического (у = |
а"-(- ^ logх ), |
степенного |
у = ах® “и |
др., с числом параметров, не превышающим двух. В об щем случае, когда уравнение кривой зависит от большо го числа параметров, необходимо пользоваться метода ми сведения к задаче многомерного линейного регресси онного анализа [94].
Линейный многомерный регрессионный анализ в прин ципе похож на одномерный. Следуя [171], будем предпо
лагать, что исследуемые |
процессы задаются последова |
тельностью значений в |
дискретные моменты времени |
ti, U, ..., tN, далее, пусть |
|
№ } = {Щ |
|
{ а д » |
= м , |
где Xi(t), X2(t),... ,Xn(t) — входные величины, a Y\(t), Y2(t), .... Ym( t ) — выходные.
Рассмотрим задачу определения уравнения линейной регрессии, где рассматривается сложная система с од ним выходом и входами Xlt Х2, .. .,Хп.
Предполагается, что существует следующая зависи мость:
Y*— M(Y\xi, Х2, ■. ■,Xn) = a'0 + a'iXl+ : . . + а'пхп. (1.60)
Задача заключается в проверке правомерности пред положения о наличии зависимости вида (1.60) и нахож дении оценок коэффициентов уравнения (1.60) а0, at, ...,
... ,ап [201], которые дают
minM [Y— (аэ -(- а,х, + ... -\~апхп)]\ Ос а......ап
Прежде чем приступить к исследованию уравнения (1.60), необходимо исключить из (1.59) явные «выбро сы», т. е. такие значения величин, которые не соответ ствуют реальному процессу. Как правило, они появля ются из-за нестабильности функционирования измери-
107
тельной аппаратуры, ненадежности некоторых элементов системы и прочее.
Далее проверяется значимость корреляции гух. между
выходом Y и входами Xi(i=\,n) |
[193]. |
|
После проверки значимости коэффициентов ryxt урав |
||
нение регрессии |
исследуется |
без тех Хь для которых |
ryxt незначительно |
отличается от нуля. Кроме того, оце |
нивается корреляция гц между параметрами Хг и Ху Если Xi и Xj линейно связаны между собой, то один из этих параметров ничего существенного по сравнению с другим не вносит в уравнение, и в искомое уравнение регрессии можно включать только один из этих пара метров.
При расчете коэффициентов уравнения (1.60) для удобства вычислений целесообразно перейти к новым переменным Zu и /Уд
7 |
Xг1 |
Хг |
— |
_ |
> |
|
аX. |
|
где >oy, Ох — оценка дисперсий, а Х{, Y; Xi, Y — оценки средних Xi и Y.
После замены переменных получим линейное уравне ние регрессии в новых переменных
U = PiZ± + ••• +PnK„,
где Рг— новые коэффициенты уравнения регрессии, од нозначно связанные с коэффициентами а* следующими
формулами: |
> |
|
|
П |
|
а0 = У — 2 |
$гХэ, |
|
|
1=I |
|
аг = |
р г ~ (г = 1,/г). |
|
|
% |
|
Коэффициенты рг находятся из системы уравнений:
Г УХг = |
Р* “Ь % ГХгХ, "Ь РзГХ3Х! “Ь •" “Ь |
Г УХ%= PirX,Xa+ р2 + % г х 3х , + ••• + h r Xn XS |
|
ГУХп ~ |
^ ГХгХп “Ь$*ГХ2Хп "Ь $ » r XiXn + -"+Рп- |
108
Для того, чтобы установить правомерность предполо жения о линейной зависимости выхода Y от входов Х\, Xi, .. ,,Хп, вычисляется коэффициент множественной корреляции
R = Y $ ' r Y X l + $ г ГУ Х а + •
В зависимости от количества параметров и длины их реализаций N с помощью критерия Фишера и преобра
зования Стьюдента ,[202] |
устанавливается |
значимость |
||||||
коэффициента множественной корреляции R и коэффи |
||||||||
циентов регрессии |
|
|
нуля, |
то |
линейная |
|||
Если R значимо отличается от |
||||||||
связь существует, и предположение |
о |
наличии |
связи |
|||||
(1.60) |
между входами |
и |
выходом |
системы |
верно. |
|||
В этом случае оцениваются коэффициенты |
регрессии рг |
|||||||
и, если |
какой-либо из этих коэффициентов незначитель |
|||||||
но отличается от нуля, |
то |
соответствующий |
параметр |
|||||
Xi следует убрать из уравнения регрессии. |
|
|
|