Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Снапелев, Ю. М. Моделирование и управление в сложных системах

.pdf
Скачиваний:
11
Добавлен:
21.10.2023
Размер:
10.23 Mб
Скачать

В

противном

случае, т. е. когда k =

0,

/?[х(Х|/)) =

У[0)|А;

X ^ G lX ^ j.

Для рассматриваемого

X*/f

найдем

=(Х(0)) и Y ^ — Ru (P^(X\i))). Здесь также приходится

иметь

в виду два случая.

Пусть v = 0, тогда

мы полу­

чаем

выходной контакт У|0)

элемента С0, представляю­

щего внешнюю среду, поэтому

 

 

R(Xl») = Rli(Pv(Xfy).

 

Если же v=^0, то искомый контакт

0 [7)ft)]v

является выходным контактом элемента Ck

Для по­

лученного y (.v) найдем У|й) =

Q~’ (E[v)).

 

Таким образом,

 

 

Л =О Г' ( 'Щ Щ У ’»)-

Соотношения

^Cj> Cfc

R = (Ru(p^ i }m Q g V c * g s ,

решают поставленную задачу.

Рассмотренная формализация сопряжения элементов является удобным приемом описания сложных систем, ис­ пользуемым при решении задач композиции сложных си­ стем, анализе их структуры, а также для ввода ,в ЭВМ информации о взаимодействии элементов в сложных си­ стемах.

В заключение отметим, что теория агрегативных си­ стем делает лишь первые шаги, но те результаты, кото­ рые уже получены, эффективно используются на практике.

§ 1.6. Статистические методы обработки наблюдений

Важнейшая задача, предшествующая моделированию системы, — изучение поведения рассматриваемого реаль­ ного объекта и его описание. Универсальный способ ре­ шения такой задачи заключается в наблюдении за состо­ янием выходов системы в различные моменты времени в зависимости от состояния входов. Например, бывает необходимо найти зависимость между качеством про­ дукции и факторами, характеризующими технологиче­ ский процесс ее изготовления.

100

Объективный анализ связи между величинами в зна­ чительной степени должен основываться на статистиче­ ских методах. Это вызывается тем обстоятельством, что результаты наших наблюдений за входами и выходами си­ стемы должны рассматриваться как случайные, что мо­ жет иногда объясняться ошибками измерений (ниже бу­ дут приведены и другие причины).

Для простоты займемся вначале тем случаем, когда имеется один вход и один выход, являющиеся одномер­ ными величинами. Ввиду только что указанной случайно­ сти результатов наблюдений сформулированную выше

цель исследования необходимо понимать следующим об­ разом: как по значениям входной переменной [(аргумен­ та) предсказать соответствующие (усредненные или наи­ более вероятные) значения выходной переменной (функ­ ции).

Существуют различные способы решения этой зада­ чи, зависящие от характеристик наблюдений и от цели исследования. Ниже будут рассмотрены два статистиче­ ских метода обработки наблюдений—регрессионный ана­ лиз и корреляционный анализ. В некоторых случаях бы­ вают необходимы и другие методы, но здесь мы упомя­ нем лишь об одном из них — конфлюентном анализе.

1. Регрессионный анализ. В схеме регрессионного анализа предполагается, что независимая переменная х

101

является неслучайной -величиной, значения которой зада­ ются заранее, перед началом наблюдения за системой; зависимая переменная у случайная величина. Обычно

кэтому приводят два случая:

1)х измеряется без ошибок (или же ими можно пре­ небречь), а при измерении у имеются случайные ошибки;

2)у зависит не только от х, но и еще от ряда некон­

тролируемых факторов.

Нас интересует лишь среднее значение у при задан­ ном хМ[у(х)], т. е. функциональная зависимость сред­ него значения у от х: М[у(х)\ — $(х, а, р, у ...). В регрес­ сионном анализе вид функции предполагается известным и по заданным результатам наблюдений нужно найти оценки для неизвестных параметров а, р, у, ■■■

На плоскости (х,у) уравнение y = f(x, а , р, у ...) при фиксированных а, р, у ,... определяет некоторую кривую,

называемую теоретической кривой регрессии.

При изучении связи между величинами с помощью регрессионного анализа возникают следующие задачи: как наиболее точно (в некотором, заранее отоваривае­ мом смысле) провести кривую регрессии, если известны результаты наблюдений и гипотеза о виде /(х, а, р, у ...); как оценить степень точности; как построить довери­ тельные интервалы и границы, попадания в которые эм­ пирических индивидуальных (или средних) значений у при каждом фиксированном х гарантировали бы с зара­ нее заданной вероятностью.

Обоснованное применение регрессионного анализа требует выполнения ряда предпосылок:

1)при каждом значении х величина у распределена нормально;

2)дисперсия D[y\х] величины у постоянна (D{y|х]=

=<тг = const)

или же пропорциональна известной функ­

ции х D[y\x]=azh2(x), где h(x) — известная

функция х;

3) наблюдения являются стохастически независи­

мыми.

отмечалось, среднее значение

величины

Как уже

у предполагается функцией величины х, содержащей не­ известные н подлежащие определению параметры, при­ чем тип этой функции известен.

Наилучшие оценки для параметров в уравнении ре­ грессии получаются при применении метода наимень­ ших квадратов, т. е. эти параметры определяются из условия минимизации суммы квадратов разностей меж­

102

ду наблюдаемыми значениями у и соответствующими значениями теоретической кривой.

Наиболее простым является так называемый случай линейной регрессии, когда функция f(x) линейна отно­ сительно х. Оценки для параметров в этом случае рас­ пределены нормально со средними значениями, равными искомым параметрам, и с наименьшими возможными ди­ сперсиями [26]. В нелинейном случае сводят, если это

возможно, задачу к линейному регрессионному

анализу

с несколькими независимыми переменными

(пример:

если f(x) — a+ $x+y\nx, то полагая х\ = х, Х2= ]пх, по­ лучаем: f(x )= g (x u х2) =a+P% i+Y*2).

Остановимся на выборе вида кривой регрессии. При применении регрессионного анализа предполагается, как уже не раз подчеркивалось, что тип функции известен. Однако, когда в нашем распоряжении имеются лишь результаты наблюдений, вид кривой регрессии подлежит определению. Для этого наносим экспериментальные данные на график, т. е. строим так называемое «корре­ ляционное поле». С помощью частных средних (т. е. средних значений величины у, отвечающих фиксирован­ ному х) можно проследить основное направление вытя­ нутости. Обязательно следует использовать так называ­ емые экспертные оценки, т. е. совокупность сведений профессионального характера об изучаемой реальной системе.

■Принятую гипотезу о виде кривой регрессии необходи- . мо проверить с помощью специально разработанных ста- у тистических критериев, которые, правда, не позволяют установить, является ли данный гипотетический вид за­ висимости наилучшим, но могут подтвердить, что паши предположения о виде кривой не противоречат исход­ ным данным (или наоборот).

При определении какой-либо регрессионной зависи­ мости необходимо всегда указать обследованный диапа­ зон независимой переменной, ибо со статистической точ­ ки зрения всякая экстраполяция эмпирических регресси­ онных кривых незаконна. Даже если соображения профессионально-теоретического характера позволяют признать справедливость данного общего вида зависимо­ сти в более широком диапазоне, нежели обследованный, известный факт ослабления точности при удалении от среднего значения аргумента делает экстраполяцию эм­ пирических регрессионных зависимостей неэффективной.

103

2. Корреляционный анализ. Выше указывалось, что схема регрессионного анализа применима лишь в том случае, если независимую переменную х можно считать неслучайной величиной. Если же это не так, регрессион­ ный анализ использовать нельзя.

Итак, пусть ?]= !(£,), где Л* £— случайные величины. Как известно, связь между ними можно описать с по­ мощью двумерной функции распределения. Однако та­ кое описание часто оказывается весьма сложным, а для практических целей можно удовлетвориться зависи­ мостью среднего значения ц от |.

Рассмотрим вначале тот случай, когда случайность обусловлена зависимостью от неконтролируемых пара­ метров (схема корреляционного анализа), т. е. требует­ ся определить

у = М (ц\^=х).

Здесь возникает, кроме обычных задач регрессион­ ного анализа, необходимость исследования степени тес­ ноты связи между переменными.

Если заранее известно, что между исследуемыми ве­ личинами имеется линейная связь, а их совместное рас­ пределение нормально, характеристикой тесноты связи является коэффициент корреляции, определяемый соот­ ношением:

(S — A f( E )) (>1 — AfQ*]))

V D(l)D(ri)

(Второй смешанный центральный момент, стоящий в чи­ слителе, делится на произведение стандартных отклоне­ ний, чтобы иметь безразмерную величину, инвариантную относительно единицы измерения рассматриваемых слу­ чайных величин.)

Доказывается, что всегда |г|^Е При сделанных вы­ ше предположениях равенство г= 0 свидетельствует о взаимной независимости £ и ц; при |r| = 1 имеем функ­ циональную (нестохастическую — но об этом ниже) ли­ нейную зависимость т\= а%+Ъ (верно и обратное утвер­ ждение). Если г > 0, говорят о положительной корреля­ ции, т. е. большие значения одной случайной величины встречаются обычно вместе с большими значениями дру­ гой, а меньшие значения этих величин также сочетают­ ся друг с другом; при г < 0 имеем отрицательную корре­ ляцию, обладающую противоположными свойствами.

104

Еще раз отметим, что такое истолкование коэффици­ ента корреляции законно лишь при сделанных выше предположениях. Если совместное распределение не яв­ ляется нормальным, коэффициент корреляции может быть признан лишь в качестве одной из возможных ха­ рактеристик степени тесноты связи, а если допустить от­ клонение зависимости от линейной, можно даже по­ строить примеры, когда г= 0, хотя между переменными имеется функциональная связь. При нелинейных зависи­ мостях для определения степени тесноты связи исполь­ зуют более сложные характеристики, например, так на­ зываемое корреляционное отношение.

Несколько слов о различии между функциональным и стохастическим видами зависимости. Функциональная зависимость y = f(x ) означает (если / — однозначная функция), что каждому значению Хо (из области опреде­ ления функции f) отвечает одно и только одно значение Уо=,}(хо). Если же между случайными величинами £ и ц имеется стохастическая зависимость (положительная корреляция, например), то из этого следует, что при изменении | имеется лишь определенная тенденция к изменению ц (в нашем примере с ростом £ ц обнаружи­ вает тенденцию к увеличению, причем тенденция эта уси­ ливается, если г возрастает: от независимости при г=0 до жесткой функциональной связи при r = 1).

И, наконец, существенно отметить, что даже если удалось установить тесную зависимость между двумя величинами, отсюда еще непосредственно не следует их причинная взаимообусловленность. Возможна ситуация, когда %и г) стохастически зависимы, хотя причинно они независимы. Если, например, причинно независимые %и г| зависят (каждая в отдельности) от случайной величи­ ны е, но эта их зависимость от е не замечается, £ и ц часто кажутся стохастически зависимыми. Здесь возни­ кают задачи многомерного корреляционного анализа:

обнаружение и исключение «общих причинных факторов», расчет «очищенных», или частных, коэффициентов кор­ реляции и т. п.

3. Конфлюентный анализ. Остановимся вкратце на так называемом конфлюентном анализе. В этой схеме случайный характер величин £, ц объясняется тем, что, являясь неслучайными, величины х н у могут быть, од­ нако, измерены лишь с некоторыми погрешностями, т. е.

с некоторыми случайными ошибками бх и Ьу. Таким об­

105

разом, каждую из этих величин можно представить как сумму двух компонент — «структурной» и стохастиче­ ской:

|= х + дх,

Ч = У + Ьу,

причем М (\)= х, М(ц) = у, так что М(бх) =М (8У) —0.

Здесь связь £ и ц обусловлена наличием функциональ­ ной связи между структурными компонентами: у =

—f(x, а, [3 ...)• В конфлюентном анализе определяются оценки для параметров а, [3, ... п для параметров в рас­ пределении стохастических компонент б*, 6У.

Чтобы указать на принципиальное отличие конф­ люэнтного анализа от регрессионного или корреляцион­ ного, предположим, для простоты, что у = а х + $. Тогда г]= (а|Ч-р) + (бу— абж). Как и всегда, М(ч\ \1 = х ) = си-Ир, но здесь стохастическая компонента т), равная (бу— и.Ьх), зависит от подлежащего оценке параметра а, а это мо­ жет приводить к смещенности, неэффективности и даже несостоятельности оценок.

Поэтому в случае конфлюэнтного анализа извест­ ные методы (например, метод наименьших квадратов) следует применять с большой осторожностью.

4. Линейный многомерный регрессионный анализ. До сих пор речь, в основном, шла лишь о линейной зависи­ мости. Выше мы указали один из приемов борьбы с не­ линейностями путем сведения задачи к многомерному линейному случаю. Здесь мы сделаем несколько замеча­ ний о частных случаях, допускающих более простое ис­ следование.

Если из диаграммы наблюдений следует, что кривая регрессии не может быть прямой линией, можно попы­ таться описать ее с помощью параболической зависимо­ сти некоторой степени (практически рассматривают лишь квадратичную и кубическую зависимости). Удобно искомую зависимость представлять в виде разложения по ортогональной системе полиномов Чебышева. Оценки неизвестных параметров ищутся с помощью метода наи­ меньших квадратов.

Если же параболическая зависимость неудовлетвори­ тельно описывает регрессионную кривую, поиски ведем в более широком классе функций, так как часто, путем простых преобразований, кривую регрессии можно пред­ ставить как линейное соотношение между преобразован-

106

ными величинами типа у(у = а+ Ь(х)).

Это,

например,

функции 'гиперболического типа

 

 

 

 

 

(г/ а+ х

, У а +

?х,

У— а + р *)’

 

показательного=

а^х\ у =

аер/л:; у =

•- - -1-

-

-- V ло-

V'

 

 

 

а + р — е

* )

гарифмического =

а"-(- ^ logх ),

степенного

у = ах® “и

др., с числом параметров, не превышающим двух. В об­ щем случае, когда уравнение кривой зависит от большо­ го числа параметров, необходимо пользоваться метода­ ми сведения к задаче многомерного линейного регресси­ онного анализа [94].

Линейный многомерный регрессионный анализ в прин­ ципе похож на одномерный. Следуя [171], будем предпо­

лагать, что исследуемые

процессы задаются последова­

тельностью значений в

дискретные моменты времени

ti, U, ..., tN, далее, пусть

 

№ } = {Щ

{ а д »

= м ,

где Xi(t), X2(t),... ,Xn(t) — входные величины, a Y\(t), Y2(t), .... Ym( t ) — выходные.

Рассмотрим задачу определения уравнения линейной регрессии, где рассматривается сложная система с од­ ним выходом и входами Xlt Х2, .. .,Хп.

Предполагается, что существует следующая зависи­ мость:

Y*— M(Y\xi, Х2, ■. ■,Xn) = a'0 + a'iXl+ : . . + а'пхп. (1.60)

Задача заключается в проверке правомерности пред­ положения о наличии зависимости вида (1.60) и нахож­ дении оценок коэффициентов уравнения (1.60) а0, at, ...,

... ,ап [201], которые дают

minM [Y— (аэ -(- а,х, + ... -\~апхп)]\ Ос а......ап

Прежде чем приступить к исследованию уравнения (1.60), необходимо исключить из (1.59) явные «выбро­ сы», т. е. такие значения величин, которые не соответ­ ствуют реальному процессу. Как правило, они появля­ ются из-за нестабильности функционирования измери-

107

тельной аппаратуры, ненадежности некоторых элементов системы и прочее.

Далее проверяется значимость корреляции гух. между

выходом Y и входами Xi(i=\,n)

[193].

После проверки значимости коэффициентов ryxt урав­

нение регрессии

исследуется

без тех Хь для которых

ryxt незначительно

отличается от нуля. Кроме того, оце­

нивается корреляция гц между параметрами Хг и Ху Если Xi и Xj линейно связаны между собой, то один из этих параметров ничего существенного по сравнению с другим не вносит в уравнение, и в искомое уравнение регрессии можно включать только один из этих пара­ метров.

При расчете коэффициентов уравнения (1.60) для удобства вычислений целесообразно перейти к новым переменным Zu и /Уд

7

Xг1

Хг

_

>

 

аX.

 

где >oy, Ох — оценка дисперсий, а Х{, Y; Xi, Y — оценки средних Xi и Y.

После замены переменных получим линейное уравне­ ние регрессии в новых переменных

U = PiZ± + ••• +PnK„,

где Рг— новые коэффициенты уравнения регрессии, од­ нозначно связанные с коэффициентами а* следующими

формулами:

>

 

 

П

 

а0 = У — 2

$гХэ,

 

1=I

 

аг =

р г ~ (г = 1,/г).

 

%

 

Коэффициенты рг находятся из системы уравнений:

Г УХг =

Р* “Ь % ГХгХ, "Ь РзГХ3Х! “Ь •" “Ь

Г УХ%= PirX,Xa+ р2 + % г х 3х , + ••• + h r Xn XS

ГУХп ~

^ ГХгХп “Ь$*ГХ2Хп $ » r XiXn + -"+Рп-

108

Для того, чтобы установить правомерность предполо­ жения о линейной зависимости выхода Y от входов Х\, Xi, .. ,,Хп, вычисляется коэффициент множественной корреляции

R = Y $ ' r Y X l + $ г ГУ Х а + •

В зависимости от количества параметров и длины их реализаций N с помощью критерия Фишера и преобра­

зования Стьюдента ,[202]

устанавливается

значимость

коэффициента множественной корреляции R и коэффи­

циентов регрессии

 

 

нуля,

то

линейная

Если R значимо отличается от

связь существует, и предположение

о

наличии

связи

(1.60)

между входами

и

выходом

системы

верно.

В этом случае оцениваются коэффициенты

регрессии рг

и, если

какой-либо из этих коэффициентов незначитель­

но отличается от нуля,

то

соответствующий

параметр

Xi следует убрать из уравнения регрессии.

 

 

 

Соседние файлы в папке книги из ГПНТБ