Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования

.pdf
Скачиваний:
0
Добавлен:
21.10.2023
Размер:
9.19 Mб
Скачать

H (X) <C 1

выносится решение

a =

a2 , т. е.

 

( ~> 1,

a =

alt

 

l

< 1 .

a =

Oa.

Если известны априорные вероятности

(соответственно /?а и р2)г

то, применяя метод апостериорной вероятности, получим:

 

при

= - £ L # ( X ) > 1

выносится

решение а = ах , так как апостериорные плотности ве­

роятности для а-і больше, чем для я2 , или, переписав это выражение:

Ра Я ( Х ) > ^ - - » а = о 1

тогда

 

 

 

 

 

Я ( Х )

pa

(1-6-4)

 

 

 

 

Можно

легко видеть,

что результаты (1-6-3) и (1-6-4)

совпадают

 

1

 

 

 

при Р і =

ра=

 

 

 

Приведенные выше

методы (максимума апостериорной вероят­

ности и максимума правдоподобия) представляют собой методы по­ лучения решения. Для того тобы получить оптимальное решение в соответствии с приведенной в главе І-2і методологией, необходи­ мо установить критерий оптимальности.

В теории статистических решений весьма распространены кри­ терии, связанные с вероятностями ошибок. Для определения ве­ роятности ошибок рассмотрим пространство наблюдений. Каждой наблюдаемой реализации хх ... хк соответствует вектор X этого пространства. В соответствии с выбранным методом решения каждой

точке А соответствует определенное решение

а=

аг или а = о2 .

По этому признаку пространство наблюдений делится на две

области: — область

Ег

образует

множество

точек, для которых

а =

au — область Е2

образует множество точек, для которых а =

= аа . Рассмотренные

выше

методы решения

представляют собой

методы разбиения пространства

наблюдений

на эти две области.

При

этом

возникают

два

рода

ошибок:

ошибка первого рода,

когда принимается решение

а =

а ь в то время как в действитель­

ности а =

я2 , и ошибка второго рода, когда принимается решение

а =

а2 , в то время как в

действительности

а =

ах.

Если обозначить вероятности ошибок первого и второго рода

соответственно через а и ß и через рг и рг

— априорные вероятно­

сти значений ах и а2, то общая безусловная вероятность ошибки (первого и второго рода) есть

g = pza + Pip.

60

Изменением величины области Ех при конечном фиксированном объеме выборки п нельзя одновременно уменьшить значения а и ß (в силу [1-6-4]). При фиксированных значениях а и п можно выбрать такое Et, что ß будет минимальным (аналогично могут быть.рассмотрены процедуры выборкиЕ1 } минимизирующих а при фиксации п к ß или минимизирующих ?г при фиксированных зна­ чениях а и ß).

Подобный оптимальный выбор критической области Ех назы­ вается оптимальным классическим решением задачи выбора м:еж-..- ду двумя гипотезами. Способ получения оптимальной критиче­ ской области основан на критерии Иеймана — Пирсона (Башаринов, Флѳйшман, 1962). Граница оптимальной критической об­ ласти Е± при этом задается гиперповерхностью

 

H (xi) -

const = С,

 

где H — коэффициент правдоподобия.

 

К области

Е2 принадлежат

все выборки,

удовлетворяющие

неравенству

 

 

 

 

Ж

С ,

(1-6-5)

а к области Ех

—- выборки, удовлетворяющие

обратному неравен­

ству

 

 

 

 

Н>С.

(1-6-6)

Если выборка удовлетворяет неравенству (1-6-3), то принимается

гипотеза Нг,

а если она удовлетворяет неравенству

(1-6-4), то

принимается

гипотеза Нх. Сформулированная выше

процедура

сводится к минимизации ß при зависимости H — f (п,

а) (анало­

гично: минимизация а при H = / (п, ß) и минимизация п при H =

= / ( а , ß)).

 

'

Если принять, что оптимальным является метод решения, обес­ печивающий минимум ошибки второго рода при заданной величине ошибки первого рода (критерий Неймана — Пирсона), то при

р2 а = const = Н0

необходимо

р$ = min.

Оптимальное решение может быть получено в виде

Я (X) I я р

( j < - gi = /i->a = a2 ,

гдѳіУ (X) — коэффициент правдоподобия; Я — множитель Лагранжа, h — пороговое значение. Здесь величина порога h зависит от значения множителя Лагранжа и может быть определена для кон­ кретных случаев.

61

Приведенные методы теории двуальтернативных решений могут быть распространены на более общие классы задач. Например, ес­ ли параметр а имеет m возможных значений аг ... ат (с априор­ ными вероятностями рх ... рт), то пространство наблюдений Е разбивается на m областей Ех ... Ет, соответствующих решениям ах ... ат. При этом могут быть использованы известные методы мак­ симума апостериорной вероятности, максимума правдоподобия

ит. д.

Выше было установлено, что основная задача — задача оцен­ ки дискретного процесса вектора S = {sx ... sn) состоит в выборе решения, т. е. для каждой из величин s должны быть даны оцен­

ки dj, представляющие собой в общем виде вектор D

=

{dx ...

dn).

Вектор выборки (сигнала) рассматривается в пространстве сиг­

нала Q (S)

с

декартовыми координатами

sx ... sn.

Здесь Р (S)

•dQ

(S)

—вероятность попадания конца вектора iS" в

элементарный

объем

dQ (S).

(Р (S)

— априорная плотность вероятности векто-

pa

S).

 

 

 

 

 

 

 

 

 

 

Вектор

решений

D рассматривается

в

пространстве

решений

Q (D) с декартовыми координатами dx ...

dn,

причем Р (D)

dQ {D)

вероятностность попадания конца вектора D в элементарный

объем

dQ

(D).

 

 

 

 

 

 

 

 

Каждой точке в пространстве наблюдений должно быть сопо­

ставлено некоторое решение D,

т. е. вектор D в пространстве реше­

ний.

Правило

решения, т. е.

правило

преобразования

точек

X-

пространства в точки ^-пространства, есть стратегия. В теории ста­ тистических решений рассматриваются два класса стратегий. Если каждому фиксированному X соответствует определенная точка про- "странстваТТд"о стратегия является регулярной. Если каждому фик­ сированному X соответствует некоторая плотность вероятностного распределения V {DIX) точек пространства D, то выбор решения является случайным, причем статистический закон, определяющий этот выбор, зависит от значения X и стратегия этого типа является случайной.

Эта функция V {DIX) называется решающей функцией (см. при­ веденную выше формулировку). Основной задачей в теории стати­ стических решений является задача определения оптимальной решающей функции. Критерий оптимальности (так же как' и в тео­ рии двуальтернативных решений) связан с ошибками решения.

В общей теории статистических решений применимы определе­ ния, введенные выше для статистических игр. Решение D, при­ нимаемое относительно параметра А, может содержать ошибку, величина которой оценивается функцией потерь

W=W{S, D).

Эта функция зависит как от вектора сигнала, так и от вектора ре­ шения. Правильное решение определяется наименьшим значе­ нием потерь,

63

Конкретный вид функции потерь может быть весьма разнообраз­ ным, например

п

W{S, D)= Sfo-d,)8,

1=1

W{S, D) = l — ô(S — D),

где ô — функция Дирака.

В общем виде функция потерь может быть случайной, так как случайной может быть стратегия или вектор наблюдения может быть смешан с шумом. При создании конкретных устройств, осу­ ществляющих решение, необходимо выбрать некую детермини­ рованную меру оценки работы этого устройства. Подобной детерми­ нированной мерой может служить математическое ожидание функ­

ции

потерь.

 

 

 

 

Условным риском г {S,

V ) является математическое ожидание

функции потерь

W {S,

D)

при фиксированном S и фиксирован­

ной

решающей

функции

Ѵ :

;

 

 

г {S,

V ) =

M {W {S, D)/S}.

Как известно (см. главу 1-0), Математическое ожидание представ­ ляет собой усреднение функции по значениям случайного аргу­ мента, т, е. в нашем случае

M {W (S, D)/S} = l W{S, D)P {D/S) dQ, n(D)

где: P {DIS) — условная плотность вероятности D при заданном S; Q {D) — область возможных значений D.

Условная плотность вероятности P {DIS) может быть определена, если известны вероятностные характеристики шума и характери­ стики параметра P {X/S), а также алгоритм, по которому осуще­ ствляется решение V {DIX). Выражение для условного риска тогда имеет вид

г {S, V ) = $ W {S, D) V {DIX) P {X/S) dQ.

X)

Если характеристики сигнала неизвестны, то, зная априорную плотность вероятности P {S), можно усреднить условный риск по области Q {S). Математическое ожидание условного риска

Ä = i k f { r } = J г (S, V ) P {S) dQ

называется полным риском. Полный риск можно записать в виде

R =

I

W {S, D) V {DIX) P {X/S) P {S) dQ.

Таким образом, задача определения оптимальной стратегии может быть сформулирована как задача определения решающей функции

63

V ФІХ),

минимизирующей полный риск R. Эта задача может быть

решена,

если известна априорная плотность вероятности. Р (S).

В случаях, когда эта функция неизвестна, используется выра­

жение для условного риска,

в которое

Р (S) не входит. При

этом ищется такая решающая функция V , при которой услов­

ный риск для наихудшего сигнала S* был бы минимальным, т. е.

г (S*, V * ) = min г {S*,

V ) = min max г (S', V ) -

д

V

S

Таким образом, получена минимальная стратегия, являющаяся одной из основных в теории игр (см. в главе 1-3 теорему фон Ней­ мана о минимаксе) (см. также Миддлтон, 1966).

Ч>(0

JV2

1(t)t

 

*4

и

«1

 

»5

Рис. 5. Структурная

схема

 

 

 

О б ъ я с н е н и я в

тексте

 

 

 

 

П р и м е р .

Задача

состоит в получении

характеристик вход­

ного потока ф со случайным параметром £ по характеристикам выходного потока р при наличии в системе шума с известными

статистическими свойствам (Шапиро, 1969).

 

^Пр_иведенная на рис. 5 скелетная

схема представляет

собой

—' один канал^информационной системы,

хотя на практике в выше­

стоящей инстанции обрабатывается

информация, поступающая

по нескольким

каналам.

 

 

Процесс передачи информации является, как известно,

стоха­

стическим, поскольку рассматривается процесс передачи совокуп­

ности сообщений

при наличии помех.

 

Входной поток характеризуется случайным параметром | , вероятностные свойства которого заданы.

Приведенная разомкнутая система может быть рассмотрена с позиции теории оптимальных систем с накоплением информации.

По-видимому, из трех направлений этой теории — корреля­ ционных методов, методов теории информации, методов теории статистических решений представляется целесообразным исполь­ зование последнего направления как наиболее общего.

Если определить функцию потерь W как величину «убытка» от неверного решения, то очевидно, что W (S, D) -*~ min при пра­ вильном решении.

Таким образом, задача исследования связи входного и вы­ ходного информационных потоков может быть сведена к опреде­ лению стратегии, обеспечивающей минимальную функцию по-- терь. —

64

В приведенной структурной схеме одного канала информацион­ ной системы рассматриваемого класса приняты следующие обо­

значения.

 

 

 

ф — истинный поток на входе;

 

т|з информация

о входном

потоке

(с помехой Д);

у — информация

о выходном

потоке

оператора (с помехой / 2 ) ;

и — стратегия;

 

 

 

г] — выход канала связи с помехой

(/3 ):

р— информация в вышестоящей инстанции, содержащая о ситуации достоверную и случайную составляющие;

Nx

— смеситель (измерительное

устройство);

N2

— функциональный

оператор

(с помехой / 2 ) ;

JVg — канал связи

помехой / 3 ) ;

Nt

— управляющее

устройство (с помехой /<,);

N5

— объект (с помехой / 6 ) .

 

Пусть заданы:

— вид функции ф (s, Ç), где s — дискретное время,

априорная плотность вероятности Р (X),

плотности вероятности: входного сигнала Р (Д), функцио­

нального оператора Р (/2 ), канала связи Р (/3 ), объекта-

Р(h);

способы комбинации сигнала и шума;

элементы системы {Ni ... N5). Тогда

Условная плотность вероятности Р (яр/ф) одинакова для

всех значений s, так как Р (Д) = const.

Условная плотность вероятности Р (уЛ|)) одинакова для всех значений s, так как Р (/2) = const.

Условная плотность вероятности Р {ц/у) одинакова для всех

значений s, так как Р (/3 ) = const.

Для безынерционного (без памяти) объекта Ns известны функ­

ция р = F (/5,

и) и характеристика

помехи / 6 =

/ {s, jx), где u. =

= (u,!,

— случайный вектор

с известной

плотностью ве­

роятности Р (и.).

Удельная функция потерь для дискретного момента времени s

Ws {s, ф, р). .

Общая функция потерь

W= 2 Ws{s, ф, р). s=0

Необходимо определить такую оптимальную стратегию управ­ ляющего устройства, при котором Wmin.

Как известно, математическое ожидание удельной функции потерь в дискретный момент времени t = s является удельным ри­ ском

3 А. Р. Шахнович

65

 

 

RS=M{WS

(s, cp, p)},

 

тогда

средина

риск

 

 

 

 

 

R = M{W} =

%Rt.

 

 

 

 

 

0

 

Считая, что

стратегия ut

может

быть случайной,

обозначим

G (us)

плотность вероятности

для

управляющего

воздействия

при

t = s.

 

 

 

 

Таким образом, математическая постановка задачи состоит в следующем.

Для информационной системы, сведенной к разомкнутой систе­ ме управления, при заданных характеристиках элементов и веро­ ятностных характеристиках сигналов и шумов найти оптимальную стратегию управляющего устройства G (us), такую, которая обе­ спечила бы минимум среднего риска. Тогда выражение среднего риска через характеристики элементов системы имеет вид

Л$ = S Ws (s, ф, p) Р (р/и,) G (u,/n ) P (il/y) P (Г/Ф) P (#p) P (l) dQ, Q

где G (ujt]) — условная плотность вероятности, поскольку плот­ ность G (щ) зависит от т|; Q (£) область изменения вектора | .

Поставленная выше задача является по существу аналогичной задачам теории связи ы приводимых к ним задачам управления в разомкнутой системе.

В самом деле, здесь имеется поток информации, содержащий случайную (неизвестную) составляющую §, устройство передачи информации (обладающее помехой), устройство приема информа­ ции (обладающее помехой), канал связи с шумом.

На выходе приемного устройства требуется получить показа­ тель, являющийся минимумом математического ожидания функции потерь (например, минимум ошибки между «входной» и «выходной» информациями).

Специфика подобной задачи заключается, по-видимому, в том, что управляющее устройство, осуществляющее оптимальную стра­ тегию, расположено на приемной стороне цепи, после канала связи.

Однако при известных статистических характеристиках кана­ ла связи это отличие не является существенным.

Выше показано, что методы теории статистических реше­ ний могут быть применены для получения достоверной информа­ ции на определенной ступени иерархической системы, по харак­ теристикам входной информации предыдущей ступени. Поскольку на каждой ступени происходит соединение ряда ветвей предыду­ щих ступеней иерархии, полный риск на 1-й ступени иерархиче­ ской системы при наличии «/с» ветвей от «I 1-й ступени может

быть представлен в виде

66

 

 

 

 

 

Rl

= ІЗ 2

Л

 

 

 

 

 

 

 

 

 

 

;,-=i s=o

 

 

 

 

 

Анализируя

перспективы

развития

теории

управления,

А. А. Фельдбаум (1963 г.) отметил целесообразность

подхода, осно­

ванного

на использовании

методов теории управления для реше­

ния биологических

задач

целенаправленного выбора в

условиях

большого числа внешних

раздражителей

(см. главу

I I I — V I I ) .

 

 

 

 

 

Л И Т Е Р А Т У Р А

 

 

 

 

Башаринов

А. Е.,

Флейшман

Б. С. Метода статистического последователь­

ного

анализа и их приложения. М., «Сов. радио»,

1962.

 

Блекуэлл

 

Д.,

Гиршик

М. Теория игр и статистических

решений. М., ИЛ,

1958.

 

 

 

 

 

 

 

 

 

 

 

Крамер

Г. Математические методы в статистике. М., ИЛ,

1948.

Миддлтон

Д.

Очерки

теории

связи. М.,

«Сов.

радио»,

1966.

систем. М.,

Фельдбаум

А. А.

Обновы теории

оптимальных

автоматических

1963.

 

 

 

 

 

 

 

 

 

 

 

Шапиро

Д. И. Об одной задаче статистического синтеза. Труды IV конферен­

ции по теории передачи и кодирования информации,

4.

Ташкент, 1969.

Глава 1-7

ТОПОЛОГИЯ

Топология представляет собой одно из самых абстрактных на­ правлений современной математики и на первый взгляд лежит не­ сколько в стороне от тематики монографии. Однако, как показал Н. А. Бернштейн (1966), энграммы (программы работы) мозга

основаны на топологических, а не на метрических

представле­

ниях.

 

Ниже в сжатой форме будут приведены основные

определения

и положения топологии (Болтянский, Ефремович; 1957). Желаю­ щим более глубоко изучить топологию рекомендуем работы: Алек­ сандров, Ефремович, - 1936; Бурбаки, 1963; Куратовский, 1968.

Основной идеей, лежащей в основе топологии, является идея непрерывности, которая известна из математического анализа.

Как известно из анализа, задать функцию — значит задать ото­ бражение множества А в множество Б. При этом множества не обя­ зательно состоят из действительных чисел. Например (рис. 6), если А — множество точек X , расположенных на сторонах равно­

стороннего треугольника, а В — множество точек

Y, лежащих

на описанной вокруг треугольника окружности, то

центральное

3* 67

Рис. 6. Пример топологических представлений

Рпс. 7. Пример топологических предстаалений

осо-оо-оо

проектирование точек множества А на окружность является ото­ бражением множества А в множество В.

Непрерывным называется отображение /, если любая малая ок­ рестность точки х0 в А переходит в окрестность точки у0 в В.

На рис. 7 приведен один из примеров непрерывного отображе­ ния (отображение окружности в «восьмерку»). Очевидно, что непрерывные отображения происходят без «разрывов», однако они могут иметь «спайки», «склеивания» и т. д.

Весьма важным являются отображения, происходящие без «разрывов» и «склеивания». Подобные отображения называются гомеоморфизмами.

Отображение гомеоморфно, если оно взаимооднозначно и взаим­ но непрерывно (т. е. непрерывно не только отображение /, но и об­ ратное / - 1 ) .

Рассмотрим примеры гомеоморфиых отображений : отображение контура треугольника па окружности (см. рис. 6), поверхность

гири (рис. 8,

о) гомеоморфиа

тору (рис. 8, б). Буквы

Г Л М П С

гомеоморфны

между собой.

Другую гомеоморфную

группу со­

ставляют буквы Е У Т Ч Ш Ц Э.

 

В топологии рассматриваются только такие свойства фигур, которые сохраняются при гомеоморфном переходе от одной фигуры к другой.

Свойства фигур, не меняющиеся при гомеоморфных отображе­ ниях, называются топологическими свойствами фигур, или топо­

логическими

инвариантами.

 

 

-Характерными

свойствами

геометрических фигур треуголь­

ника иметь 3

угла,

для квадрата — 4 угла, для

окружности —

не иметь углов)

не

являются

топологическими

инвариантами

этих трех гомеоморфных фигур.

 

Топологическими инвариантами пользуются для доказательств негомеоморфности двух фигур. Для удобства обращения в качестве инвариантов обычно выбирают числа. Если установлено правило, при котором каждой фигуре ставится в соответствие определенное число, причем числа, соответствующие гомеоморфным фигурам,

68

равны, то это число выражает некоторое свойство фигуры, сохра­ няющееся при гомеоморфных отображениях, это число является топологическим инвариантом.

Рис. 8. Пример топологических представлении

Если для фигур А и В соответствующие им числа оказываются различными, то эти фигуры не могут быть гомеоморфными между собой. К простым топологическим инвариантам можно отнести число компонент (применительно к буквам). Буква Ы состоит из двух «кусков», а ГІ — из одного «куска». Но число компонент — топологический инвариант, т. е. Ы и П не гомеоморфны.

Разбивающие точки: такие, у которых удаление сколь угодно малой окрестности создает несвязную фигуру. Этим свойством обладают центральная точка «восьмерки» и концевые точки отрез­ ка. Окружность не содержит разбивающих точек.

Число разбивающих точек фигуры — топологический инва­ риант (число неразбивагощих точек — тоже).

Индекс точки — число дуг, сходящихся в данной точке. На­ пример, в фигуре буквы Ж крайние точки имеют индекс 1, точки соединения двух лучей — 2, а центральная точка — 4. С помощью понятия индекса точки можно доказать негомеоморфность букв 10 и Ф.

Уникуреальность фигуры определяется возможностью пройти ее всю непрерывным движением, не проходя дважды одной и той же дуги.

Этот топологический инвариант выражается через понятие индекса точки следующим образом: фигура тогда и только тогда уникуреальна, когда она либо совсем не содержит точек нечетного индекса, либо содержит равно две такие точки.

Плоской является фигура, если она гомеоморфна некоторой фигуре, лежащей в плоскости.

Таковы простейшие топологические инварианты.

Еще одно определение. Фигуры, состоящие из конечного числа дуг, называют графами. Граф можно определить так: имеется ко­ нечное число точек (вершины графа), некоторые из которых соеди­ няются непересекающимися дугами (ребра или звенья графа). Две вершины графа можно соединить несколькими ребрами, реб­ ра могут начинаться и кончаться в одной и той же точке (замкну­ тые ребра).

Пример графа приведен на рис. 9.

Числа частей, на которые плоский граф разбивают, не зависит от его расположения па плоскости.

Теорема Жордана.

Всякая простая замкнутая кривая на плоскости (кривая, гомео-

69

Соседние файлы в папке книги из ГПНТБ