Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
3
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

путем минимизации функционала

р

1 V

1

 

m

\ 1

 

 

 

г= 1

 

 

 

 

 

 

( X i - l i ) 2

 

(т - Т , Щ

 

(Xj ~ SiXî/t ~ Г)0

 

 

+

1=0

'

2р,

 

 

CT2(X i)

°4yù

 

o(Xi)o(yi)

 

 

 

 

 

при условиях

 

 

 

 

 

 

 

d F

 

- = 0,

|ж< —li\ < 3a(Xi).

 

 

яГ

 

 

<?Si 5г=5г

 

 

 

 

Пересчет значений & согласно условию (7.30) сводится

нию системы из п нелинейных уравнений вида

 

 

тп

 

 

m

, ,

 

У г - ! , № [ + ( X i - l O Z i e t 1- '

(7.29)

(7.30)

к реше

X j - l i

г=о

 

г=о

+

CT2(X i)

- p i

o(xi)a(yi)

 

 

Vi

2 6iSÎ ш

 

 

 

+

1=0

 

о, г = 1,2, ...,n, (7.31)

 

 

 

CT2(î/i)

г = 1

на отрезке |х< —Sil < 3o(xj).

В процессе решений системы уравнений (7.31) может оказать­ ся, что:

1)корень одного из уравнений принадлежит отрезку |х* —^1 ^

^3o(xj) (значение корня находится методом хорд);

2)корень одного из уравнений не принадлежит отрезку |х* —Sj| ^ ^Зо(Хг); тогда с помощью алгоритма поиска глобального минимума функции находится наименьшее значение функции

Xj

yi - z ^ ï + ( x i - i i ) i l m (-1

 

 

1=0

1=1

+

 

ф(&) = a2(xi)

 

a(xi)a(yi)

 

 

771

 

 

 

Vi ~

S 0«S' m

 

 

 

1=0

E 'o r f S '1'

 

 

°Чу0

 

 

i=1

принадлежащее отрезку |х* —Sil ^ 3o(Xj).

 

Поставленная задача минимизации функционала (7.29) решает­ ся по итерационной схеме, изложенной в §7.11. Дисперсии полу­ ченных оценок находятся с помощью матрицы вторых производных функционала (7.29). Процедура нахождения оценок и их дисперсий аналогична ранее описанной в § 7.2

§ 7.14. Оценка значений параметров в сигноме

Рассмотрим задачу оценки вектора параметров 0 сигнома (са­ мый общий вид многомерного полинома)

к

т

ч=/«,в)=2

П

i = l

j = 1

где aij показатель степени аргумента сигнома, при условии, что все ошибки измерений —независимые нормально распределенные случайные величины с нулевыми средними и известными диспер­ сиями o2(xij) и o2(ui). Функционал (7.10) будет иметь вид

р _ J_ у ' / у '

foü ~ Sij)2 , (Vi ~ /(£ ь Q))2

(7.32)

2

ы \ V“ ï

°2{Xi^

° 1{Vi)

 

Ограничение

6 Di можно записать следующим образом:

 

I%ij

I ^

3o(Xij).

 

Чтобы упростить вид функционала (7.32), задачу минимизации по 0 сводим к задаче поиска минимума квадратичной формы

(7(0) = у 0М 0 + ат0,

где элементы матрицы квадратичной формы А имеют вид

1

п

 

 

ajr+ccjp

 

 

° 2(Vi)

п ij

> г = 1, 2,

р = 1, 2, . . . , к,

Xij значение г-й переменной, полученной в j - м измерении; ат — вектор с компонентами

71

П

г = 1, 2,

Точка минимума формы (7(0) определяется методом сопряжен­ ных градиентов.

Пересчет точных значений аргументов с учетом усло­ вий (7.12) сводится к решению п несвязанных между собой систем

из т нелинейных уравнений вида

x i j

%>ij

, Уг /(£г> 9) d f

__ ~

 

o2(xij)

a2(yi)

dlij

~

(7.33)

г =

1, 2,

7 =

1, 2,

 

 

Здесь

к

 

 

 

 

1 L

 

xV l

rpV-ml

 

У!

®lajixü ‘

 

dlij

X*J

*im »

 

 

1=1

 

 

 

 

= (Çii, • • •, lim) — искомые значения переменных в г-м измерении. Система уравнений (7.33) решалась методом итераций с исполь­ зованием линеаризации исходных уравнений на каждом шаге [25, 42]. Такое упрощение вычислений возможно потому, что в силу условия (7.12) все расчеты ведутся в небольшой области простран­ ства переменных. Таким образом, на каждой итерации в процессе решения системы (7.33) решаются системы линейных уравнений

 

дфз(&)

 

 

 

 

 

dlir

; _ Я г г - 1 Ь ) = - Ъ £ Ь ,

 

Г=1

 

 

 

 

 

 

 

* =

1, 2, . . . , п ,

7 =

1, 2, ...,тп,

 

где ф;(£°) — значение

левой части j-ro

уравнения

системы (7.33)

в точке (точке разложения);

 

 

 

 

 

Vi -

f(li, 9)

fH

_

f j i J L

,

dlir

 

oHyi)

Jb X *

 

a2(Vi)

^ h

дъ&г) _

 

 

f//

Ю 2 ____ L _

r = i

dlir

оЧУг)

°4yù

o2(xtJ)’

 

Здесь

fïijlir = Z

^ j l ^ r l Xü l -

Xij

l=\

 

 

к

 

 

^ . = 2

e ^ - D 4

"

i=l

 

 

<М-1

rpQ-ml

* x ir

xim

. . Æ,

rp^ml

x im *

 

В связи с тем, что уравнения в системе (7.33) замещались приближенными выражениями, в некоторых случаях можно так­ же ожидать увеличения значений функционала (7.32) при новых

точных значениях переменных Çÿ по сравнению с предыдущим шагом итерационного процесса, что приведет к снижению скоро­ сти сходимости процесса и даже к возникновению колебаний. Для устранения этих нежелательных последствий после пересчета ^

те значения

на которых произошло увеличение соответствую­

щих слагаемых функционала

 

 

р = т

( x a - l t j f

( у г - т , в))2

 

j=1

° 2(Xij)

° 2(Уг)

по сравнению с предыдущей итерацией, необходимо заменить зна­ чениями с предыдущего шага.

Элементы ковариационной матрицы ошибок (матрицы рассеи­ вания) для оценок вектора искомых параметров 0 подсчитываются как элементы матрицы, обратной матрице N с элементами

где 0 — полученная оценка вектора параметров 0.

Многочисленные вычислительные эксперименты позволяют сде­ лать вывод о состоятельности рассматриваемых оценок.

Пример. Найти оценки вектора параметров 0 в модели т) = = 0 1 5 , ^ + 0 2 ^ + 0 3 ^ .

Предварительно были взяты значения: 0) = 1, 02 = —1, 0з = 2, 5i = (1, 1, 2, 2, 3 , 3)т, £2 = ( 1, 2, 1, 2, 1, 2)т, и вычислены значения г) =

=(2, 6,1 4,16,48,42)т

Спомощью датчика случайных чисел на точные значения т)

и5 налагались помехи с математическим ожиданием, равным ну­ лю, и дисперсиями, равными 0,020 для Çj, 0,015 для £2, 0,1 для т). Получены следующие реализации:

у = (2,2057; 6,1090; 14,0602; 15,7987; 47,8996; 42,1214)т, х, = (1,0070; 0,9604; 2,0123; 2,0427; 3,0027; 2,9781)т,

х 2 = (1,0011; 2,0159; 1,0142; 1,9916; 1,0233; 1,9861)т. Результат решения регрессионной задачи следующий:

0,р = 0,895, 02р = -0,893, 03р = 1,975.

Сумма квадратов невязок

6

 

(у* —/(ж*, 0Р))2 при этом равна

0,0232.

 

i=1

 

Результатом решения конфлюэнтной задачи являются оценки

0, = 0,984,

02 = -0,979, 03 = 1,999.

Сумма квадратов невязок равна 0,0007. Матрица рассеяния оце­

нок 0 имеет вид

 

 

 

( 0,00025

-0,00022

-0,00002\

-0,00022

 

0,00023

-0,00004 ].

-0,00002

-0,00004

0,00004/

§ 7.15. Анализ систем в активном эксперименте

Пусть проводится эксперимент для определения оценок сво­ бодных параметров 0 функции т) = /(£ , 0), описывающей некоторое распределение. Будем задавать жлюбые значения и измерять со­ ответствующие им значения у, которые можно рассматривать как результат влияния случайной ошибки е на истинное значение rj:

У= г) + е.

Переменная х называется контролируемой, ее значение фикси­ ровано заранее. Однако и на значения х может налагаться случайная ошибка 8: £ = х + 8, т. е. неизвестное истинное значение £ есть слу­ чайная величина. Пусть ошибки 8 имеют нулевое среднее значение. Тогда среднее значение Ç будет равно х, коэффициент корреляции

между £ и 8 равен +1 и структурное соотношение имеет вид

 

у = /(х + 8,0) + е.

(7.34)

Поскольку х не является случайной величиной, то ни е, ни 8 не коррелированы с переменной х. Таким образом, выражение (7.34) представляет собой обычное уравнение регрессии, к которому без всяких изменений можно применять методы регрессионного ана­ лиза, например метод наименьших квадратов. Закон распределения случайной величины /(ж + 8,0) в выражении (7.34) может быть рас­ считан по формулам переноса ошибок. Затем, в соответствии с по­ лученным законом распределения случайной величины /(ж + 8, 0),

14 — 4077

методом максимума правдоподобия может быть составлен функ­ ционал, координаты точки минимума которого будут определять оценку вектора 0 искомых параметров.

Если распределение случайной величины / ( х + 8,0) подчиняет­ ся нормальному закону, то для оценки вектора параметров 0 полу­ чим функционал для метода наименьших квадратов, но дисперсия случайной величины f i x + 8, 0) будет зависеть от значений коор­ динат вектора 0, т. е. соответствующие уравнения для определения оценок 0 будут нелинейными.

Если контролируемая переменная х является случайной величи­ ной (т. е. определяется с помощью некоторого процесса случайного выбора), полученные выше выводы останутся в силе, когда 8 и е не коррелированы с х [40]. Предположение о некоррелированности для ошибки е обычно выполняется, но для ошибки 8 ситуация слож­ нее. Например, требование некоррелированности 8 и х в данном случае означает, что большие значения х не приводят к увеличе­ нию или уменьшению ошибок в определении истинного значения х. Выполнение этого условия может быть проверено только эмпири­ ческим путем.

Заметим, что при неизвестной дисперсии о2(8) или ее оценки в активной схеме эксперимента не идентифицируемы даже свобод­ ные параметры кубической параболы [40].

Рассмотрим в качестве примера задачу оценки свободных пара­ метров 0 в линейном уравнении

Т) = 01 + 02^.

Выражая переменные т) и Ç через х н у , получим структурное соот­ ношение

Vi = 0 1 + 0 2 x i + 0 2 ^ i + Ег-

Пусть независимые случайные величины 8 и е подчиняются нормальному закону распределения с нулевыми математическими ожиданиями и известными дисперсиями o2(xi) и a2{yi). Функции плотности вероятности случайных величин 028* + е* будут иметь следующие числовые характеристики:

М[0г8г + Ei] = 0,

О2[0г8г + Ег] = 02<72(Xi) + С2(Уг), I = 1, 2, ..., П.

В данном случае функционал метода наименьших квадратов, точка минимума которого определяет оценку вектора параметров 0, имеет вид

Р = У (Уг ~ 01 ~ 02Д»)2

(7.35)

“ o2(yi) + Ql<j2(xi)'

Рассуждая аналогично, получим функционал метода наимень­ ших квадратов для оценки вектора параметров 6 линейных функций

 

771

 

 

= 00 + 2

bjlj\

 

3 = 1

 

структурное соотношение в данном случае имеет вид

771

 

771

 

Уг = 6р + У

QjXji +

^

Qjbji + £j.

j=1

3=1

 

Числовыми характеристиками случайной величины Y, Qjbji + е*

ЯВЛЯЮ ТСЯ

 

 

j=\

 

 

 

м 2 Qjbji + 1

= о,

•j=i

 

 

 

2 Qjbji + ti

= a2(yi) + J ] 0fêixji),

Lj=l

J

 

j=1

функционал метода наименьших квадратов в этом случае записыва­

ется в виде

т

\ 2

 

(

 

2/г 00

®jxji)

 

 

 

F = }_i---------------------- •

(7-36)

г=1 <Т2(3/г) + £ Qj°2(Xji) j = 1

Функционалы (7.35) и (7.36)—те же, что и в пассивной схеме эксперимента.

Рассмотрим функцию

771

г) = 0о + 2

3 = 1

14*

где (pj(Ç) — функции произвольного вида. Тогда структурное соот­ ношение имеет вид

771

Уг = 00 + 2 Qj'Ÿj(Xi + bi) + Еi.

3 = 1

Здесь не всегда можно выделить случайную составляющую, присутствующую в срj(xi + 8j). Метод максимума правдоподобия (ММП) и в этом случае позволяет получить функционал, точка ми­ нимума которого дает оценки вектора 0 искомых параметров. Вид функционала ММП и способ получения вектора оценок 0 опреде­ ляются конкретным видом функций фj(x).

В работе [30], чтобы упростить задачу получения оценок 0, функции ф^-(х) разлагают в ряд в окрестности точки xf.

М[Уг] = 9ТфОг) + 0 ( а 3(Хг)),

1 ^2

Ф Д х О = Ь ( х г) + - 0 2( X i ) t r ^ 7 ,

где tr А — след матрицы А, М[у*] — математическое ожидание зна­ чений y i . Дисперсия значений ф^-(^) записывается в виде

М[(Уг - м [yi])2] = a2(yi) + CT2(Xi)0T| ^ ^ 0 + О (а 3(я 0).

Задача свелась к классической регрессионной задаче, оценки па­ раметров 0 находятся итерациями по методу наименьших квадратов

с учетом того, что

Уг = 0Тф(Жг) + pi,

Ы х) = 9j(x) + у о2(х) f ]

M [pi] = 0, М[р?] = о2(уд + о \ х ^ g 0 + 0 (a 3(xi)).

Для линейных функций по этим формулам получим тот же функционал (7.36), что и в пассивной схеме эксперимента. Для нелинейных функций оценки, полученные при обработке одних и тех же данных различными методами, будут существенно отли­ чаться (очевидно, что экспериментальные данные должны обра­ батываться тем методом, который следует из условий проведения эксперимента и статистики результатов наблюдений).

Г л а в а 8

ПРИНЯТИЕ РЕШЕНИЙ ПО ВЫБОРКЕ ФИКСИРОВАННОГО ОБЪЕМА С УЧЕТОМ ПОГРЕШНОСТИ ПРИЗНАКОВ

§ 8.1. Статистические свойства параметров функции Гаусса, определенных непосредственно

и с помощью операций линеаризации

Случайные величины, распределенные по нормальному закону, наиболее часто встречаются в практических приложениях, посколь­ ку сумма даже трех соизмеримых равномерно распределенных слу­ чайных величин имеет в результате распределение, близкое к нор­ мальному. Плотность распределения вероятностей в данном случае имеет вид функции Гаусса. В приложениях часто функцию Гаусса

путем преобразования координат сводят к уравнению прямой

а

где tip—р-квантиль случайной величины х с функцией распре­ деления вероятностей F(x), т. е. такое значение аргумента функ­ ции F(x), для которого вероятность события х < и р равна заданно­ му значению вероятности р.

Представим (рис. 8.1) на плоскости х, ир прямую, полученную в процессе линеаризации функции Гаусса. Эта прямая пересекает ось абсцисс в точке L ( X L , 0), а горизонтальную прямую хр = —1 в точке N (X N , —1). Координата x i определяет оценку параметра а, т. е. a = x i , a разность абсцисс точки L ( X L , 0 ) и точки N (x^ , —1) определяет оценку параметра ст, т. е. S = хь хщ.

up J

xN

0 -1

i

X

 

Рис. 8.1. Линеаризация функции Гаусса

 

Таким

образом, рассматривая уравнение прямой в

виде т) =

= 01 + 0г5,

получаем, что оценка 0i будет определять

величину

a/о, а оценка 02 — величину 1/а.

Исследуем одновременно статистику параметров а и а 2 и па­ раметров 01 и 02, чтобы понять особенности процедуры линеари­ зации. Начнем рассмотрение с операции линеаризации. При опре­ делении свободных параметров 0] и 02 уравнение прямой часто записывают в виде

Т) = 01 + 02(5-1),

где \ среднее значение величины £. Оценки 0', и 02 статистически

независимы, однако^это утверждение не выполняется для оценок 0) и 02. Оценки 0', и 02 параметров можно получить, не решая сов­ местных систем связанных уравнений, как это приходится делать при другой форме записи модели.

Для нормально распределенных статистически независимых

погрешностей экспериментальных точек (ж*, yî)

минимизируемый

функционал имеет следующий вид:

 

 

 

 

р = у (

(■xi - ^ )2

, (Vi -q»)2^

 

f -Д

a2(Xi)

 

С2(уг)

) '

 

1=1 х

 

 

 

7

 

Из условий (7.11) и (7.12) получим

 

 

 

Р2Щ х j + 0202(Xj)(yi ~ 01 )

 

Тогда

02(Уг) + 0202(Xi)

 

 

 

П

 

 

 

( V i - 9 | -

02Ж»)2

 

 

 

 

 

 

 

o2(yÙ+ Q2o2(xi) =

i2=1

0 1

“ 02 Xi)2,

Г д е W 1 = 0 2 ( j /t ) + 0 2 O 2 ( X i) .

Соседние файлы в папке книги