Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
3
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

или

Vi = f(X i - Ьи 0 ) + ti

при аддитивных помехах 8*, е*.

Таким образом, в поставленной задаче следует отметить две проблемы:

1)как ввести в рассмотрение погрешность аргумента;

2)как минимизировать функционалы при отыскании точечных оценок параметров после введения в них оценок аргументов или выражений для них, так как эти функционалы имеют сложную фор­ му и соответствующие системы уравнений для определения этих оценок нелинейны (известно, что каждая нелинейная система тре­ бует особого рассмотрения каждого решения).

Наиболее часто выборка случайных величин имеет распределе­ ние Гаусса. Найдем (в качестве примера) для этого распределения вид функционалов, из которых затем могут быть получены оценки искомых параметров (для других функций распределений экспери­ ментальных данных процедура получения минимизируемого функ­ ционала будет аналогичной).

Пусть экспериментальные значения Xi и у» — случайные вели­ чины, каждая из которых имеет функцию плотности распределения вероятностей, описываемую функцией Гаусса с математическими ожиданиями \i и т)*, дисперсиями o2(Xj) и o2(j/i) и коэффициентом корреляции pi = p(xi, yi). Тогда плотность вероятности получения точки с координатами (xi, у*) имеет вид

Pi =

где

Совместная плотность вероятности получения п независимых таких точек является функцией

П

ИЛИ

In Ц х , у) = - у 2

( X i - Ç i ) 2

( X i - l i ) ( y i - Г ) 0

( j / i - Г ц ) 2

^ s r

_2f" oÇti)o(a/i)

+

г=1

 

 

 

1

 

 

 

7 + const.

 

 

 

1— Pi

Оценки искомых параметров 0 находятся из условия минимума функционала

1 п

(Xi-li)2

(Хг -

li){yi ~ T)i)

(yi - Г)02

' - т Е

------------- ^ p i

-------,

------ 1-------------

(7.18)

0 2 ( X i )

a(xi)a(yi)

°4Vi)

г=1

 

 

 

 

В частном случае, когда погрешности не некоррелированы, вы­ ражение (7.18) принимает вид

( Xj ~ Zi?

(Уг ~ Г)г)2

(7.19)

а 2 ( х , )

0 2 ( y i )

 

Аналогично находят вид минимизируемого функционала при других законах распределения исходных данных. Чтобы перейти в выражениях (7.18), (7.19) к случаю, когда переменные являются детерминированными, следует положить = х* или т)г = Уг-

Теперь рассмотрим задачу отыскания минимума функционала типа (7.18) по параметрам 0 при условии, что задан вид функции

т) = f ( l , 0 ).

Нам не известны истинные значения £ (абсцисс) эксперимен­ тальных точек, а известны только их доверительные области, тогда как в регрессионном анализе абсциссы известны, причем случай­ ная величина х коррелирована с обобщенной ошибкой функции т) (например, для линейной функции т) = 0i + 0г£ обобщенная ошибка равна е —02§)-

Перед тем как определять точки минимума функционалов (7.18) и (7.19) по 0, необходимо каким-то образом определить £*, а толь­ ко затем, подставив выражения для ^ и r]j в функционал, найти минимум получившейся функции нескольких переменных.

Выход любой системы в виде набора значений у содержит ин­ формацию не только о параметрах 0 модели, но и о действительных значениях входного воздействия £. Искомые оценки 0 определяются

из равенства

(7.20)

Однако в уравнениях (7.20) истинные значения \ неизвестны.

Чтобы найти их оценки доопределим задачу следующим образом:

 

 

(7.21)

Очевидно, получаемые оценки

значений

должны принад­

лежать области неопределенности

Di измеренных величин х*,

i = 1,2 , ... , п, т. е. Ç* е Di. Когда известен закон распределения по­ грешности измерения величин х*, это условие может быть выраже­ но в более конкретной форме: при нормальном законе распределе­ ния случайной величины х* можно считать, что |xj — ^ ko(xi), где значение коэффициента к определяется выбранным значением доверительной вероятности.

Таким образом, решение задачи минимизации функциона­ ла (7.19) при условии (7.21) эквивалентно решению системы урав­ нений

при

(7.23)

Для функций, линейных по параметрам 0, система уравне­ ний (7.22) является системой линейных алгебраических уравнений. Система (7.23) для линейных по \ функций представляет п не свя­ занных между собой систем из т линейных уравнений.

Замена нормального закона распределения другим, например законом Пуассона или Лапласа, приводит к системе нелинейных уравнений (7.22).

При учете корреляции погрешностей величин хг и уг формулы усложняются, а при учете корреляции погрешностей значений хц и хц нельзя разбить систему из т п уравнений на п независимых

систем, в этом случае придется решать систему линейных уравнений в п раз большей размерности, чем при независимых пере­ менных хц и Х{2. Учет корреляции погрешностей всегда ухудшает обусловленность системы уравнений (7.22).

Условие (7.23) для нелинейных функций т) = /(£ , 0) имеет вид п независимых систем из т нелинейных уравнений, которые мож­ но решать методом линеаризации. Сходимость итерационного про­ цесса при этом обеспечивается малостью допустимых интервалов для I.

Таким образом, сначала решают регрессионную задачу нахож­ дения вектора оценок 0 при значениях = Xi, i = 1,2, ... , п. По­

лучают первое приближение для оценок 0. Затем определяют точ­ ные значения при этом проверяют принадлежность новых зна­ чений области возможных значений Д переменной Х{. Эти дей­ ствия повторяют до тех пор, пока не выполнится одно из условий:

а) на очередном шаге значение функционала (7.19) меньше за­ данного числа у;

б) на соседних итерациях значение функционала F и значения оценок параметра 0 мало отличаются, т. е.

max

где Yi и у2 — заданные числа;

в) исчерпан лимит итераций.

Дисперсии оценок параметров находят с помощью матрицы вто­ рых производных по 0 от функционала (7.18) (см. § 7.6).

В работах [20-24] рассмотрено применение конфлюэнтного ана­ лиза для основных элементарных функций: прямой линии, линей­ ных многомерных функций, полиномов, систем линейных алгебра­ ических уравнений, сигномов, кубических сплайнов.

Например, для линейной функции г\ = а£ + Ь с учетом выра­ жений (7.19), (7.23) получим следующий минимизируемый функ­ ционал:

г=1

если исходным был функционал (7.19), а значения & определим по формуле (согласно (7.23))

г . _

< ^ (y i)x j + g q ^ i i X ÿ i - b)

1

o 2( y i) + a 2a 2( x i)

и подставим затем в функционал (7.19).

Выражение в знаменателе o 2(yi) + а2о2(х,) можно рассматри­ вать как сумму дисперсий левой и правой частей г-го уравнения. Такой подход используют при оценке параметров функции многих переменных.

В случае, когда функция т) является аналитическим описанием плотности нормального распределения, возникают трудности в на­ хождении оценок параметров, так как функционал (7.19) в данном случае имеет сложный вид. Поэтому оценки параметров и истин­ ные значения Si находят итерационными методами, предварительно определив «хорошее» нулевое приближение.

§ 7.10. Анализ других методов оценки параметров функции известного вида с учетом ошибок

в значениях функций и аргументов

Предположим, что ошибки измерений е* и 8* — нормально рас­ пределенные случайные величины с нулевыми средними значени­ ями, дисперсиями o2(yî) и a 2(xj) соответственно и коэффициентом корреляции pi = 0.

Рассмотрим несколько подходов к решению задачи оценки па­ раметров функции известного вида.

I. В одном из подходов используют вместо истинных значе­ ний Si значения наблюдаемых ж» при оценивании параметров МНК, т. е. ошибка измерения игнорируется, в результате получают сле­ дующую модель:

у= f(x , 0) + е.

Восновном, как показано в [20, 30, 40], этот подход приводит

кнесостоятельной оценке с большим асимптотическим смещением. И. В работе [96] рассмотрена задача, когда S является случайной

величиной, не зависящей от е » и 8 j , с характеристиками M(S) = р ,

cov(£) = Dç. Значения Ç* аппроксимируются результатами измере­ ний Xi, и при нормальном законе распределения случайной величи­ ны полагают

D(Ç | х) = хЛ + [i(I - Л),

где Л = (Dç + a 2(æ)/)_ 1Dç, / — единичная матрица. Получаем функцию

у = f(x A + [i(I - Л), 6) + е.

Если [i и А не известны, то, используя исходную выборку х^ г = 1,2, ... , та, определяем оценки р, Л и получаем модель

у = f( x А + р(1 - Л), 0) + 6 = f ( l 0) + е.

(7.24)

Оценки параметров модели (7.24) могут быть определены МНК. Например, для прямой линии т) = а \ + Ъимеем

о2(х) \

1 = х

о 2( х ) + a l

ст2(х) + о § / ’

где OQ— дисперсия ошибки 5*, а2(х) дисперсия вариационного ря­ да х. Минимизируемый функционал примет вид

тр_

Е [у» -*)(& ,б)]2

Е [(î/г - ь - ар)(а2(х) + а\) - (xi - р)аа2(х)]2

i—1_ _ _ _ _ _ _ _ _

г=1

(а2(х) + o20)W (y)

где а2(у) дисперсия вариационного ряда у.

В случае, когда функция /(£ , 0) нелинейна по параметрам, ис­ пользуют разложение ее в ряд Тейлора в окрестности точки %[30, 96]. Например, при нормальном законе распределения с параметрами 0i и 02, используя формулу т) = /(£ ) + f'(Z)(x - £), получим

1

(

(X - 0 !)2Ï |

 

Т)%

 

202 }1х=1 +

 

л/2^02 еХР (

 

1

 

Г

( х — 0 i ) 2 1 1

Г

+ Æ

02eXPl

202 / 1 = |1

= Ж ехр{ -

Оценки параметров 0i и 02 найдем из условия минимума функ­ ционала

% [т - т)(&, 0)]2 тр_ г=1

III. Поставленная задача может быть решена итеративным мето­ дом наименьших квадратов с уточняемыми весами [30, 75, 76, 102].

Предполагается, что х*, i = 1,2,..., п, является выборкой из не­ которой генеральной совокупности с функцией плотности рас­ пределения f(xi, 0). При этом первые моменты функции f(x{, 0) известны и конечны. В данном случае для построения минимизи­ руемого функционала F необходимо знать вид функции плотности распределения /(х*, 0) или ее моменты.

Для определения моментов в [102] предлагается использовать разложение функции /(х*, 0) в ряд Тейлора в окрестности точки хо*. Тогда первый и второй моменты функции плотности распределения /(xoi, 0) находят по формулам [102]:

М(Уг I Х 0г) « /(Х г , 0),

‘dfjxji 0) 02(Уг I Z0г) » 02(Уг) + . dxi

Итерационный процесс нахождения оценок вектора парамет­ ров 0 строится следующим образом.

1. Составляется функционал

71

^0 = 2 “ М(Уг I x0i)ŸWi, i=1

где = а ~ 2(уг), и определяется оценка вектора параметров 0°, при которой достигается минимум функционала FQ, т. е. решается ре­ грессионная задача.

2.Определяются величины wj = a2(yi | яоО-

3.Составляется функционал

71

Fl = Y l

I x 0i)Ÿwi

(7.25)

 

2=1

 

 

и определяется оценка вектора параметров 01.

Операции 2 и 3 повторяют до тех пор, пока относительные изменения параметров на соседних итерациях не будут меньше не­ которой малой величины у:

max q - e r *

^Y>

j = 1,2,

 

q

 

 

 

 

Рассмотрим применение данного метода для линейной функ­

ции ï)i = axi + b:

 

 

 

 

М(yi I ход » ахи +

b,

a2(yi \ xoi) * o2(yi) -I- a2o2(xi).

Функционал (7.25) примет вид

 

 

p _

(y» ~

axi ~ b)2

 

1

f - j

o2(yi) +a2a2(xi)'

 

 

%—1

 

 

 

Для нелинейного случая, например для функции плотности,

имеющей нормальное распределение, получим

 

M(2/i 1X0i) *

Т/Ш г еХР{ “ ( ° 20i °

} ’

 

 

Ч -т )

q

СТ2(Уг I ®0») ~ о(Уг) +

 

 

 

(01 - х0<)т

 

 

 

o 2(Xi).

>/2x 0:

 

 

 

Подставив эти выражения в функционал (7.25), определим оцен­ ки параметров 0] и 02-

В статье [102] приведены асимптотические свойства получае­ мых оценок. В [30, 75, 76, 102] исследуются также статистические свойства оценок и вопрос о сходимости итерационного алгоритма получения оценок.

IV. В работе [95] предложен метод, позволяющий учитывать ошибки переменных Xi для линейных моделей.

Допустим, что задана модель с известными дисперсиями оши­

бок О 2 И CTgl

 

 

 

Ух

-}■ЬЧ" £î, Хх

Z 1, 2, ..., Т1.

Традиционными методами, например МНК, определяют оцен­ ки параметров а и b модели, считая, что Xi — детерминированные величины. Следовательно, теперь мы имеем модель с известными

параметрами:

У г ~ Ь = a Z i + t u

X i = £ i + & i, г = 1 , 2 ,

или, в матричном виде,

Получили регрессионную модель, где Çi — неизвестный пара­ метр, подлежащий оцениванию. Оценки Ç» определяют из выра­

жения

Ь = « а , 1 ) 2 - 4 0 , 1) т ) - ‘ ( 2 , О Е - Ч з / г -ь, X i f ,

где Е = diag(Og, о[|).

Последнее выражение можно преобразовать следующим об­

разом:

 

Ь - Са2о\ +

- 6)2 + о ^ ) .

Дисперсии оценок определяют по формулам

D(fi) = ((2 ,1)Е_ 1(2, 1)т)-1,

или

D(fi)= (à2ol + Og)-1

Далее уточняют оценки параметров о и 6 при^новых значениях аргументов Затем снова определяют оценки Итерационный процесс продолжается до тех пор, пока относительные изменения параметров на соседних итерациях не будут меньше некоторой ма­ лой величины у:

0f —0

> - i

max

^ у, j = 1,2.

в1

 

Для линейных моделей мы получили функционал и формулу для расчета значений &, аналогичную приведенной в § 7.9. Таким образом, в качестве единого подхода к задаче нахождения оценок параметров моделей с учетом погрешностей в значениях функции и аргументов могут быть использованы методы конфлюэнтного ана­ лиза, описанные в [20-24, 40].

§ 7.11. О единственности оценок параметров. Состоятельность оценок и алгоритм их получения

Функционал (7.19) является самым простым, и даже он нелине­ ен по 0 в случае оценки параметров 0 уравнения прямой при одно­ временном учете погрешностей и в значениях функции, и в значе­ ниях аргумента. Поэтому возникает вопрос о единственности оце­ нок искомых параметров, который тесно связан с выбором нулевого приближения оценок. Естественно рассмотреть в качестве нулевого приближения решение регрессионной задачи (например, по методу наименьших квадратов).

Из условия (7.12) следует, что для одной и той же задачи ми­ нимальное значение функционала в методе наименьших квадра­ тов больше минимального значения функционала (7.10), поскольку условие (7.12) является условием ортогональности вектора каса­ тельной к функции т) = /(£ , 0) в точке (£гь • • •, £гт> т]г)> принимаемой за «истинную», и вектора, проведенного через исходную точку ( х ц , ..., Xim, yi) и точку, принимаемую за «истинную». Таким об­ разом, минимизация функционала (7.10) при условии (7.12) приво­ дит к минимизации суммы квадратов «наикратчайших расстояний» от точки (хц, • • •, X jm , уг) до кривой, тогда как в методе наимень­ ших квадратов минимизируется сумма квадратов отклонений при фиксированных значениях X ÿ .

Для конкретных видов функции г) = /(£ , 0) в работах [21, 23,40] получены условия существования единственного решения. Покажем существование единственного решения для линейных

функций

771

впредположении, что:

1)погрешности е и 8 статистически независимы и подчиняются нормальному закону распределения;

2)за нулевое приближение взято решение регрессионной зада­ чи [21, 23].

Эти ограничения обусловлены тем, что с помощью преобразо­ ваний координат функция Гаусса, описывающая нормальный закон распределения, сводится к уравнению прямой линии и оценки

Соседние файлы в папке книги