Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
2
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

параметров этой прямой будут однозначно связаны с оценками па­ раметров функции Гаусса.

Теорема 1. Если погрешности tu b измеренных случайных вели­ чин х и у статистически независимы и распределены по нормаль­ ному закону с известными числовыми характеристиками функции плотности распределения вероятностей и если в качестве нулевого приближения принято решение соответствующей регрессионной задачи, то достаточным условием единственности оценок пара­ метров линейной функции

т

 

Т) = 00 + 2

Bjlj

3=1

 

является выполнение неравенства

х2 > (1 тп/тг)д2(у). Здесь

д2(у) —оценка дисперсии значений у{ при равноточных измерениях.

Д о к а з а т е л ь с т в о . Для простоты формул величины o(®ÿ) и o(yi) приняты равными единице. Функционал (7.10) с учетом условия (7.12) для линейных функций имеет вид

 

П

/

771

\ 1 2

 

,

£

[Уг ~ 00 - £

ûjZy )

 

1

»=1\

j=l

/

(7.26)

 

 

 

771

 

 

 

 

+ £ е =

 

 

 

 

 

3 = 1

 

 

При фиксированных Bj,

j

= 1,2,

функционал (7.26) от­

носительно переменной 0о есть парабола и любое начальное зна­ чение 0Q приведет к единственной оценке. Для переменных Bj, j = 1 ,2 ,...,т , функционал (7.26) монотонно возрастает с увели­ чением разности Bj — Bj от точки минимума вправо до горизон-

 

 

т

п

 

тальной

асимптоты, равной

2

2 ХЬ> и

влево —до точки мак-

 

 

3=1»=1

 

симума,

а затем монотонно

убывает до

той же горизонтальной

асимптоты. Для доказательства теоремы достаточно указать, когда соответствующий регрессионный функционал Фр станет меньше

тп

2 2 ХЬ> в этом случае начальное приближение попадает в об-

J = 1 i = l

ласть выпуклости функционала (7.26). В точке минимума име­ ем Фр = (п —т)д2(у). Для единственности оценок параметров Bj

должно выполняться условие

771

П

Фр = (п - т )а 2(у) < 2

2 ХЬ =

j =\ i—1

ИЛИ

*2 > (1 - 7г)®2(1')-

Теорема доказана.

В рассматриваемом случае дисперсии значений у* известны и могут быть использованы для проверки достаточного условия.

Можно сформулировать и более строгие условия, когда зна-

771

71

 

чение Фр в точке минимума будет меньше 2

г?.

и в то же

2 xVIïJ

j = 12=1

 

время точка минимума функционала Фр будет принадлежать строго выпуклой области функционала (7.26). Для этого следует прове­ рить любое достаточное условие строгой выпуклости функциона­ ла (7.26) в точке минимума регрессионного функционала.

Условия строгой выпуклости функционала F, а тем самым и единственность его точки минимума [42, 46] устанавливаем согласно теоремам [46], по которым достаточным условием строгой выпуклости функционала F является положительная определен-

d2F

ность матрицы М = ао , а для того чтобы матрица М была

7\у[ U Vf*

положительно определена, необходимо и достаточно, чтобы каж­ дый из определителей

d2F II

d2F

 

det д%2 1

det dQidQr

l,r = \,2 ,...,n ,

был положителен.

Сформулируем достаточные условия того, что регрессионное решение принадлежит области строгой выпуклости функциона­ ла (7.26) в случае оценки свободных параметров прямой линии.

Теорема 2. Достаточным условием того, что регрессионное решение при оценке параметров уравнения прямой линии r)= 9o + 9i£ принадлежит строго выпуклой области функционала (7.26), явля­ ется выполнение неравенства

Д о к а з а т е л ь с т в о .

Действительно,

определитель det

ô2F

положителен

всегда.

В

точке минимума

регрессионного

функ-

 

 

П

 

 

 

 

 

П

 

 

 

 

ционала, когда £ ( ю

-

-

0iZ j) = 0

и

Ц(Уг 00 -

0i®*)®< = 0,

имеем

 

г= 1

 

 

 

 

 

г=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d2F

 

 

 

 

 

 

 

 

 

 

 

 

det 50od0i = (1 + 0?)

г=1

M=1

х Л

 

 

 

 

 

 

 

 

 

L

'

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ п{30? -

1) YiiV i -

00 - 01 X i ) 2 .

 

 

 

 

 

 

 

 

 

 

i — 1

 

 

Это выражение положительно для любого 0о и

|0j | > 1/л/З.

Для |0i | ^

1Д/3 функционал будет выпуклым, если

 

 

 

п

 

/ п

\ 2"|

 

 

п

 

 

 

(1 + 0?)

П 2

x i ~

( 2

Xi )

> n^30i -

 

Y i(yi ~ е° - 0iæi)2

 

г= 1

М= 1 '

-I

 

 

г=1

 

 

 

Заменим величину 2(Уг -

01ж»)2 на (п - 2 )а2(у). Тогда по-

лучим

 

 

 

г=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

" i>< -

 

( f > < ) 2 > n'<n ~

 

1

1)'82(1,>-

 

 

г=1

\i=l

/

 

 

 

 

 

 

Правая часть последнего условия имеет максимум при 0j = 0 , т. е. для любого 0i условие того, что регрессионное решение при­ надлежит области выпуклости функционала (7.26), имеет вид

2

xi - “ ( s

> ( п - 2)3\у).

г=1

' г=1

'

Теорема доказана.

Условия, обеспечивающие попадание регрессионного решения

ввыпуклую область функционала (7.10), для других функций не­ сложно проверить на компьютере, но достаточно сложно выразить

вявном виде. Методом статистических испытаний было показа­ но, что при оценке параметров нормального закона распределения (от одномерного до пятимерного) без применения каких-либо пре­ образований координат итерационный процесс сходился, если ну­ левое приближение отличалось от истинного значения не более чем

на 40 % при относительных погрешностях наблюдаемых значений признаков, составляющих % 10%. Такую точность получения нуле­ вых приближений обеспечивает регрессионный анализ.

Для функций т) = /(£ , 0), линейных по вектору параметров 0, единственность оценки и сходимость нулевого приближения к оце­ ниваемым параметрам при нормально распределенных исходных данных определяются только методом нахождения оценки £, так как при фиксированном векторе оценок £ система уравнений (7.11) является системой линейных алгебраических уравнений с детер­ минантом, не равным нулю. Для этих функций из условия (7.12), в принципе, могут быть найдены несколько наборов значений {£}, каждый из которых принадлежит области возможных значений при заданных значениях {Х{}. В такой ситуации нет оснований отдавать предпочтение какому-либо одному набору значений {£} и, строго говоря, решение будет не единственно.

Рассмотрим вопрос о состоятельности вектора оценок параметров 0 в конфлюэнтном анализе, если оценка £ находится в силу условия (7.12).

Теорема 3. Если оценки параметров прямой т) = 0о + 0i£ нахо­ дятся как координаты точки минимума функционала (7.26), то они определяются по формулам

i=i

где

вц ,12 = — d )± y/(d — ‘w)2 + 4c2j ,

Д о к а з а т е л ь с т в о . Решим систему алгебраических уравне­ ний, обеспечивающую необходимое условие экстремума функци­ онала (7.26):

Из первого уравнения следует, что выполнено равенство

г=1

Исключив из приведенной системы уравнений величину Go, по­ лучим для оценки G] квадратное уравнение

с0[ + ( d - w)Bi —с = 0,

корни которого и есть 0ц и б^. В данном случае нет необходимости применять достаточные признаки экстремума, чтобы определить, какой корень отвечает точке минимума функционала (7.26). Из се­ чений функционала F видно, что меньший корень отвечает точке максимума, а больший —точке минимума. Теорема доказана.

Теорема 4. Если оценки параметров прямой т) = Go + 0i£ нахо­ дятся как координаты точки минимума функционала (7.26), то они состоятельны.

Д о к а з а т е л ь с т в о . Докажем состоятельность оценки 0i. Обозначим si, s2y и sxy соответственно выборочные дисперсии наборов {xi}, {уг} и выборочную ковариацию величин х» и у{. Тогда

w — d = —

п

В соответствии с результатами работы [40, гл. 10] выборочные дисперсии si, s2 и выборочная ковариация sxy сходятся по вероят­ ности к своим математическим ожиданиям:

s i

+о2(х)

=Sç + 1,

n-юо,

Sy->0]Sç +о2(у)

=0]Sç + 1,

п - * оо,

4 y - * 0lSÇ> П^ОО,

где Sç—дисперсия ненаблюдаемой величины Ç. Теперь из квадрат­

ного уравнения сЩ + (d — w)B\ — с 0 имеем

S

S|(0? - 1) ± д/«|(в? -

I)2 + 4S|6?

(0 2 _ 1)±(02 + 1)

Уп’12

20lS2

_

20,

 

011 = 01,

012 = —oi

 

Отсюда следует, что оценка 0ц, соответствующая точке мини­ мума функционала (7.26), состоятельная. Докажем теперь состоя­

тельность оценки 0о:

 

 

j

П

j п

л

00 = - У! Уг -0 1 - y . X i = ÿ - Q i x - > ÿ - 0 , x .

п

•—*

п

 

 

i= 1

г=1

 

Согласно [40]

имеем

у —»• 0о -t- 0iÇ,

х —►£, т.е. 0o = 0o + 0i£ —

—в 1Ç = 0о — оценка состоятельная.

Если в качестве ti берут значения х*, то оценка 0, не будет состоятельной. Рассмотрим случай, когда 0о = 0. Тогда

п

значит, при п —►оо находим, что оценка

несостоятельна.

Следствие 1. Если оценки параметров В из уравнения Г) = 0о +

т

+ 2 0j£ j находятся как координаты точки минимума функциона-

J=1

ла (7.10) и оценки Ç находятся из условия (7.12), то полученные оценки В будут состоятельными.

Следствие 2. В условиях теоремы 4 нулевое приближение мо­ жет отличаться до 100% от истинного значения оценок искомых параметров.

Действительно, согласно теореме 4 разность оценок парамет­ ра 01 составляет

011 - 0 1 2 = 0 1 + (Г > 01-

01

Учитывая свойства функционала F и получающихся оценок, задачу минимизации функционала F при условии (7.12) решают по следующей схеме.

Шаг 1. Задают начальные значения переменных \ (результаты наблюдений х ) и определяют минимум по 0 функционала F при фиксированных 2;. В результате получают первое приближение для оценок искомых параметров 6.

Шаг 2. Точные значения переменных пересчитывают с уче­ том ограничения (7.12) при полученных приближениях для оценок параметров 6. Для уменьшения числа итераций полезно проверить условие принадлежности нового значения Çÿ области возможных значений при заданном хц.

Шаг 3. Минимизируют функционал F по 0 при новых точных значениях переменных £.

Шаги 2 и 3 выполняют поочередно до тех пор, пока не будет выполнено хотя бы одно из трех условий:

1) на очередном шаге значение функционала (7.10) меньше за­ данного числа si;

2) на соседних итерациях значения функционала F и оценок параметров 0 отличаются несущественно, т. е.

V+1

max

—©7+1

^ 82, / = 1, 2, . . . , * ,

 

 

Щ

 

где 8] и 82 —заданные числа;

3)исчерпан заданный лимит итераций.

Шаг 4. После нахождения точечных оценок 0 определяют дис­ персии оценок.

Из приведенного алгоритма следует, что на первой итерации получается регрессионное решение (иными словами, решение, по­ лученное любым из применявшихся ранее традиционных методов). На последующих шагах это решение уточняется. Такой переход от традиционных методов к предлагаемому важен в практических приложениях.

§ 7.12. Оценка параметров многомерной линейной модели

Линейные модели широко применяются в статистических за­ дачах принятия решений, например при нахождении разделяющих поверхностей в задачах распознавания образов.

Рассмотрим применение описанного метода к решению задачи определения оценок параметров линейной модели

ч = /&е) = 2 е&

г=1

и к решению систем линейных алгебраических уравнений с по­ грешностями в матрице системы и в правой части уравнений, если ошибки измерений —независимые нормально распределенные слу­ чайные величины с нулевыми средними значениями и известными дисперсиями а2(х ф и o2(yj).

Вэтом случае функционал (7.10) будет иметь вид

лт ( п

(7.27)

j = 1 V = i

а ограничение Üû е D* можно записать следующим образом:

\xij

\ij I sS 3a(xij).

(7.28)

Здесь для упрощения вида функционала (7.27) ошибки измере­ ний считаются статистически независимыми.

Задача минимизации по 6 функционала (7.27) при фиксирован­ ных значениях £ является обычной задачей регрессионного анализа. Исследования показали, что для обеспечения минимального време­ ни счета и большей точности лучше всего на первом шаге решать систему линейных уравнений при ^ = х ^ методом Гаусса с выбо­ ром максимального элемента, а затем непосредственно минимизи­ ровать по 0 функционал (7.27) методом сопряженных градиентов. Учитывая вид функционала (7.27), задачу минимизации по 0 легко свести к задаче поиска минимума квадратичной формы

G(0) = у вТАв + ат0,

которая и решалась методом сопряженных градиентов. Здесь 0 — вектор искомых оценок параметров; А матрица квадратичной формы, элементы которой вычисляются по формуле

т

А Гр

/ j

о/- \ VCrjŒpj?

Г 1, 2, . . . , 71, р = 1, 2, . . . , 71,

 

а

U/jj

 

хг:7 — значение r -й переменной, полученное в j -м измерении; ат — вектор, компоненты которого имеют вид

а

Уз

ЬГ]>

г = 1, 2, . . . , п .

(Уз)

j=i

 

 

Пересчет точных значений Ç на основании условий (7.21) сво­ дится к решению т несвязанных между собой систем из п линей­ ных уравнений вида

S

QrQp г .

_

xpj

, QpVj

г=1

°2(Vj)Çrj cr2(Xpj)

 

0 2(xpj)

o\yjY

 

P = 1 »2, . . . , n, J

=

1, 2,

 

Полученные новые значения \ должны удовлетворять усло­

вию (7.28). В противном случае те

 

которые выходят за указан­

ные границы, заменяют на значение ближайшей граничной точки.

В связи

с этим иногда можно ожидать увеличение функциона­

ла (7.27)

при новых точных значениях вектора переменных \ по

сравнению с предыдущим шагом итерационного процесса. Это приводит к снижению скорости сходимости процесса и даже к воз­ никновению колебаний. Для устранений таких нежелательных по­

следствий после пересчета \

те наборы {£_,}, на которых произошло

увеличение соответствующих слагаемых функционала

 

п

/

(

П

\^

 

г О

г=1

J

р

_ S p

\ x i j ~

stj) , 4

j

^

a2(Xij)

o\yj)

 

 

г=1

 

 

 

 

по сравнению с предыдущей итерацией, заменяются значениями £, полученными на предыдущем шаге.

Применение описанного метода позволило в большинстве слу­ чаев значительно увеличить скорость сходимости процесса (больше

чем в 3 раза). Когда же первоначальный процесс не сходился (воз­ никали колебания), решение достигалось за 12-17 итераций. Эле­ менты дисперсионной матрицы ошибок (матрицы рассеяния) для оценок искомых параметров подсчитываются как элементы матри­ цы, обратной матрице N с элементами

d2F

Щ = dQidOj 0 = 0

где 0 —полученная оценка параметров 0.

Описанную выше задачу можно интерпретировать как задачу решения переопределенной системы т) = £0 из т линейных уравне­ ний с п переменными, т > п , когда вместо значений т) и £ имеем со­ ответственно столбец у = (у\ , ... , утУ значений функции, (п х т)- матрицу X , элементы которой хц суть значения г-й переменной в j - м измерении, столбец 0 = (0ь . . . , 0П)Т неизвестных (искомых) параметров.

§ 7.13. Оценка параметров полиномиальной зависимости

Полиномом можно приближенно описать любую функцию. Рассмотрим задачу оценки параметров полинома. Требуется

определить оценку 0 коэффициентов полинома степени т

771

' i = 2 > 5‘

г=0

по известным значениям аргумента и функции, содержащим по­ грешности измерений.

Пусть исходные данные имеют вид

Vi = r\i + ti, Xi = li + bi, г = 1, 2, ... ,п .

Предположим, что ошибки измерений е и 8 — нормально распре­ деленные случайные величины с нулевыми средними значениями, известными дисперсиями (соответственно o2(xi) и а2(уг)) и извест­ ными коэффициентами корреляции рг между измеренными значе­ ниями Х{ и yi. Тогда искомые оценки коэффициентов 0 получают

Соседние файлы в папке книги