Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
3
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

Ковариационную матрицу оценок D(9) найдем как матрицу N 1,

обратную матрице N с элементами

 

 

d2F

d2F

_

d2F

d2F

~ дв]

æ , æ

2 _

æ 2æ , ’

ÔQ2

вычисленными при найденных значениях оценок 02 и 0}.

После определения точечных оценок 0ь 02 или 0'15 02 и их дис­

персий D(0i), D(02) и л и D(9'j ), D(02) находят доверительные интер­ валы для координат вектора параметров 0. Если число экспери­ ментальных точек достаточно велико и можно считать, что оценки параметров распределены относительно их математических ожи­ даний по нормальному закону, то для получения доверительных интервалов применяют безразмерную ^-статистику Стьюдента, ко­ торая подчиняется ^-распределению с v = п —1 степенями свободы.

Для получения оценок свободных параметров функции Гаусса

находится точка минимума функционала

 

 

р _

у

( (Xj -

li?

(ÿi-T)i)2\

 

 

V °2(ХЛ

°2(г/«)

)

при дополнительном условии

 

 

 

 

dF _

Xj -Z i

yi —Tjj дгц _

 

 

Sii

 

o2(xt)

a2(yi) dli

 

1

f

(5i-9i)2'l

a

 

 

rae * = Æ f e

expl —

Щ ~ 1 -

e‘ 3 1 6 2 s

"■

Знание статистики

получаемых

оценок необходимо для даль­

нейшего анализа экспериментальных данных и правильной трак­ товки результатов их обработки, а также для выявления послед­ ствий сделанных допущений. Приведем результаты числовых экспериментов для определения закона распределения оценок пара­ метров 01 и 02 функции Гаусса.

Для различных погрешностей элементов выборок х н у ис­ следовалась зависимость средних квадратических отклонений оце­ нок параметров функции Гаусса, соответствующей прямой линии г) = 2 + £, от числа заданных точек на отрезке [0,2; 9,8] и закона их расположения на этом отрезке. Как и следовало ожидать из обще­ теоретических соображений, концентрация точек к концам прямой

 

приводит к уменьшению дис­

 

персии оценок.

Зависимость

 

средних квадратических откло­

 

нений от числа точек приведе­

 

на на рис. 8.2.

 

 

Затем для различного числа

 

экспериментальных точек (от 6

 

до 50) и различных комби­

 

наций относительных погреш­

Рис. 8.2. Зависимость средних квад­

ностей по обеим осям коор­

ратических отклонений оценок па­

динат (5(æi) = 1 ... 10 %, b(yi) =

раметров функции Гаусса от числа

= 1 ... 10 %) с помощью датчи­

точек п:

ка нормально распределенных

J — а ф 0 при 8(х<)=10%, 8(у0=10% ;

случайных чисел

исследовал­

2 — а (в 1) при S(Xi) = 1 %, 8 (з/i) = 5 %; 3

а(0г) при 8(х0= 10%, 8 (2/*) = 10%; 4

ся вид функции распределения

о(02) при S(si) = 1%, 8(2/*) = 5 %

оценок. На рис.

8.3 показаны

гистограммы распределения значений оценок 0i и 02 для разно­ го числа экспериментальных точек, имевших погрешность 10% по осям координат.

В каждом варианте вычислялись также дисперсии оценок и опре­ делялись доверительные интервалы дисперсий. Приведем резуль­

таты, полученные для 17 экспериментальных точек. Как показал

Ц, N

0,375

0,250 •

0,125 -

Рис. 8.3. Гистограммы распределения оценок параметров функции Гаусса для различного числа экспериментальных точек при погрешности 10% по обеим осям координат;

/—для 49 точек, 2—для 17 точек, 3 —для 6 точек; а—распределение параметра 0i ;

б—распределение параметра 02

анализ оценок параметров 0i и 02 по критерию х2-распределения с вероятностью, приблизительно равной 0,80, закон распределения оценок можно считать нормальным со средними квадратическими отклонениями соответственно o(0i) = 0,060 и о(0г) = 0,017.

Процедура линеаризации имеет и свои недостатки. При обра­ ботке нелинейных функций таким методом следует иметь в виду, что для того, чтобы оценки 0 соответствующих параметров 0, по­ лученные из преобразованного уравнения, обладали оптимальными свойствами (несмещенностью, минимальной дисперсией и т.д.), необходимо, чтобы предположение аддитивности ненаблюдаемой случайной ошибки было справедливым для преобразованной, а не для первоначальной модели.

Влияние аддитивной ошибки на величину оценки параметров в преобразованной и исходной моделях можно установить, только исследуя каждую конкретную модель.

На рис. 8.4 и 8.5 приведены гистограммы относительных ча­ стот появления значений параметра о функции Гаусса при обра­ ботке экспериментальных данных непосредственно и с помощью операции линеаризации. Исходные данные после линеаризации со­ ответствовали уравнению прямой г) = 2 + Ç. Относительная средняя квадратическая погрешность в исходных данных составляла 10%. Значения £ принадлежали отрезку [0,2; 9,8]. Гистограммы получены для 6, 17 и 49 экспериментальных точек.

Одновременно в каждом варианте определялись дисперсии а 2(8) оценок 8 в предположении, что справедлива квадратичная аппрок­ симация минимизируемого функционала, т. е. дисперсии оценок вы­ числялись согласно теореме Крамера—Рао, и относительная частота появления оценок дисперсий, а также находилось среднее значе­ ние о(8) полученного ряда о(8). Выпишем интервальные оценки при доверительной вероятности 0,68 и средние значения о(8) при различном числе экспериментальных точек:

1) для операции линеаризации функции Гаусса

0,972 ^ 8 6 <

1,062,

0,030 ^

а(86) < 0,100,

о(36) = 0,040,

0,987

^

З п <

1,010,

0,008

^ a ( 3 i7) < 0,031,

сг(317) = 0,018,

0,997

^

849 <

1,008,

0,003

^

0(849) < 0,019,

0(849) = 0,006;

Рис. 8.4. Относительная часто­

Рис. 8.5. Относительная часто­

та появления оценок параметра о

та появления

оценок

парамет­

при применении операции линеа­

ра а при непосредственной оцен-

ризации, Ъ(х{) = 5(?/г) =

Ю %:

ке, Ь{хг) = Ытд) = 10%:

 

7 —начало отсчета 0,980, шаг гисто­

1 — начало

отсчета

0,709,

шаг

ги­

граммы 0,005, число точек

6; 2 —

стограммы

0,065,

число

точек

6;

начало отсчета 0,920, шаг гистограм­

2 —начало отсчета 0,653, шаг гисто­

мы 0,027, число точек 17

граммы 0,109, число точек 17

 

2) для непосредственной оценки параметра о функции Гаусса

0,762 < 36 <

1,092,

1,174 ^

а(36) < 0,984,

 

а(36) = 0,992,

 

0,939^017 <

1,070,

0 ,1 2 4 ^ а (3 ,7) <0,312,

о (3,7) = 0,154.

 

Индексы оценки 3 определяют число точек выборки.

Из приведенных результатов следует, что операция линеариза­ ции занижает реальную интервальную оценку параметра о.

Подобные числовые эксперименты проводились для различных исходных данных и при различных комбинациях погрешностей: от 1 % до 10%.

В табл. 8.1 приведены относительные изменения дисперсии оценки математического ожидания для нормального закона распре­ деления при различных комбинациях относительных погрешностей признака 5(xj) и частоты где noi — частота попадания значе­ ний оценки 0, в г-ю ячейку гистограммы.

Таблица 8.1

Относительное изменение дисперсии оценки параметра 0i при различных комбинациях относительных погрешностей признака b(xi) и частоты 8(noi)

&(П0г), %

 

 

8 ( Х г ) ,%

 

 

0,5

1,5

2,5

3,0

5,0

 

0,5

1

1,078

1,083

1,084

1,089

1,5

5,467

9,064

9,557

9,655

9,753

3,0

9,310

29,16

35,02

36,25

38,27

5,0

10,29

42,96

57,14

60,59

66,04

Теперь можем сделать следующие выводы:

1) неучет погреш ности аргумента занижает реальную интер­ вальную оценку параметров;

2) разные алгоритмы приводят к различным интервальным оценкам.

Н аиболее оптимальные оценки должны получаться в тех алго­ ритмах, в которых операции обработки данных ведутся непосред­ ственно с исходными экспериментальными данными, когда не нару­ ш ается принцип аддитивности и не изменяется искусственно закон распределения исходных данных.

Больш ое практическое значение имеет положение эксперимен­ тальны х точек на исследуемом интервале возможных значений. О птимальны й закон их распределения (обеспечивающий минимум дисперсии оценок) зависит от конкретных значений эксперимен­ тальны х величин и их погреш ностей, и без упрощ ающ их предполо­ ж ений о последних получить его в явном виде не удается. Расчеты показали, что при одинаковых относительных ошибках в каждой точке для всех рассмотренных алгоритмов предпочтительнее вы­ брать равномерный ш аг по оси ординат, чем по оси абсцисс. В этом случае дисперсии оценок будут минимальными.

§ 8.2. Оценка параметров функции плотности распределения вероятностей с учетом погрешности вектора признаков

П рименим результаты, полученные в гл. 7, для решения статис­ тической задачи распознавания образов. Рассмотрим первый этап задачи классификации, когда требуется по результатам наблюдений

найти оценки функций плотности распределения вероятностей. Пусть известен вид функции распределения Р(£,0 1соД j = 1,2,...

..., т, но не известны значения вектора параметров 0. По результа­ там наблюдений случайных векторов х\,Х 2, . . . , х п требуется найти оценки вектора свободных параметров 0 и дисперсии оценок D(0). Проблема состоит в том, что наблюдаемые значения х \,Х 2, . . . , х п имеют соответствующие погрешности и аппроксимирующая функ­ ция распределения Р(£, 0 1от,) не строго пройдет по наблюдае­ мым точкам, т. е. в каждой наблюдаемой точке образуется область неопределенности, форма которой определяется законами распре­ деления координат наблюдаемой точки. Для получения оценок параметров и их дисперсий в данной ситуации применим изло­ женные в гл. 7 методы конфлюэнтного анализа [20, 40].

В приведенных ранее традиционных методах классификации [3, 7, 8, 14, 17-19, 28] определялись только точечные оценки па­ раметров в законах распределения, причем погрешности наблюдае­ мых случайных величин (векторов) х \ , х г , ..., х п при этом не учи­ тывались.

Предположим, что координаты {хцс} наблюдений случайных векторов Х\,Х2, . . . , х п для j-ro класса образов — непрерывные слу­ чайные величины с известными функциями плотности распре­ деления вероятностей /(ж**;), г = 1,2, . . . ,n , к = 1,2,...,1. Также будем считать, что в процессе аппроксимации результатов наблю­ дений х \ , . . . , х п с помощью функции распределения известно­ го вида Р(£, 0 1(ÙJ) предварительно вычислены (способом группи­ ровки, например) эмпирические значения вероятностей Р(хм \ o>j), i = 1,2,..., n, А; = 1,2, . . . , I, с которыми сравниваются соответству­

ющие значения

P(Ç»fc,6 1<^j)> г = 1 ,2 ,...,п, к = 1, 2, . . . , / . Опреде­

лен также вид

функции плотности распределения вероятностей

9 (Pifc 19) Для значений Р(хц; \ <àj). Тогда согласно методу максимума правдоподобия функция правдоподобия будет иметь вид [21, 40]

ПI

L(x, р 10) = П П 9(P»fe I $)f(xiк).

i = i ь = i

Предположим, что все случайные величины подчиняются мно­ гомерному распределению Гаусса с математическими ожиданиями

величин P(£ib 0 1(ùj) и lik, ковариационной матрицей К и диспер­ сиями a2(Xik). В этом случае для образа (ùj имеем

In L(x, р 10) =

= - у { [p - p(£.e i u j) Y K ~ 1[p—p(^ 91toj)]+ i ;

^

(V (~ io )2} +

 

 

 

 

 

+ const,

(8.1)

где

p —набор значений p(xife|o)j),

г = 1

,

2

k =l , 2, . . . , l

и

p(Ç, 0 | (ùj) набор элементов P(^fc, 8 1(ùj), i = 1, 2 ,..., n,

k =

= 1, 2, . . . , / .

 

 

 

 

 

 

Оценки вектора параметров 0 функции р(£, 0 1(ùj) и их диспер­

сии D(0) найдем из условия максимума (8.1) или как точку миниму­

ма функционала

 

 

 

 

 

F(x, р 10) = [р Р(1, в | (ùj)]TK ~ l [P -

Р(^, в | (ùj)] +

 

 

 

 

y i

y i

(Xjk - Zik)2

(8-2)

 

 

Z J

Z J

a 2(xik)

 

 

г=1

k=\

 

 

 

Функционал (8.2) можно было бы сразу записать как функци­ онал ортогональной регрессии [21, 43], позволяющий учесть как погрешность определения р, так и погрешности измерений вели­ чин xi, Х2, . . . , х п. Как уже отмечалось в гл. 7, в ортогональной регрессии минимизируется сумма квадратов расстояний от наблю­

давшихся точек до линии (поверхности) регрессии.

 

 

Точечные оценки вектора параметров 0 и неизвестных ^

мож­

но найти из условий

 

 

 

 

 

 

 

dF_

 

v =

1, 2, . .. , iV,

 

 

(8.3)

 

æ v

 

 

 

 

 

 

 

 

 

 

Pik ~ p(Çtfe>0|^j)

/

Û I .. ч i xik

?>ik _

л

 

------ ^

Н . Л * . e l“ j) +

-

".

(8.4)

 

%= 1, 2, . . . , л,

k

1, 2, ...,/,

 

 

 

где o2(pik) дисперсия значений Pik, p\xk ~ производная от функ­ ции pâik, 0 1(ùj) no £ifc. Решая системы уравнений (8.3) и (8.4) сов­ местно, находим точечные оценки 0 и £. Условия (8.3) — система

алгебраических уравнений относительно из которой можно най­ ти явные выражения для £,гк, подставить их в (8.2) и получить более простую форму функционала (8.2).

Для прямой р = а + Ьх

функционал

(8.2) при

о2(рцс) = а 2(р)

и а2(хц;) = а2(х), г = 1, 2, . . . , п, к = 1, 2, . . . , I, примет вид

 

 

1

 

П

 

 

 

F (x,p |0) =

 

2

(p i - a - b x i )2;

(8.5)

+ Ь2 о 2 ( х )

о 2 ( р )

г=1

 

 

 

для гиперплоскости р = а +

I

bkXk при тех же предположениях

2

 

к= 1

п

/

I

\2

 

 

 

 

F (x,P \Q) = ----------- г----------

_

 

2

h x k )

(8.6)

 

 

г=1

'

к=1

'

 

о2(р) + È Ь2ко2(хк) i

 

 

 

 

к=1

Функционалы (8.5) и (8.6) позволяют непосредственно (со­ гласно (8.3)) найти оценки свободных параметров 0 и их диспер­ сий D(0). Дисперсионную матрицу оценок свободных параметров 0 находим из следующего условия [21]:

D ( ê ) - M - ' , м . ( - ^ ) |9_г Л . А - 1 . 2 ........N.

Пользуясь полученными формулами, покажем теперь, что ли­ нейная разделяющая функция, определенная без учета погреш­ ностей признаков х и у для двух образов, для которых р(х | to*), г = 1, 2, — функция плотности двумерного гауссова распределения с математическими ожиданиями (х*, у*), i = 1, 2, и одной ковариаци-

-

М * )

.

0 \

~

оннои матрицей

К =

I Л

 

, является смещенной оценкой

\0 a2(y)J

реальной разделяющей функции.

Разделяющая функция в данном случае имеет вид уравнения прямой. Данная прямая ортогональна к середине отрезка, проходя­ щего через точки (х,, у*), г = 1, 2, т. е. имеет угловой коэффициент, раный

( х 2 - Х \ ) о 2 ( у )

02(х)(У2 - y i ) '

Найдем уравнение прямой у = а + Ьх, проходящей через точ­ ки (xj, yi), i = 1, 2, . . . , п, учитывая дисперсии оценок а 2(х) и а 2(у).

Оценки параметров a n b искомой прямой определим как координа­ ты точки минимума функционала (8.5) из системы уравнений (8.3), взяв в качестве параметров 0 соответственно а и Ь:

1 п

1=1

П

71

 

S (î/t - а - b x i ) x i

£ (V i - а - b x i f

 

о 2( у ) + b2o 2( x )

[о2(у) + Ь2а 2(х )]2

^

Из первого уравнения получим

Л1

а— —

п

Подставим а во второе уравнение, которое станет квадрат­ ным относительно Ъ. Оценку углового коэффициента b определим

из квадратного уравнения

 

 

 

 

 

 

 

О2(у) [( î > t )

п Е

Я?] + СГ2(х) [п £

у -

( Е Уг)

]

 

6 2 + Ь-

/ п

п

п

 

 

\

р2(у)

= 0.

 

 

ст2(х )

02(х)( Е Уг Е x i ~ п Е х гУг )

 

 

 

 

Н = \

г = 1

г = 1

 

7

 

 

 

Для двух точек (х ь у\),

(хг, уг) это уравнение примет вид

 

ь2 + ь ° 2^

Ух ~ У2)2 ~ ° 2(-уКх ' ~ Xl?

<?(у)

= 0.

 

 

о2(х){У\ ~ Уг)(х1- хг)

 

 

а2(х)

 

В общем случае угловой коэффициент

(х2- х \)а г(у) не являет-

 

 

 

 

 

CT2(z)(ï/2-

2/l)

 

ся корнем данного квадратного уравнения, за исключением редких случаев, когда не различимы разные линии регрессии, что подтвер­ ждает смещенность оценки, полученной без учета а 2(х) и о2(у). Угловой коэффициент b однозначно связан с угловым коэффициен­ том разделяющей прямой: их произведение равно - 1.

Далее оценим смещение разделяющих функций при учете по­ грешностей признаков на примере одномерных гауссовых функций плотности распределения вероятностей р(х | coi) и р(х | «г) с мате­ матическими ожиданиями т\ и т г соответственно, а также с оди­ наковыми дисперсиями а 2.

В традиционных методах не различаются значения ж и Ç, поэто­ му в качестве функции плотности распределения берется р(ж | (ùj) вместо р(£ | u>j). Тем не менее, в процессе оценки свободных пара­ метров Ш | , т 2 и ст2 функций, распределенных по нормальному за­ кону, должны быть получены соответствующие погрешности Ami,

Д ш 2 и Д а.

Разделяющая граница в традиционных методах может быть определена согласно выражению

 

l„ÎË lü !i= 0,

(8.7)

где

р(х | о>2)

 

 

 

р(х | G)j) \f2,—

2о*^Х

| j ^

и в данном случае при А т \ = Д т 2 = 0 разделяющая граница про­

ходит через точку (mi + m 2)/2.

 

В действительности из-за наличия погрешностей Д т ь

Д т 2

и Д а вместо выражения (8.7) следует записать

 

p (x |o )i)± A p(x|o)i)

(8.8)

р(х I 6)2) ± Др(х I 6)2)

 

Погрешности Др(ж | б)г) получим как линейные члены разложе­

ния в ряд Тейлора функций р(х | со*), г = 1,2:

 

Др(х 11ôi) = p'mi(x I оц)Атп1 + р'а(ж | о)г)Да, г = 1,2.

(8.9)

Здесь p'mi(x | 6)j) И р'а(х | 6)j) — ПрОИЗВОДНЫе фуНКЦИИ р(х | 0);) ПО ТП{

и а с о о т в е т с т в е н н о .

Найдем максимальное смещение разделяющей границы (в чис­

лителе выражения (8.8) прибавляется

погрешность Др(ж 16)i),

а в знаменателе вычитается Др(ж | б)2)),

учитывая только Д т ]

и Д т 2. Используя соотношения (8.9), перепишем выражение (8.8) в следующем виде:

 

,

, ( я - m i )

А

 

 

Ь Й ^

1 Н---------:-----

АТП\

= 0.

 

+ ______ Of_______

 

р(х I 6)2)

,

(я ~ т 2) Л

 

 

 

1 -----------~----- Д т 2

 

 

Разложим функции In ^ 1 + Х

A m ^j и ln ^l — Х

Д т 2^

в ряд Маклорена. Поскольку здесь не обязательно выполняется

Соседние файлы в папке книги