![](/user_photo/_userpic.png)
книги / Математические методы принятия решений
..pdfКовариационную матрицу оценок D(9) найдем как матрицу N 1,
обратную матрице N с элементами |
|
|
||
d2F |
d2F |
_ |
d2F |
d2F |
~ дв] ’ |
æ , æ |
2 _ |
æ 2æ , ’ |
ÔQ2 ’ |
вычисленными при найденных значениях оценок 02 и 0}.
После определения точечных оценок 0ь 02 или 0'15 02 и их дис
персий D(0i), D(02) и л и D(9'j ), D(02) находят доверительные интер валы для координат вектора параметров 0. Если число экспери ментальных точек достаточно велико и можно считать, что оценки параметров распределены относительно их математических ожи даний по нормальному закону, то для получения доверительных интервалов применяют безразмерную ^-статистику Стьюдента, ко торая подчиняется ^-распределению с v = п —1 степенями свободы.
Для получения оценок свободных параметров функции Гаусса
находится точка минимума функционала |
|
|||||
|
р _ |
у |
( (Xj - |
li? |
(ÿi-T)i)2\ |
|
|
|
“ |
V °2(ХЛ |
°2(г/«) |
) |
|
при дополнительном условии |
|
|
|
|||
|
dF _ |
Xj -Z i |
yi —Tjj дгц _ |
|
||
|
Sii |
|
o2(xt) |
a2(yi) dli |
|
|
1 |
f |
(5i-9i)2'l |
a |
|
|
|
rae * = Æ f e |
expl — |
Щ ~ 1 - |
e‘ 3 1 6 2 s |
"■ |
||
Знание статистики |
получаемых |
оценок необходимо для даль |
нейшего анализа экспериментальных данных и правильной трак товки результатов их обработки, а также для выявления послед ствий сделанных допущений. Приведем результаты числовых экспериментов для определения закона распределения оценок пара метров 01 и 02 функции Гаусса.
Для различных погрешностей элементов выборок х н у ис следовалась зависимость средних квадратических отклонений оце нок параметров функции Гаусса, соответствующей прямой линии г) = 2 + £, от числа заданных точек на отрезке [0,2; 9,8] и закона их расположения на этом отрезке. Как и следовало ожидать из обще теоретических соображений, концентрация точек к концам прямой
|
приводит к уменьшению дис |
||
|
персии оценок. |
Зависимость |
|
|
средних квадратических откло |
||
|
нений от числа точек приведе |
||
|
на на рис. 8.2. |
|
|
|
Затем для различного числа |
||
|
экспериментальных точек (от 6 |
||
|
до 50) и различных комби |
||
|
наций относительных погреш |
||
Рис. 8.2. Зависимость средних квад |
ностей по обеим осям коор |
||
ратических отклонений оценок па |
динат (5(æi) = 1 ... 10 %, b(yi) = |
||
раметров функции Гаусса от числа |
= 1 ... 10 %) с помощью датчи |
||
точек п: |
|||
ка нормально распределенных |
|||
J — а ф 0 при 8(х<)=10%, 8(у0=10% ; |
|||
случайных чисел |
исследовал |
||
2 — а (в 1) при S(Xi) = 1 %, 8 (з/i) = 5 %; 3 — |
|||
а(0г) при 8(х0= 10%, 8 (2/*) = 10%; 4— |
ся вид функции распределения |
||
о(02) при S(si) = 1%, 8(2/*) = 5 % |
оценок. На рис. |
8.3 показаны |
гистограммы распределения значений оценок 0i и 02 для разно го числа экспериментальных точек, имевших погрешность 10% по осям координат.
В каждом варианте вычислялись также дисперсии оценок и опре делялись доверительные интервалы дисперсий. Приведем резуль
таты, полученные для 17 экспериментальных точек. Как показал
Ц, N
0,375
0,250 •
0,125 -
Рис. 8.3. Гистограммы распределения оценок параметров функции Гаусса для различного числа экспериментальных точек при погрешности 10% по обеим осям координат;
/—для 49 точек, 2—для 17 точек, 3 —для 6 точек; а—распределение параметра 0i ;
б—распределение параметра 02
анализ оценок параметров 0i и 02 по критерию х2-распределения с вероятностью, приблизительно равной 0,80, закон распределения оценок можно считать нормальным со средними квадратическими отклонениями соответственно o(0i) = 0,060 и о(0г) = 0,017.
Процедура линеаризации имеет и свои недостатки. При обра ботке нелинейных функций таким методом следует иметь в виду, что для того, чтобы оценки 0 соответствующих параметров 0, по лученные из преобразованного уравнения, обладали оптимальными свойствами (несмещенностью, минимальной дисперсией и т.д.), необходимо, чтобы предположение аддитивности ненаблюдаемой случайной ошибки было справедливым для преобразованной, а не для первоначальной модели.
Влияние аддитивной ошибки на величину оценки параметров в преобразованной и исходной моделях можно установить, только исследуя каждую конкретную модель.
На рис. 8.4 и 8.5 приведены гистограммы относительных ча стот появления значений параметра о функции Гаусса при обра ботке экспериментальных данных непосредственно и с помощью операции линеаризации. Исходные данные после линеаризации со ответствовали уравнению прямой г) = 2 + Ç. Относительная средняя квадратическая погрешность в исходных данных составляла 10%. Значения £ принадлежали отрезку [0,2; 9,8]. Гистограммы получены для 6, 17 и 49 экспериментальных точек.
Одновременно в каждом варианте определялись дисперсии а 2(8) оценок 8 в предположении, что справедлива квадратичная аппрок симация минимизируемого функционала, т. е. дисперсии оценок вы числялись согласно теореме Крамера—Рао, и относительная частота появления оценок дисперсий, а также находилось среднее значе ние о(8) полученного ряда о(8). Выпишем интервальные оценки при доверительной вероятности 0,68 и средние значения о(8) при различном числе экспериментальных точек:
1) для операции линеаризации функции Гаусса
0,972 ^ 8 6 < |
1,062, |
0,030 ^ |
а(86) < 0,100, |
о(36) = 0,040, |
|||
0,987 |
^ |
З п < |
1,010, |
0,008 |
^ a ( 3 i7) < 0,031, |
сг(317) = 0,018, |
|
0,997 |
^ |
849 < |
1,008, |
0,003 |
^ |
0(849) < 0,019, |
0(849) = 0,006; |
Рис. 8.4. Относительная часто |
Рис. 8.5. Относительная часто |
|||||||
та появления оценок параметра о |
та появления |
оценок |
парамет |
|||||
при применении операции линеа |
ра а при непосредственной оцен- |
|||||||
ризации, Ъ(х{) = 5(?/г) = |
Ю %: |
ке, Ь{хг) = Ытд) = 10%: |
|
|||||
7 —начало отсчета 0,980, шаг гисто |
1 — начало |
отсчета |
0,709, |
шаг |
ги |
|||
граммы 0,005, число точек |
6; 2 — |
стограммы |
0,065, |
число |
точек |
6; |
||
начало отсчета 0,920, шаг гистограм |
2 —начало отсчета 0,653, шаг гисто |
|||||||
мы 0,027, число точек 17 |
граммы 0,109, число точек 17 |
|
||||||
2) для непосредственной оценки параметра о функции Гаусса |
||||||||
0,762 < 36 < |
1,092, |
1,174 ^ |
а(36) < 0,984, |
|
а(36) = 0,992, |
|
||
0,939^017 < |
1,070, |
0 ,1 2 4 ^ а (3 ,7) <0,312, |
о (3,7) = 0,154. |
|
Индексы оценки 3 определяют число точек выборки.
Из приведенных результатов следует, что операция линеариза ции занижает реальную интервальную оценку параметра о.
Подобные числовые эксперименты проводились для различных исходных данных и при различных комбинациях погрешностей: от 1 % до 10%.
В табл. 8.1 приведены относительные изменения дисперсии оценки математического ожидания для нормального закона распре деления при различных комбинациях относительных погрешностей признака 5(xj) и частоты где noi — частота попадания значе ний оценки 0, в г-ю ячейку гистограммы.
величин P(£ib 0 1(ùj) и lik, ковариационной матрицей К и диспер сиями a2(Xik). В этом случае для образа (ùj имеем
In L(x, р 10) =
= - у { [p - p(£.e i u j) Y K ~ 1[p—p(^ 91toj)]+ i ; |
^ |
(V (~ io )2} + |
||||
|
|
|
|
|
+ const, |
(8.1) |
где |
p —набор значений p(xife|o)j), |
г = 1 |
, |
2 |
k =l , 2, . . . , l |
|
и |
p(Ç, 0 | (ùj) —набор элементов P(^fc, 8 1(ùj), i = 1, 2 ,..., n, |
k = |
||||
= 1, 2, . . . , / . |
|
|
|
|
|
|
|
Оценки вектора параметров 0 функции р(£, 0 1(ùj) и их диспер |
|||||
сии D(0) найдем из условия максимума (8.1) или как точку миниму |
||||||
ма функционала |
|
|
|
|
|
|
F(x, р 10) = [р —Р(1, в | (ùj)]TK ~ l [P - |
Р(^, в | (ùj)] + |
|
|
|||
|
|
y i |
y i |
(Xjk - Zik)2 |
(8-2) |
|
|
|
Z J |
Z J |
a 2(xik) ■ |
||
|
|
г=1 |
k=\ |
|
|
|
Функционал (8.2) можно было бы сразу записать как функци онал ортогональной регрессии [21, 43], позволяющий учесть как погрешность определения р, так и погрешности измерений вели чин xi, Х2, . . . , х п. Как уже отмечалось в гл. 7, в ортогональной регрессии минимизируется сумма квадратов расстояний от наблю
давшихся точек до линии (поверхности) регрессии. |
|
|
|||||
Точечные оценки вектора параметров 0 и неизвестных ^ |
мож |
||||||
но найти из условий |
|
|
|
|
|
|
|
|
dF_ |
|
v = |
1, 2, . .. , iV, |
|
|
(8.3) |
|
æ v |
|
|
|
|||
|
|
|
|
|
|
|
|
Pik ~ p(Çtfe>0|^j) |
/ |
Û I .. ч i xik |
?>ik _ |
л |
|
||
------ ^ |
— |
Н . Л * . e l“ j) + |
- |
". |
(8.4) |
||
|
%= 1, 2, . . . , л, |
k |
1, 2, ...,/, |
|
|
|
где o2(pik) —дисперсия значений Pik, p\xk ~ производная от функ ции pâik, 0 1(ùj) no £ifc. Решая системы уравнений (8.3) и (8.4) сов местно, находим точечные оценки 0 и £. Условия (8.3) — система
алгебраических уравнений относительно из которой можно най ти явные выражения для £,гк, подставить их в (8.2) и получить более простую форму функционала (8.2).
Для прямой р = а + Ьх |
функционал |
(8.2) при |
о2(рцс) = а 2(р) |
||||
и а2(хц;) = а2(х), г = 1, 2, . . . , п, к = 1, 2, . . . , I, примет вид |
|
||||||
|
1 |
|
П |
|
|
|
|
F (x,p |0) = |
|
2 |
(p i - a - b x i )2; |
(8.5) |
|||
+ Ь2 о 2 ( х ) |
|||||||
о 2 ( р ) |
г=1 |
|
|
|
|||
для гиперплоскости р = а + |
I |
bkXk при тех же предположениях |
|||||
2 |
|||||||
|
к= 1 |
п |
/ |
I |
\2 |
|
|
|
|
|
|||||
F (x,P \Q) = ----------- г---------- |
_ |
|
2 |
h x k ) |
(8.6) |
||
|
|
г=1 |
' |
к=1 |
' |
|
|
о2(р) + È Ь2ко2(хк) i |
|
|
|
|
к=1
Функционалы (8.5) и (8.6) позволяют непосредственно (со гласно (8.3)) найти оценки свободных параметров 0 и их диспер сий D(0). Дисперсионную матрицу оценок свободных параметров 0 находим из следующего условия [21]:
D ( ê ) - M - ' , м . ( - ^ ) |9_г Л . А - 1 . 2 ........N.
Пользуясь полученными формулами, покажем теперь, что ли нейная разделяющая функция, определенная без учета погреш ностей признаков х и у для двух образов, для которых р(х | to*), г = 1, 2, — функция плотности двумерного гауссова распределения с математическими ожиданиями (х*, у*), i = 1, 2, и одной ковариаци-
- |
„ |
М * ) |
. |
0 \ |
~ |
оннои матрицей |
К = |
I Л |
|
, является смещенной оценкой |
\0 a2(y)J
реальной разделяющей функции.
Разделяющая функция в данном случае имеет вид уравнения прямой. Данная прямая ортогональна к середине отрезка, проходя щего через точки (х,, у*), г = 1, 2, т. е. имеет угловой коэффициент, раный
( х 2 - Х \ ) о 2 ( у )
02(х)(У2 - y i ) '
Найдем уравнение прямой у = а + Ьх, проходящей через точ ки (xj, yi), i = 1, 2, . . . , п, учитывая дисперсии оценок а 2(х) и а 2(у).
Оценки параметров a n b искомой прямой определим как координа ты точки минимума функционала (8.5) из системы уравнений (8.3), взяв в качестве параметров 0 соответственно а и Ь:
1 п
1=1
П |
71 |
|
S (î/t - а - b x i ) x i |
£ (V i - а - b x i f |
|
о 2( у ) + b2o 2( x ) |
[о2(у) + Ь2а 2(х )]2 |
^ |
Из первого уравнения получим
Л1
а— —
п
Подставим а во второе уравнение, которое станет квадрат ным относительно Ъ. Оценку углового коэффициента b определим
из квадратного уравнения |
|
|
|
|
|
|
|
|
О2(у) [( î > t ) |
—п Е |
Я?] + СГ2(х) [п £ |
у ■- |
( Е Уг) |
] |
|
||
6 2 + Ь- |
/ п |
п |
п |
|
|
\ |
р2(у) |
= 0. |
|
|
ст2(х ) |
||||||
02(х)( Е Уг Е x i ~ п Е х гУг ) |
|
|
|
|||||
|
Н = \ |
г = 1 |
г = 1 |
|
7 |
|
|
|
Для двух точек (х ь у\), |
(хг, уг) это уравнение примет вид |
|
||||||
ь2 + ь ° 2^ |
Ух ~ У2)2 ~ ° 2(-уКх ' ~ Xl? |
<?(у) |
= 0. |
|
||||
|
о2(х){У\ ~ Уг)(х1- хг) |
|
|
а2(х) |
|
|||
В общем случае угловой коэффициент |
(х2- х \)а г(у) не являет- |
|||||||
|
|
|
|
|
CT2(z)(ï/2- |
2/l) |
|
ся корнем данного квадратного уравнения, за исключением редких случаев, когда не различимы разные линии регрессии, что подтвер ждает смещенность оценки, полученной без учета а 2(х) и о2(у). Угловой коэффициент b однозначно связан с угловым коэффициен том разделяющей прямой: их произведение равно - 1.
Далее оценим смещение разделяющих функций при учете по грешностей признаков на примере одномерных гауссовых функций плотности распределения вероятностей р(х | coi) и р(х | «г) с мате матическими ожиданиями т\ и т г соответственно, а также с оди наковыми дисперсиями а 2.
В традиционных методах не различаются значения ж и Ç, поэто му в качестве функции плотности распределения берется р(ж | (ùj) вместо р(£ | u>j). Тем не менее, в процессе оценки свободных пара метров Ш | , т 2 и ст2 функций, распределенных по нормальному за кону, должны быть получены соответствующие погрешности Ami,
Д ш 2 и Д а.
Разделяющая граница в традиционных методах может быть определена согласно выражению
|
l„ÎË lü !i= 0, |
(8.7) |
где |
р(х | о>2) |
|
|
|
|
р(х | G)j) \f2,— |
2о*^Х |
| j ^ |
и в данном случае при А т \ = Д т 2 = 0 разделяющая граница про
ходит через точку (mi + m 2)/2. |
|
|
В действительности из-за наличия погрешностей Д т ь |
Д т 2 |
|
и Д а вместо выражения (8.7) следует записать |
|
|
p (x |o )i)± A p(x|o)i) |
(8.8) |
|
р(х I 6)2) ± Др(х I 6)2) |
||
|
||
Погрешности Др(ж | б)г) получим как линейные члены разложе |
||
ния в ряд Тейлора функций р(х | со*), г = 1,2: |
|
|
Др(х 11ôi) = p'mi(x I оц)Атп1 + р'а(ж | о)г)Да, г = 1,2. |
(8.9) |
Здесь p'mi(x | 6)j) И р'а(х | 6)j) — ПрОИЗВОДНЫе фуНКЦИИ р(х | 0);) ПО ТП{
и а с о о т в е т с т в е н н о .
Найдем максимальное смещение разделяющей границы (в чис
лителе выражения (8.8) прибавляется |
погрешность Др(ж 16)i), |
а в знаменателе вычитается Др(ж | б)2)), |
учитывая только Д т ] |
и Д т 2. Используя соотношения (8.9), перепишем выражение (8.8) в следующем виде:
|
, |
, ( я - m i ) |
А |
|
|
Ь Й ^ |
1 Н---------:----- |
АТП\ |
= 0. |
|
|
+ 1П ______ Of_______ |
|
||||
р(х I 6)2) |
, |
(я ~ т 2) Л |
|
|
|
|
1 -----------~----- Д т 2 |
|
|
||
Разложим функции In ^ 1 + Х |
A m ^j и ln ^l — Х |
Д т 2^ |
в ряд Маклорена. Поскольку здесь не обязательно выполняется