Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
20
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

параметры 9 являются свободными. Модель неполного ранга здесь не рассматривается.

А. П р о с т е й ш и й с л у ч а й : а2 — 1. Используя метод наимень­ ших квадратов, найдем точку минимума квадратичной формы

Q(0) = ете = {у~ XQ)T(y - XQ) = уТу - 2ВтХ ту + ВТХ ТХВ.

Дифференцируя Q(9) по 9, получим систему нормальных урав­

нений

- 2 Х ту + 2 Х ГХВ = 0.

Отсюда имеем

9 = (Х тХ ) ~ ' Х ту.

Минимальное значение S квадратичной формы Q(B) при 9 = 9 вычислим по формуле

S = уту - 2[(Х тХ Г \ Х ту)УХт +

+[(ХтХ ) - \ Х ту)]тХ тХ ( Х тХ ) - 1Х'су =

=уту - 2утХ [ (Х гХ )~1( Х ту)]т+ утХ ( Х ^ Х Г 1Х ТХ ( Х ТХ )~1 X ху =

= у ту - у тХ ( Х т* Г 1Х ту ,

откуда получим

S = уту утХВ.

Здесь использованы соотношения (АВ)Т= В ТАТ, (А В )~1 =

= В ~ ХА ~ Х.

Итак, при нахождении точечной оценки параметров методом наименьших квадратов не требуется предположения о нормальном законе распределения исходных данных. Однако это предположе­ ние необходимо при построении доверительных интервалов и для проверки гипотез о параметрах 9.

Рассмотрим свойства оценок, полученных методом наименьших квадратов.

Теорема. Оценка 9 является несмещенной оценкой пара­ метра 9.

Д о к а з а т е л ь с т в о . Найдем математическое ожидание оце­

нок 9:

М(9) = М[(ХтХ ) - 'Х ту] = (Х тХ ) - 'Х тМ(у).

Поскольку М(у) = Х в, то М(9) = (Х ТА’)- 1Х ТА’9 = 9. Теорема доказана.

Теорема (Гаусса—Маркова). Среди класса оценок 0* величи­ ны 0, которые являются несмещенными оценками и представляют собой линейные комбинации исходных данных у, с помощью ме­ тода наименьших квадратов можно найти такую оценку 0, что D(0) ^ D(0*), т.е. в —наиболее точная оценка величины 0 из всех возможных, принадлежащих данному классу (эффективная оценка).

Доказательство теоремы можно найти в [40, 49, 89].

Получим формулу для D(0). Пусть дисперсия D(ej) = о2, j = = 1,2, ... , п, т. е. D(y) = о21. В общем случае имеет место равенство D(Wy) = W D (y)W \ При 0 = (Х ТХ ) ~ ' Х Ту имеем

D(0) = ( Х ТХ У 1X TD(y)[(XTX r 1Х т]т=

=( Х тХ ) ~ 1Х то21 Х ( Х тХ ) - 1=

=o2(X rX ) - ' X 4 X ( X JX ) - 1= о 2( Х тХ ) ~ 1

Из формулы D(0) = о2(Х тХ ) ~ ] следует, что дисперсии оценок могут быть получены без знания самих оценок, причем оценка неизвестного параметра а 2 имеет вид

где п число точек наблюдения, р — число оцениваемых компонен­ тов вектора 0.

Замечание. Приведенными формулами для вычисления диспер­ сии можно пользоваться, несколько их изменив, если каждое на­ блюдение имеет свой вес Oj. Пусть D(EJ ) = а2; тогда можно поло­

жить

D(Sj) = a2/(ùj, где су, — вес j-ro наблюдения. Вместо разно-

сти tj

р

Л

= yj — 2

®ix i в этом случае следует использовать величины

г=1 е* = tjyjЩ. Тогда

2

D(eî) = D(tj s/ôÿj) = u>jD(zj) = (ùj— = a 2, G)j

и минимальным значением функционала будет величина

s = Х!(ер2 = Е

j=1

i =1

Б. О б щ и й с л у ч а й . Результаты

наблюдений подчиняются

модели у = XQ + г. Ошибки е имеют

математическое ожидание

М(е) = 0 и конечные вторые моменты

 

M(£j) = о 2 = D(%),

М(е*, tj) = рijOiOj = cov(уи у Д

=

 

т. е. ковариационную матрицу

 

 

 

( а\

а1СТ2Р12

^1^nPln\

0 20\Ç>2\

о\

®2®пР2п

I •

 

 

<

)

О п О\Рп\

&п®2Рп2

 

 

Рассмотрим квадратичную форму

Q (0) = ( y - X 0 1)( T2 D/ )-( y - X e ) =

= yTD~\y)y - 2yD~\y)XB + (X B fD - \y)X Q =

= yTD -\y )y - 2BTX TD~\y)y + 0TX TD~\y)XQ.

Дифференцируя Q(Q) no 0, получим систему нормальных урав-

нений

2 X TD - \y )y = 2 X TD-'(y)XQ.

Отсюда имеем оценки

0 = (X TD -1(y )X )-, X TD -1(y)y.

Оценки 0 являются также несмещенными и эффективными. Дисперсия оценок имеет вид

D(0) = [XTD -'(y )X ] - 1

Предположим, что D(у) можно представить в виде произведения о2 на некоторую матрицу N: D(y) = a2N . Тогда

D_ 1(У) = ^ ' 1= ^ ’ D(0) = o2(X TW Х ) ~ 1,

где оценка а2 имеет вид

^2

STW z

о =

------ .

п— р

Пример. Найти оценки вектора

параметров 6 в модели т) =

= Gi^i + 62Ж2, если заданы матрица плана

Х =

'3

2

3 \ т

 

1

1

2 )

вектор наблюдений у = (4 ,4 ,4)т и ковариационная матрица для зна­

чений у:

2

0>

/4

D(у) = O2N, N = ( 2

4

О

\0

0

4;

Р е ш е н и е . Найдем матрицу D

1 = W / a 2, предварительно об­

ратив матрицу N:

 

 

 

 

0,333

-0,167

0,000\

 

(-0,167

0,333

0,000 I .

 

0,000

0,000

0,250/

Поскольку параметр а2 постоянен для всех наблюдений, то на точечную оценку 0 значение а 2 влияния не оказывает. В результате получим

0 = (1,00; 0,75)т, е = у - ХВ = (0,25; 1,25; -0,50)т. Тогда имеем

л2

eW e

0,500

 

о

= -------

0,500,

 

п — р

3 - 2

 

D(0) = a2(X TW X ) - '

( 1,000

—1,750\

\ —1,750

3,437/'

 

 

Отсюда получаем ст(0[) = 1,000, о(0г) = 1,854.

Из вида полученной корреляционной матрицы оценок парамет­

ров 0

/ 1,00

-0 ,9 4 \

_

9ij ~

у —0,94

1,00/

следует, что бессмысленно в данном примере приводить только средние квадратические отклонения оценок, так как велики недиа­ гональные элементы (рис. 7.6). Большая положительная ошибка в оценке 0] приведет к большой отрицательной ошибке в оцен­ ке 02. На рис. 7.6 указаны маргинальные средние квадратические

Рис. 7.6. Эллипс

рассеяния оценок 0: координата А равна 0i +

+ /сро(91) л /

1 — Р2, координата В равна 02 + &ра(02)\Л ~ Р 2

отклонения a(0i) и а(02) и интервальные оценки 0i и 02, они опре­ деляются проекциями эллипса на соответствующие оси координат.

В общем случае из условия нормального распределения вектора оценок 0 следует, что квадратичная форма

Q(0,0) = ( 0 - 0 ) TD(0)(0-0)

распределена по закону x2(N), где N размерность вектора 0. По­ этому можно записать вероятностное утверждение:

р { < ? ( ё , е к ф = р ,

где р — доверительная вероятность, Щ— квантиль для х2(ЛГ)-распре- деления.

Область в пространстве параметров 0 задается уравнением Q(6, в) = kl и имеет вид гиперэллипсоида. Отсюда можно получить доверительную область для вектора оценок 0.

В рассматриваемом примере для эллиптической доверитель­ ной области при р = 0,68 имеем Щ = 3,8. Если /ср = 1, то получим Р = 0,39. При коэффициенте корреляции р(0ь 0г) = 0,95 и квантили kp = 1 прямоугольная область, включающая в себя эллипс, имеет доверительную вероятность р = 0,498 [68].

Из рис. 1.1-1.9 можно определить эллиптические и прямоуголь­ ные доверительные области.

JX4N)

JxHm

2h f / / / / ,

 

К Ш к .___1

1

1

О

4

8

12

16

 

 

 

а

 

Рис. 7.7. Интеграл функций у2-распределений:

а —для числа параметров N = 2, 3 , . . 1 2 ; б для числа параметров 2N = 14, 16,..., 40

0

0,2

0,4 0,6 0,8

р

Рис. 7.8. Связь между квантилью fcp описанного прямоуголь­ ника с вероятностным содер­ жанием (3 вписанного эллипса, имеющего коэффициент корре­

ляции р

Рис. 7.9. Доверительные области

для нормальных оценок 0 пара­ метра 0 при fcp = 1 и р = 0,5; pi, Рг, Рз — соответственно вероят­ ностное содержание для эллип­ тической области, описанного прямоугольника и горизонталь­

ной полосы

В качестве примера определим вероятность Р(к) попадания слу­ чайной точки для нормального закона распределения в эллипс рас­ сеяния, полуоси которого равны к средним квадратическим откло­ нениям по соответствующим осям. Для этого вычислим двойной интеграл

т = Я

ехрН (4 ) + Л>) У

G

 

от двумерной плотности распределения вероятностей с нормаль­ ным законом распределения в границах эллипса рассеяния G:

а2(х) а2(у)

где о(х) и а(у) — средние квадратические отклонения по осям х и у соответственно. Получим

Р(к) = 1 - e " fc2/2,

т. е. если каждая полуось эллипса равна одному среднему квадрати­ ческому отклонению о(х) и а(у), то вероятность попадания точки в заданный эллипс рассеяния равна

Р(к = 1) = 1 —е-1/2 % 0,393.

§7.6. Оценка параметров моделей

спомощью функции правдоподобия

Одним из наиболее часто применяемых методов оценки свобод­ ных параметров функций известного вида (в данном случае функ­ ций распределения и плотностей распределения вероятностей) яв­ ляется метод максимума правдоподобия.

Пусть случайная величина х имеет плотность распределения вероятностей f(x, G), где G — неизвестный вектор параметров этого распределения. Проведем независимые выборки и получим реали­ зации х\, Х2, ..., х п. Дифференциал совместной плотности распре­ деления вероятностей результатов наблюдений имеет вид

L(x 1, Х2, ■. •, х п\ G) dx 1dx2 ... dxn =

= f( x 1, G)f(x2, G)... f ( x n, G)dx i dx2 ...

dxn.

п

 

Совместная плотность вероятности L{x, 0) = О

/(ж ь 6) называ-

г=1

х п.

ется функцией правдоподобия для выборки х\,Х 2,

Если дискретная случайная величина х принимает значение Х\,Х2, . . . , х п, то в формуле для функции правдоподобия следует плотности заменить вероятностями событий x = xf.

f ( X i , 0) = ?{x = X i ) .

Можно найти такую оценку 0, которая доставляет функции

правдоподобия L(0) максимум: L(0) = m ax L(0) и является точеч-

0

ной оценкой параметра 0, т. е. для вычисления оценки 0 необходимо решить систему уравнений

дЦх, 0) dBj

Предположим, что оценка 0 одного параметра 0 удовлетворяет следующим условиям (условиям регулярности):

1)0 = 0(xi,X2,...,a:n) —однозначная функция от x \ , x i , . . . , x n, непрерывная и имеющая непрерывные частные производные дВ/дхг во всех точках х = \, Х2, ..., х п) е R” , при этом операции вычис­ ления частных производных и интегрирования коммутируют;

2)область значений х не зависит от вектора параметров 0. Предположим также, что математическое ожидание оценки име­

ет вид М(0) = 0 + 6(0), где 6(0) — смещение оценки 0.

Теорема. В каждом случае регулярной оценки непрерывного ти­ па квадрат среднего квадратического отклонения оценки 0 от ис­ тинного значения 0 удовлетворяет неравенству

D(0) = M [(0 -0 )2] ^

+ Iо о (^r)V,0)dx

До к а з а т е л ь с т в о . Имеем

+о о

J L(0 | 0)d 0 = l.

—ОО

Дифференцируя это выражение по 0, получим следующие соот­

ношения:

+ о о + о о

 

| f ■S-0- J

 

 

 

—оо

 

 

 

д\п L

1 дЬ

 

 

 

так как

L дв-

 

 

 

дв

 

 

 

Имеем

 

+ о о

 

 

 

М(0) =J 0L(0|0)d0=0+6(0).

 

Дифференцируя это равенство по 0, получим

 

 

 

+ о о

<Щв)

 

 

-

гвЦ в | 0)d 0 =

(7.13)

 

l +

 

æ

J

 

 

Поскольку выражение 0 + 6(0) не зависит от 0, то выполняется

равенство

+ о о

 

 

 

 

 

 

 

 

J (0 + 6(0))515neLL(0|0)d0 = O.

(7.14)

Вычитая выражение (7.14) из соотношения (7.13), получим

+ о о

 

 

 

J (0 - 0 -

т ) -д ^ д е

10)d0 = 1 + ® .

(7.15)

Используя неравенство Шварца

 

 

 

+ о о

+ о о

+ о о

 

^ J f ( x )g(x) dx^j ^ Jf \ x ) d x Jg \x )d x ,

 

 

— ОО

— ОО

—ОО

 

преобразуем интеграл (7.15) к следующему виду:

 

+ 0 О

 

 

 

 

J(0- 0- 6(0))2Д01)d0J( ^ ) 2Д010)db (l+

= —м г52Ы ]
æ 2 J

Здесь первый интеграл — выражение для дисперсии D(0), т. е.

1 < т \* de )

дIn L(0 I 6)

м[( дв

Это неравенство называется неравенством Крамера—Рао. Тео­ рема доказана.

Поскольку для нахождения D(0) используется l n L ( 0 10) и по­ скольку точки максимумов функций L(0 10) и In L(0 10) совпада­ ют в силу монотонности логарифма, то для определения точечной оценки 0 решается уравнение правдоподобия

д In L(Q 10)

дв

Л /Ч

Дифференцирование функции In L(Q 10) вместо функции L (0 10) часто упрощает расчеты.

Метод определения оценки 0 с помощью функции правдоподо­ бия называется методом максимума правдоподобия (ММП).

В асимптотике (для состоятельных оценок) имеем

М

J е=е

Из неравенства Крамера—Рао следует, что наименьшая величина дисперсии оценки (для эффективной оценки) определяется по фор­ муле

° ( 9 ) = +0с

1

 

 

 

 

Y d l n l A 2

 

/ т

Ь(х, 0) dx

 

М Л

« ; .

 

Значит, ковариационная

матрица вектора

оценок

0 найдется

из условия

 

 

 

 

D(0) = iV-1 , N =

д2In L

i9j

1, 2, . . . ,

/ь.

d M 0~ ’

 

 

 

 

Пример. Найти точечные оценки математического ожидания т и дисперсии а 2 функции плотности нормально распределенных случайных величин.

Соседние файлы в папке книги