Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
3
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

Пусть произвели выборку {х*}, г = 1,2, и получили п независимых значений, имеющих нормальное распределение. Функ­ ция правдоподобия в этом случае имеет вид

71

 

 

- т)2 ï

Ц т , о 2) = Ц

^ = -

ехр{

г = 1

 

 

2о2 У

 

 

 

Тогда

 

71

 

 

1 ^

(Xi ~ т

ь

а 2 + const.

In L = —2^2 2

)2 - у

г=1

Используя метод максимума правдоподобия, получим уравнения

gin L

1 n

dm

2 0е* _ m ) = °.

 

i=l

д In L

до2 2? i > ‘- m)2 - 2o2è =0-

i=l

Отсюда получим следующие оценки:

т = — V Xi = х,

а 2 = — V (xi - х)2.

п 2=1

п 2=1

Математическое ожидание оценки т есть M(m) = М(х) = M(xj) = = [!, т. е. т является несмещенной оценкой.

Найдем математическое ожидание оценки З2. Математические ожидания каждого слагаемого в формуле для 32 равны. Тогда

1

 

 

 

 

М(Э/ ) = — nM[(Xj —X f ] =

 

 

 

= M [ ( x i -

[i)2 + (х - р)2 - 2(xi - р)(х -

[i)] =

 

 

2

G1

„ О 2

2 гг — 1

 

= о2 +

------2 — = ст2 ------- .

Получили, что оценка З2 является смещенной.

п

Т1

 

 

 

 

Несмещенная оценка (исправленная) дисперсии имеет вид

=

Ô 2 = ~ — Г ^ ( X i - X )2 .

 

 

 

i= l

 

 

 

При выполнении условий регулярности (наиболее важное из них —независимость границы области определения функции /(х , 0) от 0) оценки, полученные методом максимального правдоподобия,

состоятельны и, кроме того, асимптотически нормальны и эффек­ тивны.

Если функция правдоподобия имеет вторые производные по 6 в интервале, включающем истинное значение 0о, и если, кроме того,

М[ ^ ] - 0

и существует матрица

элементы шторой отличны от нуля в указанном интервале, то оцен­ ка 6 асимптотически нормально распреде­

 

лена со средним значением 0<>и дисперси­

 

ей [iV(0) ] - ‘.

 

 

 

 

 

Важным

свойством

оценки

ММП

 

является ее инвариантность: оценка т

 

функции т(0) является функцией оцен­

 

ки

т = т(0).

Например,

оценка

функ­

 

ции

т(0) = 02 равна

квадрату оценки 0,

 

но оценка т не обязательно несмещенная.

 

 

Интервальная оценка параметра 0 мо­

Рис. 7.10. Интервальная

жет быть получена по графику функции

правдоподобия (рис. 7.10).

 

 

оценка, построенная по

 

 

 

О д н о м е р н ы й

с л у ч а й .

Пусть

функции правдоподобия

 

 

результаты

наблюдений

распределены

по нормальному закону N(\x, а2). Логарифм функции правдоподо­ бия имеет вид параболы:

In Ц х, Р) = In С - у

£ ( X i - р)2 = In С - у

£ ( X i - X)2 - у ([1 - х)2

 

 

г=1

г=1

с точшй

максимума при р = х. Смещаем

параболу так, чтобы

In Ц х ) = 0.

 

 

 

Пусть In L = 1/2 и п = 1. Тогда

 

 

 

 

(Р ~ х)2 = J_

 

 

 

2

2 '

 

Отсюда

получим

доверительный

интервал х — 1 ^ ^ ^ х + 1.

Однако из свойств нормального распределения следует, что

 

P { ( æ - ( j t ) 2 ^ 1} = 0 ,6 8 3 ,

т.е. Р { х - 1

+ 1} = 0,683 (см. рис. 7.10).

Пусть In L = —2; тогда (|i —х)2/2 = 2. Отсюда получаем дове­

рительный интервал |ц -

х\ ^ 2, или х - 2 ^ ц ^ х + 2.

Из условия нормального распределения имеем

 

Р{(х —р)2 < 2} = 0,955,

или P{æ —2 ^ ц ^ ж

+ 2} = 0,955.

О б щ и й с л у ч а й .

Если L(x, 0) является непрерывной функ­

цией и имеет один

максимум, можно найти оператор д(В,х), ко­

торый преобразует

кривую In L Q(X , 0) в параболу вблизи функ­

ции G(x) наблюдений:

ln L g(x,9m = j ( g - G ( x ) ) 2.

В асимптотическом случае доказывается, что g можно выбрать независимо от х. Тогда G является оценкой максимального правдо­ подобия для д.

Используя свойство инвариантности ММП, можно сделать та­ кие же выводы о параметре д, какие делались о параметре нор­ мального распределения 6. Преобразуем доверительный интервал для значений g в соответствующий интервал для значений 6. По­

скольку

In Le(x, 9) = In Lg(x, дф)),

то значения 0, соответствующие интервалу для д, при In Lg = —2 яв­ ляются точками пересечения прямой In L = —2 с графиком функции In L Q(X , 0). Таким образом, можно сделать выводы об интерваль­ ной оценке параметра непараболической функции правдоподобия, не проводя преобразования к параболической функции правдопо­ добия.

Заметим, что интервальные оценки параметров, полученные по графику функции In L, будут отличаться от тех же оценок, полученных с помощью матрицы вторых производных, так как в последнем случае проводится квадратичная аппроксимация функ­ ции In L в окрестности точки максимума. Однако графическая процедура имеет свои особенности:

13 — 4077

1)точность способа преобразования имеет порядок 1/п , так как преобразуем экспериментальную функцию правдоподобия, тогда как нужно было бы получить (преобразовать) нормальное распре­ деление вместо полученного распределения;

2)полученный интервал может быть «широким» и несиммет­ ричным для первоначальной переменной 0;

3)если функция правдоподобия имеет несколько максимумов, то эта процедура выявляет несколько интервалов, однако довери­ тельным интервалом для 0 может быть только один непрерывный интервал с тем же самым вероятностным содержанием (не следу­ ет забывать, что интервальная оценка указывает интервал, который

свероятностью р накрывает истинное значение 0);

4)если предложенным методом получаем неопределенные (или бесконечные) доверительные интервалы, то для решаемой задачи требуется более сложная интерпретация, чем интерпретация ее как задачи нахождения единственной оценки ММП и доверительного интервала.

§7.7. Байесовский подход к оцениванию параметров моделей

Вбайесовском подходе неизвестный параметр 0 является не де­ терминированной (постоянной) величиной, а случайной величиной, для которой априори известна плотность распределения к(0) воз­ можных значений 0.

После наблюдения х получим плотность апостериорного рас­ пределения вероятностей

к(01 X) =

Байесовский доверительный интервал (0„, 0„) с вероятностным содержанием р определяется следующим образом:

0:

Согласно этому определению доверительный интервал соответ­ ствует доле р полной веры наблюдателя в значение оценки парамет­ ра 0, т. е. составляет р/(1 —р). Полное апостериорное распределе­ ние тс(0 | х) как бы заменяется дискретным двухточечным распреде­ лением:

p { e „ ^ e ^ e B} = p , P {e*[e„,eB]} = i - p .

Как и в классическом варианте нахождения интервальной оцен­ ки, доверительный интервал определяется неоднозначно. В обоих случаях не указывается, какое значение внутри интервала является наиболее вероятным. Поэтому желательно дополнительно провести точечную оценку по максимуму функции распределения вероятно­ стей к(01 х).

Замечание. Для нелинейных функций оценку свободных пара­ метров часто проводят после линеаризации заданной функции, на­ пример: г) = ЛеХг => In т) = In A + Xx или T)I = 0j + 0гх, где r)i = In T), 01 = In A, 02 = X. Однако здесь возникают две проблемы: единствен­ ности оценок и изменения законов распределения исходных дан­ ных, — которые повлияют на величину интервальных оценок.

§7.8. Интервальные оценки линии регрессии

ипрогнозируемых значений функции

Пусть для функции г) = /(х , 0) получены оценки 0 и их дис­ персии D(0). Это означает, что по результатам наблюдений можно построить семейство линий. Для модели г) = /(х , 0) оценкой ли­ нии регрессии т) будет функция у = /(х , 0). Необходимо определить доверительные интервалы для значений у, которые с заданной до­ верительной вероятностью р накроют истинные значения г). Кроме того, необходимо найти доверительные интервалы для прогнозов, которые накроют новое наблюдение у, соответствующее заданному значению х.

Рассмотрим эти оценки в случае, когда функция т) = 0о + 01(х —х) является линейной, где х —среднее значение переменной х. Тогда дисперсия значений у определяется по формуле

D(y) = D(0O) + D[0j(х - х)] = D(0<>) + (х - x)2D(0,).

13*

Величина —— подчиняется распределению Стьюдента с п — р v D(y)

степенями свободы; при заданном р квантиль распределения Стью­ дента равна £р и интервальная оценка имеет вид

Р{у - Ц у /Щ ) < т) < у + tpy/Щ ) } = Р-

В общем случае для линии регрессии, описываемой уравнением Tj(x, 0) = f{x, 0), дисперсия вычисленных значений у определяется выражением

j= l

J

1= 1j =2

где N — размерность вектора 0, D (0j , 0*) — корреляционный момент

ЛЛ

случайных величин 6j и 0j.

N

 

Для линейных функций т)(ж, 0) = 2

дисперсия вычис-

i=i

 

ляемых значений у в точке х согласно той же формуле может быть записана в виде

D(y) = / TCr)D(0)/(aO;

 

 

 

здесь f(x ) — вектор, D (0) — матрица оценок 0.

Например, для

прямой

линии

г)(ж, 0) = 0о + 0i(æ —х), если

fix ) = (1, х х)Т, имеем

 

 

О Д = ( 1, х - х)

^

( х '

. ) = О Д ) + (X - х)20(в,).

Задав серию значений х и вычислив соответствующие им значе­ ния дисперсии ст2(у ) = D (y), получим интервальную оценку линии. Для прямой линии интервальную оценку можно получить анали­ тически [40]. Интервальные границы для М(т)|£о) в случае прямой линии будут следующие:

Tj - i l - a/2«7(ri) М(т) I ^о) < Т) + ^1 —a/2CT(^),

(7. 16)

где о2(т)) = (1, Ç0)D(9)(1, £0)т>а уровень значимости.

Огибающая семейства всех возможных прямых будет кривой второго порядка, уравнение которой получим из формулы (7.16):

п

£(Уг - 6l - 62Жг)2 ^ С«(1 + 0i), i= 1

где Са — константа, величина которой определяется уровнем значи­ мости а.

Принимая за начало отсчета наблюдаемые средние значения х и у, перепишем это неравенство в виде [40]

02 (s x — С х ) —202Sxy + 0] ^ C'a — Sy,

где s2, Sy и sXy — соответственно выборочные дисперсии и выбо­ рочная ковариация величин х и у. Это условие можно считать огра­ ничением, которому удовлетворяет «истинная» прямая.

Найдем огибающую семейства всех возможных прямых. Урав­ нение огибающей [40] имеет вид

 

(у - в2 х ) 2 _ ( 0 2 У + х ) 2 _

2 2

 

 

 

C'a —Ь\

Ъ2- С а

+ 2’

 

 

где

 

 

 

 

 

 

 

b i= s x2 - § * ,

b2 = s2x + B2sxy,

02 > 0,

b2 >b\.

 

02

 

 

 

 

 

Новое наблюдаемое (прогнозируемое) значение у отсчитывает­

ся от точек на линии

оценки

функции регрессии

у, и

величина

Iу у|

 

 

 

 

 

■-, ■

: имеет распределение Стьюдента. Предположим, что но-

V °(y -

У)

 

 

 

 

 

вое наблюдение имеет дисперсию а 2; тогда

 

 

 

D(у - у )

= а2 + D(0O) + (х -

X )2D(0I ).

 

Интервальные оценки для точек прогноза имеют вид

 

 

р{у- <рл/°(у - у) <у<у+<pVD(y-y)} = Р-

(7.17)

Для к измерений, проводимых в точке прогноза, вместо значения дисперсии о2 в формуле для D(у —у) надо взять величину а2/к. Для параметров прямой линии нетрудно получить оценки

 

 

 

Е ( X i - х ) У г

0 0 = ^

Уг =

У,

г=1_ _ _ _ _ _

Е (Xi - X)2

г=1

 

 

 

 

<=1

Пусть D(ÿi) = а 2, г = 1,2, ... , п. Тогда

 

D(6o) = D(ÿ) =

^ ,

 

 

 

п

'S(*i “ x)îн

E f o -

x ) 2D (y i)

D(9i)= D

 

_i____________

Æ)2

 

E fo - x)2 ‘

S(*i -

(E (Z

 

 

* “ Æ)2)

Из формул для D(0o) и D(0i) следует, что дисперсия D(у) минималь­ на при х = х. Задавая различные значения х, можно найти интер­ вальные оценки линии регрессии (линии I и II на рис. 7.11) при заданном (3 и интервальную оценку нового наблюдения yi для про­ гнозируемой ТОЧКИ Xi.

Рис. 7.11. И нтервальная оценка линии регрессии

На рис. 7.11 точка (xj, yi) показывает нижнее значение интер­ вальной оценки прогнозируемого значения у* в точке х*.

§ 7.9. Активный и пассивный эксперименты. Оценивание параметров функции известного вида

впассивном эксперименте

Внастоящем параграфе будут рассмотрены алгоритмы, позволя­ ющие находить оценки свободных параметров элементарных функ­ ций при наличии погрешностей и в значениях аргумента, и в значе­ ниях функции. Эти алгоритмы объединены названием «конфлюэнт­ ный анализ» (англ, confluence — слияние, confluent — сливающийся). Когда и значения функции, и значения аргумента — случайные ве­ личины, процедуры оценки свободных параметров функции зависят от того, как проводился эксперимент: пассивно считывались значе­ ния аргумента и функции или значения аргумента устанавливались заранее.

Пассивный эксперимент наиболее часто встречается в процес­ сах получения оценок параметров моделей систем во многих отрас­ лях науки и техники. Здесь требуется найти интервальную оценку параметра 0 функции т) = /(£ , 0), когда точные значения т) и J; мы наблюдать не можем, однако можем наблюдать значения случайных величин у и х :

X i= li+ b i, Уг = T)f + Ei, г =1,2, ..., 71,

где 8* и Si — соответственно ошибки значений аргументов и функ­ ции (случайные величины).

В активном эксперименте мы можем задавать х любые значения

называется контролируемой переменной), на которые налагает­ ся помеха 5 : £ = х + 8. Значения у являются результатом влияния случайной ошибки на истинное значение т) : у = т) + е. Структур­ ное соотношение между наблюдаемыми значениями гг* и у* примет вид у = f{ x + 8, 0) + е и станет обычным уравнением регрессии, по­ скольку теперь х не случайная величина.

Рассмотрим пассивную схему эксперимента. Пусть заданы ста­ тистический ряд экспериментальных значений {ж*} с X и соответ­ ствующий им ряд значений функции {у,} с У, г = 1,2,..., п, п ^ т, где т число оцениваемых параметров 0. Предположим, что пе­ ременные Xi и у* не детерминированы, но являются выборками из генеральных совокупностей X и Y с известными функциями

плотности распределения вероятностей. Переменные Xi = £,i + 8, и Vi = r)i + ti могут быть статистически как зависимы, так и не за­ висимы; могут быть как коррелированы, так и не коррелированы.

В основном мы будем рассматривать выборки независимых на­ блюдений, имеющих один закон распределения.

Пусть fi(x{ 10) и /г(уг 10) — соответственно функции плотности вероятностей случайных величин Х{ и yi, если ц и непрерывны, и соответственно вероятности значений х* и г/j, если распределения величин Xi и yi дискретны; функции /i(x j 10) и / 2(3/110) могут быть как одномерными, так и многомерными.

Найдем выражение для совместной плотности вероятности экс­ периментальных данных при условии, что значения ^ и г)* связаны функциональной зависимостью, но их погрешности 8* и е* явля­ ются независимыми при переходе от одной точки к другой. Тогда совместная плотность вероятности получения одновременно значе­ ний Xi и yi имеет вид

Pi = fl(Xi I 0)/2(Уг I 0).

Совместная плотность вероятности получения п статистически независимых точек (xi, yi) является функцией

П

Ц х, у|0)=П/1(®*10)/2(Уг I0).

г=1 Аналогично можно вывести формулы совместной плотности ве­

роятности для зависимых или коррелированных эксперименталь­ ных точек [40, 49, 89].

Для нас важно то, что в выражения для совместной плотности вероятности входят математические ожидания экспериментальных данных, экспериментальные значения и оцениваемые параметры, так как в / i ( x i | 0) войдут функция математического ожидания &, экспериментальные значения х г и вектор параметров 0, в / 2(3/t 10) — функция математического ожидания т)*, экспериментальные зна­ чения з/j, Xi и вектор параметров 0. Кроме того, нам известно функциональное соотношение г)* = /(£$, 0), которое порождает структурное соотношение между наблюдаемыми случайными ве­ личинами Xi И yi'.

Уг = Ф(ХЬ 0, Si, Si)

Соседние файлы в папке книги