книги / Математические методы принятия решений
..pdfсостоятельны и, кроме того, асимптотически нормальны и эффек тивны.
Если функция правдоподобия имеет вторые производные по 6 в интервале, включающем истинное значение 0о, и если, кроме того,
М[ ^ ] - 0
и существует матрица
элементы шторой отличны от нуля в указанном интервале, то оцен ка 6 асимптотически нормально распреде
|
лена со средним значением 0<>и дисперси |
|||||
|
ей [iV(0) ] - ‘. |
|
|
|
|
|
|
Важным |
свойством |
оценки |
ММП |
||
|
является ее инвариантность: оценка т |
|||||
|
функции т(0) является функцией оцен |
|||||
|
ки |
т = т(0). |
Например, |
оценка |
функ |
|
|
ции |
т(0) = 02 равна |
квадрату оценки 0, |
|||
|
но оценка т не обязательно несмещенная. |
|||||
|
|
Интервальная оценка параметра 0 мо |
||||
Рис. 7.10. Интервальная |
жет быть получена по графику функции |
|||||
правдоподобия (рис. 7.10). |
|
|
||||
оценка, построенная по |
|
|
||||
|
О д н о м е р н ы й |
с л у ч а й . |
Пусть |
|||
функции правдоподобия |
|
|||||
|
результаты |
наблюдений |
распределены |
по нормальному закону N(\x, а2). Логарифм функции правдоподо бия имеет вид параболы:
In Ц х, Р) = In С - у |
£ ( X i - р)2 = In С - у |
£ ( X i - X)2 - у ([1 - х)2 |
||
|
|
г=1 |
г=1 |
|
с точшй |
максимума при р = х. Смещаем |
параболу так, чтобы |
||
In Ц х ) = 0. |
|
|
|
|
Пусть In L = —1/2 и п = 1. Тогда |
|
|
||
|
|
(Р ~ х)2 = J_ |
|
|
|
|
2 |
2 ' |
|
Отсюда |
получим |
доверительный |
интервал х — 1 ^ ^ ^ х + 1. |
1)точность способа преобразования имеет порядок 1/п , так как преобразуем экспериментальную функцию правдоподобия, тогда как нужно было бы получить (преобразовать) нормальное распре деление вместо полученного распределения;
2)полученный интервал может быть «широким» и несиммет ричным для первоначальной переменной 0;
3)если функция правдоподобия имеет несколько максимумов, то эта процедура выявляет несколько интервалов, однако довери тельным интервалом для 0 может быть только один непрерывный интервал с тем же самым вероятностным содержанием (не следу ет забывать, что интервальная оценка указывает интервал, который
свероятностью р накрывает истинное значение 0);
4)если предложенным методом получаем неопределенные (или бесконечные) доверительные интервалы, то для решаемой задачи требуется более сложная интерпретация, чем интерпретация ее как задачи нахождения единственной оценки ММП и доверительного интервала.
§7.7. Байесовский подход к оцениванию параметров моделей
Вбайесовском подходе неизвестный параметр 0 является не де терминированной (постоянной) величиной, а случайной величиной, для которой априори известна плотность распределения к(0) воз можных значений 0.
После наблюдения х получим плотность апостериорного рас пределения вероятностей
к(01 X) =
Байесовский доверительный интервал (0„, 0„) с вероятностным содержанием р определяется следующим образом:
0:
Величина —— подчиняется распределению Стьюдента с п — р v D(y)
степенями свободы; при заданном р квантиль распределения Стью дента равна £р и интервальная оценка имеет вид
Р{у - Ц у /Щ ) < т) < у + tpy/Щ ) } = Р-
В общем случае для линии регрессии, описываемой уравнением Tj(x, 0) = f{x, 0), дисперсия вычисленных значений у определяется выражением
j= l |
J |
1= 1j =2 |
где N — размерность вектора 0, D (0j , 0*) — корреляционный момент
ЛЛ
случайных величин 6j и 0j.
N |
|
Для линейных функций т)(ж, 0) = 2 |
дисперсия вычис- |
i=i |
|
ляемых значений у в точке х согласно той же формуле может быть записана в виде
D(y) = / TCr)D(0)/(aO;
|
/Ч |
|
|
здесь f(x ) — вектор, D (0) — матрица оценок 0. |
|||
Например, для |
прямой |
линии |
г)(ж, 0) = 0о + 0i(æ —х), если |
fix ) = (1, х —х)Т, имеем |
|
|
|
О Д = ( 1, х - х) |
^ |
( х ' |
. ) = О Д ) + (X - х)20(в,). |
Задав серию значений х и вычислив соответствующие им значе ния дисперсии ст2(у ) = D (y), получим интервальную оценку линии. Для прямой линии интервальную оценку можно получить анали тически [40]. Интервальные границы для М(т)|£о) в случае прямой линии будут следующие:
Tj - i l - a/2«7(ri) М(т) I ^о) < Т) + ^1 —a/2CT(^), |
(7. 16) |
где о2(т)) = (1, Ç0)D(9)(1, £0)т>а — уровень значимости.
Огибающая семейства всех возможных прямых будет кривой второго порядка, уравнение которой получим из формулы (7.16):
п
£(Уг - 6l - 62Жг)2 ^ С«(1 + 0i), i= 1
где Са — константа, величина которой определяется уровнем значи мости а.
Принимая за начало отсчета наблюдаемые средние значения х и у, перепишем это неравенство в виде [40]
02 (s x — С х ) —202Sxy + 0] ^ C'a — Sy,
где s2, Sy и sXy — соответственно выборочные дисперсии и выбо рочная ковариация величин х и у. Это условие можно считать огра ничением, которому удовлетворяет «истинная» прямая.
Найдем огибающую семейства всех возможных прямых. Урав нение огибающей [40] имеет вид
|
(у - в2 х ) 2 _ ( 0 2 У + х ) 2 _ |
2 2 |
|
|
||
|
C'a —Ь\ |
Ъ2- С а |
+ 2’ |
|
|
|
где |
|
|
|
|
|
|
|
b i= s x2 - § * , |
b2 = s2x + B2sxy, |
02 > 0, |
b2 >b\. |
||
|
02 |
|
|
|
|
|
Новое наблюдаемое (прогнозируемое) значение у отсчитывает |
||||||
ся от точек на линии |
оценки |
функции регрессии |
у, и |
величина |
||
Iу —у| |
|
|
|
|
|
|
■-, ■ |
: имеет распределение Стьюдента. Предположим, что но- |
|||||
V °(y - |
У) |
|
|
|
|
|
вое наблюдение имеет дисперсию а 2; тогда |
|
|
||||
|
D(у - у ) |
= а2 + D(0O) + (х - |
X )2D(0I ). |
|
||
Интервальные оценки для точек прогноза имеют вид |
|
|||||
|
р{у- <рл/°(у - у) <у<у+<pVD(y-y)} = Р- |
(7.17) |
Для к измерений, проводимых в точке прогноза, вместо значения дисперсии о2 в формуле для D(у —у) надо взять величину а2/к. Для параметров прямой линии нетрудно получить оценки
|
|
|
Е ( X i - х ) У г |
|
0 0 = ^ |
Уг = |
У, |
г=1_ _ _ _ _ _ |
|
Е (Xi - X)2 |
||||
г=1 |
|
|||
|
|
|
<=1 |
|
Пусть D(ÿi) = а 2, г = 1,2, ... , п. Тогда |
||||
|
D(6o) = D(ÿ) = |
^ , |
||
|
|
|
п |
|
'S(*i “ x)îн |
E f o - |
x ) 2D (y i) |
||
D(9i)= D |
|
_i____________ |
||
Æ)2 |
|
E fo - x)2 ‘ |
||
S(*i - |
(E (Z |
|||
|
|
* “ Æ)2) |
Из формул для D(0o) и D(0i) следует, что дисперсия D(у) минималь на при х = х. Задавая различные значения х, можно найти интер вальные оценки линии регрессии (линии I и II на рис. 7.11) при заданном (3 и интервальную оценку нового наблюдения yi для про гнозируемой ТОЧКИ Xi.
Рис. 7.11. И нтервальная оценка линии регрессии
На рис. 7.11 точка (xj, yi) показывает нижнее значение интер вальной оценки прогнозируемого значения у* в точке х*.
§ 7.9. Активный и пассивный эксперименты. Оценивание параметров функции известного вида
впассивном эксперименте
Внастоящем параграфе будут рассмотрены алгоритмы, позволя ющие находить оценки свободных параметров элементарных функ ций при наличии погрешностей и в значениях аргумента, и в значе ниях функции. Эти алгоритмы объединены названием «конфлюэнт ный анализ» (англ, confluence — слияние, confluent — сливающийся). Когда и значения функции, и значения аргумента — случайные ве личины, процедуры оценки свободных параметров функции зависят от того, как проводился эксперимент: пассивно считывались значе ния аргумента и функции или значения аргумента устанавливались заранее.
Пассивный эксперимент наиболее часто встречается в процес сах получения оценок параметров моделей систем во многих отрас лях науки и техники. Здесь требуется найти интервальную оценку параметра 0 функции т) = /(£ , 0), когда точные значения т) и J; мы наблюдать не можем, однако можем наблюдать значения случайных величин у и х :
X i= li+ b i, Уг = T)f + Ei, г =1,2, ..., 71,
где 8* и Si — соответственно ошибки значений аргументов и функ ции (случайные величины).
В активном эксперименте мы можем задавать х любые значения
(х называется контролируемой переменной), на которые налагает ся помеха 5 : £ = х + 8. Значения у являются результатом влияния случайной ошибки на истинное значение т) : у = т) + е. Структур ное соотношение между наблюдаемыми значениями гг* и у* примет вид у = f{ x + 8, 0) + е и станет обычным уравнением регрессии, по скольку теперь х не случайная величина.
Рассмотрим пассивную схему эксперимента. Пусть заданы ста тистический ряд экспериментальных значений {ж*} с X и соответ ствующий им ряд значений функции {у,} с У, г = 1,2,..., п, п ^ т, где т —число оцениваемых параметров 0. Предположим, что пе ременные Xi и у* не детерминированы, но являются выборками из генеральных совокупностей X и Y с известными функциями
плотности распределения вероятностей. Переменные Xi = £,i + 8, и Vi = r)i + ti могут быть статистически как зависимы, так и не за висимы; могут быть как коррелированы, так и не коррелированы.
В основном мы будем рассматривать выборки независимых на блюдений, имеющих один закон распределения.
Пусть fi(x{ 10) и /г(уг 10) — соответственно функции плотности вероятностей случайных величин Х{ и yi, если ц и непрерывны, и соответственно вероятности значений х* и г/j, если распределения величин Xi и yi дискретны; функции /i(x j 10) и / 2(3/110) могут быть как одномерными, так и многомерными.
Найдем выражение для совместной плотности вероятности экс периментальных данных при условии, что значения ^ и г)* связаны функциональной зависимостью, но их погрешности 8* и е* явля ются независимыми при переходе от одной точки к другой. Тогда совместная плотность вероятности получения одновременно значе ний Xi и yi имеет вид
Pi = fl(Xi I 0)/2(Уг I 0).
Совместная плотность вероятности получения п статистически независимых точек (xi, yi) является функцией
П
Ц х, у|0)=П/1(®*10)/2(Уг I0).
г=1 Аналогично можно вывести формулы совместной плотности ве
роятности для зависимых или коррелированных эксперименталь ных точек [40, 49, 89].
Для нас важно то, что в выражения для совместной плотности вероятности входят математические ожидания экспериментальных данных, экспериментальные значения и оцениваемые параметры, так как в / i ( x i | 0) войдут функция математического ожидания &, экспериментальные значения х г и вектор параметров 0, в / 2(3/t 10) — функция математического ожидания т)*, экспериментальные зна чения з/j, Xi и вектор параметров 0. Кроме того, нам известно функциональное соотношение г)* = /(£$, 0), которое порождает структурное соотношение между наблюдаемыми случайными ве личинами Xi И yi'.
Уг = Ф(ХЬ 0, Si, Si)