Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

книги / Математические методы принятия решений

..pdf

Скачиваний:

Добавлен:

13.11.2023

Размер:

22.94 Mб

Скачать

☆

<<< < Предыдущая 27 28 29 30 31 32 33 34 35 36 37 3839 / 5939 40 41 42 43 44 45 46 47 48 49 50 51 > Следующая >>>

Пусть произвели выборку {х*}, г = 1,2, и получили п независимых значений, имеющих нормальное распределение. Функ ция правдоподобия в этом случае имеет вид

71			(ц	- т)2 ï
Ц т , о 2) = Ц	^ = -	ехр{	(ц	- т)2 ï
г = 1				2о2 У
г = 1
Тогда		71
1 ^	(Xi ~ т	71	ь	а 2 + const.
In L = —2^2 2	(Xi ~ т	)2 - у	ь	а 2 + const.

г=1

Используя метод максимума правдоподобия, получим уравнения

gin L	1 n
dm	2 0е* _ m ) = °.
	i=l

д In L

до2 2? i > ‘- m)2 - 2o2è =0-

i=l

Отсюда получим следующие оценки:

т = — V Xi = х,	а 2 = — V (xi - х)2.
п 2=1	п 2=1

Математическое ожидание оценки т есть M(m) = М(х) = M(xj) = = [!, т. е. т является несмещенной оценкой.

Найдем математическое ожидание оценки З2. Математические ожидания каждого слагаемого в формуле для 32 равны. Тогда

1
М(Э/ ) = — nM[(Xj —X f ] =
= M [ ( x i -	[i)2 + (х - р)2 - 2(xi - р)(х -		[i)] =
	2	G1	„ О 2	2 гг — 1
	= о2 +	------2 — = ст2 ------- .
Получили, что оценка З2 является смещенной.		п	Т1
Получили, что оценка З2 является смещенной.
Несмещенная оценка (исправленная) дисперсии имеет вид
=	Ô 2 = ~ — Г ^ ( X i - X )2 .
	i= l

При выполнении условий регулярности (наиболее важное из них —независимость границы области определения функции /(х , 0) от 0) оценки, полученные методом максимального правдоподобия,

состоятельны и, кроме того, асимптотически нормальны и эффек тивны.

Если функция правдоподобия имеет вторые производные по 6 в интервале, включающем истинное значение 0о, и если, кроме того,

М[ ^ ] - 0

и существует матрица

элементы шторой отличны от нуля в указанном интервале, то оцен ка 6 асимптотически нормально распреде

	лена со средним значением 0<>и дисперси
	ей [iV(0) ] - ‘.
	Важным		свойством		оценки	ММП
	является ее инвариантность: оценка т
	функции т(0) является функцией оцен
	ки	т = т(0).	Например,		оценка	функ
	ции	т(0) = 02 равна		квадрату оценки 0,
	но оценка т не обязательно несмещенная.
		Интервальная оценка параметра 0 мо
Рис. 7.10. Интервальная	жет быть получена по графику функции
	правдоподобия (рис. 7.10).
оценка, построенная по
		О д н о м е р н ы й		с л у ч а й .		Пусть
функции правдоподобия
	результаты		наблюдений		распределены

по нормальному закону N(\x, а2). Логарифм функции правдоподо бия имеет вид параболы:

In Ц х, Р) = In С - у		£ ( X i - р)2 = In С - у		£ ( X i - X)2 - у ([1 - х)2
		г=1	г=1
с точшй	максимума при р = х. Смещаем			параболу так, чтобы
In Ц х ) = 0.
Пусть In L = —1/2 и п = 1. Тогда
		(Р ~ х)2 = J_
		2	2 '
Отсюда	получим	доверительный	интервал х — 1 ^ ^ ^ х + 1.

Однако из свойств нормального распределения следует, что

	P { ( æ - ( j t ) 2 ^ 1} = 0 ,6 8 3 ,
т.е. Р { х - 1	+ 1} = 0,683 (см. рис. 7.10).
Пусть In L = —2; тогда (\|i —х)2/2 = 2. Отсюда получаем дове


рительный интервал \|ц -		х\ ^ 2, или х - 2 ^ ц ^ х + 2.
Из условия нормального распределения имеем
	Р{(х —р)2 < 2} = 0,955,
или P{æ —2 ^ ц ^ ж	+ 2} = 0,955.
О б щ и й с л у ч а й .		Если L(x, 0) является непрерывной функ
цией и имеет один	максимум, можно найти оператор д(В,х), ко
торый преобразует	кривую In L Q(X , 0) в параболу вблизи функ

ции G(x) наблюдений:

ln L g(x,9m = j ( g - G ( x ) ) 2.

В асимптотическом случае доказывается, что g можно выбрать независимо от х. Тогда G является оценкой максимального правдо подобия для д.

Используя свойство инвариантности ММП, можно сделать та кие же выводы о параметре д, какие делались о параметре нор мального распределения 6. Преобразуем доверительный интервал для значений g в соответствующий интервал для значений 6. По

скольку

In Le(x, 9) = In Lg(x, дф)),

то значения 0, соответствующие интервалу для д, при In Lg = —2 яв ляются точками пересечения прямой In L = —2 с графиком функции In L Q(X , 0). Таким образом, можно сделать выводы об интерваль ной оценке параметра непараболической функции правдоподобия, не проводя преобразования к параболической функции правдопо добия.

Заметим, что интервальные оценки параметров, полученные по графику функции In L, будут отличаться от тех же оценок, полученных с помощью матрицы вторых производных, так как в последнем случае проводится квадратичная аппроксимация функ ции In L в окрестности точки максимума. Однако графическая процедура имеет свои особенности:

13 — 4077

1)точность способа преобразования имеет порядок 1/п , так как преобразуем экспериментальную функцию правдоподобия, тогда как нужно было бы получить (преобразовать) нормальное распре деление вместо полученного распределения;

2)полученный интервал может быть «широким» и несиммет ричным для первоначальной переменной 0;

3)если функция правдоподобия имеет несколько максимумов, то эта процедура выявляет несколько интервалов, однако довери тельным интервалом для 0 может быть только один непрерывный интервал с тем же самым вероятностным содержанием (не следу ет забывать, что интервальная оценка указывает интервал, который

свероятностью р накрывает истинное значение 0);

4)если предложенным методом получаем неопределенные (или бесконечные) доверительные интервалы, то для решаемой задачи требуется более сложная интерпретация, чем интерпретация ее как задачи нахождения единственной оценки ММП и доверительного интервала.

§7.7. Байесовский подход к оцениванию параметров моделей

Вбайесовском подходе неизвестный параметр 0 является не де терминированной (постоянной) величиной, а случайной величиной, для которой априори известна плотность распределения к(0) воз можных значений 0.

После наблюдения х получим плотность апостериорного рас пределения вероятностей

к(01 X) =

Байесовский доверительный интервал (0„, 0„) с вероятностным содержанием р определяется следующим образом:

Согласно этому определению доверительный интервал соответ ствует доле р полной веры наблюдателя в значение оценки парамет ра 0, т. е. составляет р/(1 —р). Полное апостериорное распределе ние тс(0 | х) как бы заменяется дискретным двухточечным распреде лением:

p { e „ ^ e ^ e B} = p , P {e*[e„,eB]} = i - p .

Как и в классическом варианте нахождения интервальной оцен ки, доверительный интервал определяется неоднозначно. В обоих случаях не указывается, какое значение внутри интервала является наиболее вероятным. Поэтому желательно дополнительно провести точечную оценку по максимуму функции распределения вероятно стей к(01 х).

Замечание. Для нелинейных функций оценку свободных пара метров часто проводят после линеаризации заданной функции, на пример: г) = ЛеХг => In т) = In A + Xx или T)I = 0j + 0гх, где r)i = In T), 01 = In A, 02 = X. Однако здесь возникают две проблемы: единствен ности оценок и изменения законов распределения исходных дан ных, — которые повлияют на величину интервальных оценок.

§7.8. Интервальные оценки линии регрессии

ипрогнозируемых значений функции

Пусть для функции г) = /(х , 0) получены оценки 0 и их дис персии D(0). Это означает, что по результатам наблюдений можно построить семейство линий. Для модели г) = /(х , 0) оценкой ли нии регрессии т) будет функция у = /(х , 0). Необходимо определить доверительные интервалы для значений у, которые с заданной до верительной вероятностью р накроют истинные значения г). Кроме того, необходимо найти доверительные интервалы для прогнозов, которые накроют новое наблюдение у, соответствующее заданному значению х.

Рассмотрим эти оценки в случае, когда функция т) = 0о + 01(х —х) является линейной, где х —среднее значение переменной х. Тогда дисперсия значений у определяется по формуле

D(y) = D(0O) + D[0j(х - х)] = D(0<>) + (х - x)2D(0,).

13*

Величина —— подчиняется распределению Стьюдента с п — р v D(y)

степенями свободы; при заданном р квантиль распределения Стью дента равна £р и интервальная оценка имеет вид

Р{у - Ц у /Щ ) < т) < у + tpy/Щ ) } = Р-

В общем случае для линии регрессии, описываемой уравнением Tj(x, 0) = f{x, 0), дисперсия вычисленных значений у определяется выражением

j= l

1= 1j =2

где N — размерность вектора 0, D (0j , 0*) — корреляционный момент

ЛЛ

случайных величин 6j и 0j.

N
Для линейных функций т)(ж, 0) = 2	дисперсия вычис-
i=i

ляемых значений у в точке х согласно той же формуле может быть записана в виде

D(y) = / TCr)D(0)/(aO;

	/Ч
здесь f(x ) — вектор, D (0) — матрица оценок 0.
Например, для	прямой	линии	г)(ж, 0) = 0о + 0i(æ —х), если
fix ) = (1, х —х)Т, имеем
О Д = ( 1, х - х)	^	( х '	. ) = О Д ) + (X - х)20(в,).

Задав серию значений х и вычислив соответствующие им значе ния дисперсии ст2(у ) = D (y), получим интервальную оценку линии. Для прямой линии интервальную оценку можно получить анали тически [40]. Интервальные границы для М(т)|£о) в случае прямой линии будут следующие:

Tj - i l - a/2«7(ri) М(т) I ^о) < Т) + ^1 —a/2CT(^),

(7. 16)

где о2(т)) = (1, Ç0)D(9)(1, £0)т>а — уровень значимости.

Огибающая семейства всех возможных прямых будет кривой второго порядка, уравнение которой получим из формулы (7.16):

£(Уг - 6l - 62Жг)2 ^ С«(1 + 0i), i= 1

где Са — константа, величина которой определяется уровнем значи мости а.

Принимая за начало отсчета наблюдаемые средние значения х и у, перепишем это неравенство в виде [40]

02 (s x — С х ) —202Sxy + 0] ^ C'a — Sy,

где s2, Sy и sXy — соответственно выборочные дисперсии и выбо рочная ковариация величин х и у. Это условие можно считать огра ничением, которому удовлетворяет «истинная» прямая.

Найдем огибающую семейства всех возможных прямых. Урав нение огибающей [40] имеет вид

	(у - в2 х ) 2 _ ( 0 2 У + х ) 2 _			2 2
	C'a —Ь\		Ъ2- С а	+ 2’
где
	b i= s x2 - § * ,	b2 = s2x + B2sxy,		02 > 0,	b2 >b\.
	02
Новое наблюдаемое (прогнозируемое) значение у отсчитывает
ся от точек на линии		оценки	функции регрессии		у, и	величина
Iу —у\|
■-, ■	: имеет распределение Стьюдента. Предположим, что но-
V °(y -	У)
вое наблюдение имеет дисперсию а 2; тогда
	D(у - у )	= а2 + D(0O) + (х -		X )2D(0I ).
Интервальные оценки для точек прогноза имеют вид
	р{у- <рл/°(у - у) <у<у+<pVD(y-y)} = Р-					(7.17)

Для к измерений, проводимых в точке прогноза, вместо значения дисперсии о2 в формуле для D(у —у) надо взять величину а2/к. Для параметров прямой линии нетрудно получить оценки

			Е ( X i - х ) У г
0 0 = ^	Уг =	У,	г=1_ _ _ _ _ _
0 0 = ^	Уг =	У,	Е (Xi - X)2
г=1			Е (Xi - X)2
			<=1
Пусть D(ÿi) = а 2, г = 1,2, ... , п. Тогда
	D(6o) = D(ÿ) =		^ ,
			п
'S(*i “ x)îн		E f o -	x ) 2D (y i)
D(9i)= D		_i____________
D(9i)= D	Æ)2		E fo - x)2 ‘
S(*i -	Æ)2	(E (Z	E fo - x)2 ‘
		(E (Z	* “ Æ)2)

Из формул для D(0o) и D(0i) следует, что дисперсия D(у) минималь на при х = х. Задавая различные значения х, можно найти интер вальные оценки линии регрессии (линии I и II на рис. 7.11) при заданном (3 и интервальную оценку нового наблюдения yi для про гнозируемой ТОЧКИ Xi.

Рис. 7.11. И нтервальная оценка линии регрессии

На рис. 7.11 точка (xj, yi) показывает нижнее значение интер вальной оценки прогнозируемого значения у* в точке х*.

§ 7.9. Активный и пассивный эксперименты. Оценивание параметров функции известного вида

впассивном эксперименте

Внастоящем параграфе будут рассмотрены алгоритмы, позволя ющие находить оценки свободных параметров элементарных функ ций при наличии погрешностей и в значениях аргумента, и в значе ниях функции. Эти алгоритмы объединены названием «конфлюэнт ный анализ» (англ, confluence — слияние, confluent — сливающийся). Когда и значения функции, и значения аргумента — случайные ве личины, процедуры оценки свободных параметров функции зависят от того, как проводился эксперимент: пассивно считывались значе ния аргумента и функции или значения аргумента устанавливались заранее.

Пассивный эксперимент наиболее часто встречается в процес сах получения оценок параметров моделей систем во многих отрас лях науки и техники. Здесь требуется найти интервальную оценку параметра 0 функции т) = /(£ , 0), когда точные значения т) и J; мы наблюдать не можем, однако можем наблюдать значения случайных величин у и х :

X i= li+ b i, Уг = T)f + Ei, г =1,2, ..., 71,

где 8* и Si — соответственно ошибки значений аргументов и функ ции (случайные величины).

В активном эксперименте мы можем задавать х любые значения

(х называется контролируемой переменной), на которые налагает ся помеха 5 : £ = х + 8. Значения у являются результатом влияния случайной ошибки на истинное значение т) : у = т) + е. Структур ное соотношение между наблюдаемыми значениями гг* и у* примет вид у = f{ x + 8, 0) + е и станет обычным уравнением регрессии, по скольку теперь х не случайная величина.

Рассмотрим пассивную схему эксперимента. Пусть заданы ста тистический ряд экспериментальных значений {ж*} с X и соответ ствующий им ряд значений функции {у,} с У, г = 1,2,..., п, п ^ т, где т —число оцениваемых параметров 0. Предположим, что пе ременные Xi и у* не детерминированы, но являются выборками из генеральных совокупностей X и Y с известными функциями

плотности распределения вероятностей. Переменные Xi = £,i + 8, и Vi = r)i + ti могут быть статистически как зависимы, так и не за висимы; могут быть как коррелированы, так и не коррелированы.

В основном мы будем рассматривать выборки независимых на блюдений, имеющих один закон распределения.

Пусть fi(x{ 10) и /г(уг 10) — соответственно функции плотности вероятностей случайных величин Х{ и yi, если ц и непрерывны, и соответственно вероятности значений х* и г/j, если распределения величин Xi и yi дискретны; функции /i(x j 10) и / 2(3/110) могут быть как одномерными, так и многомерными.

Найдем выражение для совместной плотности вероятности экс периментальных данных при условии, что значения ^ и г)* связаны функциональной зависимостью, но их погрешности 8* и е* явля ются независимыми при переходе от одной точки к другой. Тогда совместная плотность вероятности получения одновременно значе ний Xi и yi имеет вид

Pi = fl(Xi I 0)/2(Уг I 0).

Совместная плотность вероятности получения п статистически независимых точек (xi, yi) является функцией

Ц х, у|0)=П/1(®*10)/2(Уг I0).

г=1 Аналогично можно вывести формулы совместной плотности ве

роятности для зависимых или коррелированных эксперименталь ных точек [40, 49, 89].

Для нас важно то, что в выражения для совместной плотности вероятности входят математические ожидания экспериментальных данных, экспериментальные значения и оцениваемые параметры, так как в / i ( x i | 0) войдут функция математического ожидания &, экспериментальные значения х г и вектор параметров 0, в / 2(3/t 10) — функция математического ожидания т)*, экспериментальные зна чения з/j, Xi и вектор параметров 0. Кроме того, нам известно функциональное соотношение г)* = /(£$, 0), которое порождает структурное соотношение между наблюдаемыми случайными ве личинами Xi И yi'.

Уг = Ф(ХЬ 0, Si, Si)

<<< < Предыдущая 27 28 29 30 31 32 33 34 35 36 37 3839 / 5939 40 41 42 43 44 45 46 47 48 49 50 51 > Следующая >>>

Соседние файлы в папке книги