Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Деденко Методы обработки резултатов ядерно-физического 2008

.pdf
Скачиваний:
107
Добавлен:
16.08.2013
Размер:
2.08 Mб
Скачать

Доверительным интервалом называют интервал (θ -δ; θ +δ),

который накрывает неизвестный параметр с заданной надежностью или доверительной вероятностью Р = 1 - α .

Дать интервальную оценку для параметра – это значит задать доверительный интервал для параметра, куда этот параметр попадает с выбранной доверительной вероятностью (или уровнем значимости).

2.2.1. Доверительный интервал для математического ожидания

1. При известной дисперсии

Пусть имеется ряд экспериментальных значений x1, x2, ..., xn, и известна дисперсия σ2. Оценим математическое ожидание одним значением:

x = 1 n xi . n i=1

Здесь x подчиняется N(μ,σ2/n) – нормальному распределению, по

центральной предельной теореме:

 

 

 

 

(

 

μ)

n

 

 

 

μ

x

 

 

x

 

 

 

 

=

 

 

σ

, подчиняется N(0,1) – стандартному нор-

σ (

 

)

 

 

x

мальному распределению.

Выберем уровень значимости α так, чтобы надежность P= 1 - α соответствовала up, где up – квантиль стандартного распределения уровня P, т.е. по определению квантиля

 

 

 

 

μ

 

n

 

 

 

 

x

 

 

=1α = Φ(up ),

P

 

 

 

 

 

 

 

< up

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

где Ф(up) – табулированный интеграл Гаусса, т.е.

 

 

 

 

 

 

u σ

(

x

)

 

= Φ(up ).

P

 

x μ

<

p

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из этого следует, что

 

 

 

 

 

 

 

51

 

 

 

u σ

 

 

 

u σ

= Φ(up ).

 

 

 

 

P x

p

< μ < x +

p

 

 

n

 

 

 

 

 

 

 

n

 

Это выражение понимаем так: оценка μ попадет в заданный интервал в P процентов случаев, а в (1 - P) процентов случаев не попадает. Это собственно и есть интервальная оценка для математического ожидания.

Ширина доверительного интервала

x + upσn x + upσn = 2upnσ .

Можно использовать эту оценку и другим способом. Если заранее задана погрешность δ = upσ / n , то по найденному из таб-

лиц значению квантиля up уровня P и известной дисперсии σ 2 можно определить предстоящий объем выборки n = uP2σ2 δ2 . Та-

кой объем выборки позволит в дальнейшем после проведения эксперимента представить оценку математического ожидания в интервале с заданной погрешностью и заданной доверительной вероятностью. Так как объем выборки – это количество проведенных экспериментов, а, следовательно, это – количество затраченных на получение знания ресурсов, такая оценка желательна при планировании эксперимента.

2. Доверительный интервал для математического ожидания при неизвестной дисперсии

Та же задача, что и выше, но σ2 неизвестна. В этом случае выбирают статистику Стьюдента:

tn1

=

 

x

μ

n.

 

 

S

 

 

 

 

 

Имея определенный объем выборки n и задав доверительную вероятность P = 1 - α, можно по таблицам определить процентную точку t распределения tn-1,P такой, что будет выполняться соотношение:

52

 

 

 

 

 

 

 

μ

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

< t

 

 

 

=1α ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n1, p

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

S

 

 

 

 

t

 

 

S

 

 

 

 

 

 

 

n1, p

 

 

 

 

n1, p

 

 

 

 

 

 

 

 

 

 

P x

 

 

 

 

< μ

< x +

 

 

 

=1

α.

 

 

 

 

 

n

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Полуширина доверительного интервалаδ = tn1,np S зависит от n

и P. Поэтому n определить уже не получится, так как tn1, p зависит от n.

2.2.2. Доверительный интервал для дисперсии

Пусть имеются экспериментальные данные x1, x2, ..., xn. Можно

 

1

n

посчитать выборочную дисперсиюS 2 =

(xi

 

)2. Для по-

x

 

 

n 1 i=1

строения доверительного интервала для σ2 выбирают статистику χ2: S2(n - 1)/σ2 – подчиняется χn-12 .

Для уровня значимости α доверительная вероятность P =1 - α :

 

 

(n 1)S

2

 

 

 

 

P

χ12 <

< χ22

=1α.

 

n1

σ 2

n1

 

 

 

 

По таблицам для χ2-распределения выбирают такие значения

χ12

и χ22 , чтобы соответствующая суммарная площадь под

n1

n1

кривой была равна 1 - P = α (рис. 2.1).

Этому условию удовлетворяет равенство:

 

P(χ2 < χ12) = P(χ2 > χ22) = α/2.

Следовательно

 

χ12

< (n 1)S

< χ

22

 

=1P (χ2

< χ12 )P (χ2

> χ22 )=

P

 

 

 

 

2

 

 

 

 

 

 

 

n

 

 

 

 

 

 

= P (χ2 > χ12 )P (χ2 > χ22 )=1α.

 

 

 

 

 

 

 

 

53

 

 

Рис.2.1. График плотности распределения для χ2

Неравенство χ

2

<

(n 1)S

2

< χ

2

можно преобразовать к виду:

 

 

 

2

1

 

σ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n 1)S 2

<σ

2

<

(n 1)S 2

.

 

 

 

χ2

 

χ2

 

 

 

 

 

 

 

 

 

 

 

 

2,n1

 

 

 

 

 

1,n1

 

Для планирования эксперимента (определение объема выборки

n) данное неравенство использовать сложно, так как χn21 зависит от n, и необходимо оценивать S2 до основного эксперимента.

2.3.Методы точечного оценивания параметров

2.3.1.Метод максимального правдоподобия

Функция правдоподобия

Пусть имеется выборка из n независимых результатов наблюдений: x1...xn. При этом случайная величина x распределена по известному закону f(x,θ) с неизвестным параметром (или парамет-

рами) θ1 , θ2 ,… θr. (θ ).

Совместная функция вероятности L(x,θ) = L(x1,x2,...,xn,θ) в силу независимости каждого измерения может быть представлена в виде:

n

L(x,θ)=f(x1,θ)f(x2,θ)...f(xn,θ) = f (xi ,θ).

i=1

54

Здесь L(x,θ) рассматривается как функция θ при фиксированных, полученных в измерениях x. Чем больше значение каждого из сомножителей в L, тем больше само значение L и тем более вероятна система значений x1, x2, ...,xn при значении параметра θ. Поэтому L называют функцией правдоподобия.

Функция L может быть симметрична, иметь один пик, но она может иметь и сложный вид с несколькими пиками. На рис. 2.2 и 2.3 представлены возможные виды совместной функции вероятности – функции правдоподобия.

 

 

 

Рис.2.2 Одновершинная функция

 

Рис.2.3 Многовершинная функция

правдоподобия

 

правдоподобия

Основы метода максимального правдоподобия

Метод оценки параметра θ состоит в поиске максимума функции правдоподобия L(x1,x2,...,xn,θ). При этом x1,...,xn считаются постоянными, а параметр θ – переменным. Находят такое значение θ, при котором L(x,θ) становится наиболее правдоподобной. При этом каждый из сомножителей в L принимает наибольшее значение, а значит набор значений x и θ наиболее вероятен.

Оценки, полученные таким методом – состоятельные, асимптотически несмещенные и эффективные.

В общем случае доказано, что вторая производная от L(x,θ) меньше 0, и, таким образом, равенство нулю первой производной дает максимальное значение L(x,θ).

55

Максимум можно определять по любой методике. Не изменяя общий подход, можно искать максимум у логарифмической функции L.

Введем обозначение:

l(x1,x2,...,xn,θ) = ln L(x1,x2,...,xn,θ) = ln f (xi ,θ) – логарифми-

ческая функция правдоподобия.

Уравнение для получения оценки параметра можно записать в виде:

dl(x1, x2...xn ,θ) =θ. dθ

Если параметров несколько, например k, то можно записать систему уравнений:

l(x1, x2...xn

,θ)

= 0 ; j = 1...k.

θj

 

 

 

Рассмотрим несколько задач на метод максимального правдоподобия.

Задача 2.1. Оценить математическое ожидание μ и дисперсию

σ2 для величины, подчиняющейся нормальному распределению. Имеется выборка объема n: x1,x2,...,xn.

Функция плотности нормального распределения для величины

x:

f (x,μ,σ

2

)

=

 

1

 

 

 

(x μ)2

 

 

 

exp

 

.

 

 

πσ

2σ 2

Функция правдоподобия:

2

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L(x1, x2 ,...xn ,μ,σ 2 ) = f (xi , μ,σ 2 ) =

 

1

 

 

 

 

 

 

i=1

 

 

 

 

 

n

 

 

 

 

(xi μ)

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

exp

 

2σ

2

 

 

=

 

2πσ

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

56

=(2π)n2 σ n exp 2σ1 2 n (xi μ)2 .

i=1

Логарифмическая функция правдоподобия:

l (x1, x2 ,...xn

,μ,σ 2 )= ln L = − n ln 2π n lnσ 2

 

1

 

n

 

(xi μ)2.

2σ

2

 

2

2

 

 

i=1

Для получения оценок составим систему уравнений, приравняв частные производные по μ и σ2 к нулю:

 

l(x1, x2 ,...xn

,μ,σ 2 )

 

1

n

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

(xi μ) = 0 ,

μ

 

 

σ

2

 

 

 

 

 

i=1

 

 

 

 

 

 

 

l(x , x ,...x ,μ,σ 2 )

=

 

n

2

+

1

4

 

n

 

1 2

2

 

 

 

 

 

 

(xi

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

2σ

 

 

 

2σ

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

Из первого уравнения находится μ:

μ =

1 xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i=1

μ)2 = 0.

=x.

Используя μ , из второго уравнения можно определить σ 2.

σ 2 = 1 n (xi x)2 . n i=1

Оценка σ2 является асимптотически несмещенной, так как несмещенной оценкой σ2 является выборочная дисперсия:

 

1

n

 

 

 

 

S2 =

(xi

 

)2.

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

n 1 i=1

 

 

 

 

 

дисперсии σ 2 =

1

n

Покажем, что оценка

(xi

 

)2 является

x

 

 

 

 

 

 

n i=1

только асимптотически несмещенной, т.е. оценка смещена при малом объеме выборки n.

Определим математическое ожидание полученной оценки:

 

1

n

 

 

 

1

n

 

μ)2 (

 

μ)2

.

запишем оценку σ 2 =

(xi

 

)2 =

(xi

 

x

x

 

n i=1

 

 

 

n i=1

 

 

 

 

 

Найдем математическое ожидание такой величины:

57

{

 

}

n

i=1

 

 

 

 

{

 

 

 

 

}

 

 

2

 

 

1

n

 

2

 

 

 

 

 

 

2

 

 

E σ

 

 

= E

 

 

(xi μ)

 

 

E

 

(x μ)

 

 

.

Помним о том, что по определению

σ

2

 

1

n

2

 

 

= E

 

(xi μ)

 

.

 

 

n i=1

 

 

В соответствии с центральной предельной теоремой:

 

1

n

 

 

2

 

=

σ 2

.

 

E

 

(x μ)

 

 

n

n i=1

 

 

 

 

Тогда математическое ожидание полученной оценки σ 2 :

E{σ 2}=σ 2 σ 2 .

2

Из него следует, что несмещенная оценка σ2 :

σ несмещ2

 

n

 

σ 2 =

1

n

= S 2 =

(xi

 

)2.

x

n 1

 

 

 

 

n 1 i=1

Задача 2.2. Оценить математическое ожидание на основании выборки объема n. Случайная величина подчиняется распределению Пуассона.

Решение. Имеется x1,...,xn; оценить μ. Функция распределения для x: f(x,μ) = μxe-μ/x!. Функция правдоподобия:

L(x1,x2,...,xn,μ) =

μx1

eμ

μx2

eμ ...

μxn

eμ ;

 

x !

 

x

2

!

 

x

n

!

 

 

1

 

 

 

 

 

 

 

логарифмическая функция правдоподобия:

n

L(x1,x2,...,xn,μ) = xk ln μ nμ ln(x1 !x2 !...xn !) .

k =1

Для поиска максимума приравняем нулю частную производную:

ln L(x , x ,...x ,μ)

=

1

n

1 2

n

 

 

xk n = 0 .

 

 

 

 

μ

 

 

 

μ

k =1

 

 

58

 

 

Ответ: μ = 1 n xk n k =1

2.3.2. Бейесовский подход к получению оценок

Метод Бейеса учитывает априорное знание о виде закона распределения исследуемой величины при анализе экспериментальных результатов.

Определение 1. Априорная вероятность p(θ) параметра θ характеризует возможность осуществления различных значений θ до того, как проведен эксперимент.

Определение 2. Апостериорная вероятность q(θ|x) характеризует возможность осуществления различных значений θ после того, как к априорному значению добавлено знание, извлеченное из

экспериментальных данных x .

Теорема Бейеса. Апостериорная вероятность параметра θ получается умножением априорной вероятности на функцию правдоподобия:

θ = p(θ)L(x |θ) q( / x) .

const

Const находится из условия нормировки:

+∞q(θ | x)dθ =1 для непрерывных θ,

−∞

или

n

q(θi | x) =1 для дискретных θ,

i=1

где n – количество измерений; L(x/θ) – плотность условного распределения выборки х при заданном значении θ совпадает с функцией правдоподобия:

const = +∞p(θ)L(x |θ)dθ ,

−∞

или

59

n

const = p i (θi )L(x |θi ).

i=1

Любой постоянный множитель в функциях p и L может быть опущен.

Точечной бейесовской оценкой для θ служит среднее значение, вычисленное по апостериорному распределению:

θ = Eθ {θ | x} = θq(θ | x)dθ,

если априорная вероятность неизвестна, то применяют постулат Бейеса.

Постулат Бейеса: Если распределение априорной вероятности для θ неизвестно, то, предполагая, что значения θ априори равновероятны, мы можем охарактеризовать полную неосведомленность относительно θ и следует положить: P(θ) = const.

Задача 2.3 (на бейесовский подход). Оценить параметр θ, когда θ принимает только два значения θ1 = 0 или θ2 = 1.

Априорное распределение задается априорными вероятностями qi для θi (i = 1,2). Имеется выборка из одного наблюдения – значение величины x. Апостериорное распределение параметра θ имеет вид:

q(θ = 0| x) =

q1L(x |θ = 0)

 

 

.

q L(x |θ = 0)

+ q L(x |θ =1)

1

2

 

Так как выборка только из одного измерения, то вместо функции максимального правдоподобия L(x|θ) можно использовать f(x|θ) – вероятность того, что x принимает какие-либо значения при заданных θ:

q(θ = 0| x) =

q1 f (x |θ = 0)

,

q f (x |θ = 0)

+ q f (x |θ =1)

1

2

 

q(θ =1| x) =1q(θ = 0| x).

Бейесовскую оценку θ получаем, если выберем значение θ, дающее максимум условной апостериорной плотности q(θ|x). Таким образом, за счет априорной плотности q(θ) подправляется оценка максимального правдоподобия.

60

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]