Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математика_Семестр4_МетодПособие.pdf
Скачиваний:
492
Добавлен:
05.06.2015
Размер:
3.73 Mб
Скачать

110

Пример. Объем генеральной совокупности N = 10000, объем выборки n=1000. В результате измерения интересующего нас признака X получено: xв =15,5, D(X) = 3,15. Найти вероятность того, что среднее значение признака Х отличается от своей оценки на величину ε 0,1, если выборка повторная; бесповторная.

 

 

 

 

Выборка повторная:

 

 

 

 

 

По формуле (7.3) имеем

 

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

P(

xв x0

<ε)= 2Ф

 

 

,

 

 

где σ =

σ

0

 

.

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

Заменяя неизвестное σ , его оценкой, получим

σ0 σ = D(X)= 3,15 =1,775,

следовательно,

 

σ

 

 

 

 

1,775

 

 

 

 

 

 

 

 

 

 

P(

 

 

 

 

 

 

 

0,1)

 

 

0,1

 

 

 

σ =

 

 

 

 

=

 

 

 

 

 

 

 

= 0,056

и

 

15,5x0

= 2Ф

 

 

 

=

0,9265.

 

 

 

 

 

 

 

 

 

 

 

 

0,056

 

n

 

 

1000

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборка бесповторная.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При этом

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

n

 

 

3,15

 

 

 

1000

 

 

 

 

 

σ =

 

 

 

0

 

1

 

 

 

 

 

 

n

1

 

 

 

 

=

 

 

 

 

 

1

 

 

 

= 0,053

и

 

 

 

 

 

 

 

 

 

 

 

 

1000

10000

 

 

 

 

 

 

 

n

 

 

 

 

N

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(

 

 

 

 

 

0,1)=

 

 

0,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15,5x0

2 Ф

 

 

 

 

= 0,9412.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,053

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7.5. Метод максимального правдоподобия

Для построения точечных оценок в статистике применяют различные методы: метод максимального правдоподобия, метод моментов, метод наименьших квадратов. Ограничимся первым из них.

Пусть X – случайная величина, которая в результате n независимых опытов приняла значения: x1, x2 ,...,xn , и пусть закон распределения X из-

111

вестен, но с точностью до некоторого параметра a, от которого он зав и- сит. Требуется найти подходящую точечную оценку a параметра a.

Введем обозначение: P(X = xi ) = P(xi ,a) и составим функцию L, равную произведению вероятностей независимых событий X = x1,...,X = xn , то есть вероятности их совместного осуществления:

L(x1,x2 ,...,xn ,a) = P(x1,a) P(x2 ,a) ... P(xn ,a).

Функция L(x1,x2 ,...,xn ,a) аргумента a (xi фиксированные числа) называется функцией правдоподобия дискретной случайной величины X.

Идея метода заключается в том, что в качестве точечной оценки параметра a принимается такое значение a , при котором функция правдоподобия принимает максимальное значение. Действительно, в экспериментах реализуются обычно именно те значения x1, x2 ,...,xn случайной величины X, вероятность которых максимальна.

Оценку a называют оценкой максимального правдоподобия.

Для отыскания максимума функции правдоподобия применяются обычные правила отыскания экстремума функции:

Решается уравнение

dL

= 0 (его называют уравнением правдопо-

 

da

 

 

 

 

 

 

 

добия), затем вычисляется вторая производная

d 2 L

.

Если она при

a =

a

 

da2

 

 

 

 

 

 

 

 

 

отрицательна, то a - точка максимума. Найденную точку максимума a и принимают за оценку наибольшего правдоподобия параметра a.

Замечания.

1.Функции L и lnL достигают максимума при одном и том же значении параметра a Поэтому вместо отыскания максимума функции L часто ищут максимум функции lnL – логарифмической функции правдоподобия, что оказывается удобнее.

2.Для непрерывной случайной величины X функцией правдоподобия называется функция параметра a вида:

L(x1,x2 ,...,xn ,a) = f (x1,a) f (x2 ,a) ... f (xn ,a),

где f (xi ,a) - плотность вероятностей.

112

Оценка максимального правдоподобия неизвестного параметра распределения непрерывной случайной величины строится так же, как и для дискретной случайной величины.

Пример. Найти методом максимального правдоподобия оценки параметров a и σ нормального закона распределения:

(xa)2

f (x) = σ 12π e2σ 2 ,

если значения, принятые случайной величиной X в результате n испытаний равны: x1, x2 ,...,xn .

Так как нормальный закон распределения характеризуется двумя параметрами a1 = a и a2 =σ, то функция правдоподобия будет функцией

двух переменных:

 

 

1

 

 

 

(x

a)2

 

1

 

 

 

(x

a)2

 

1

 

 

 

(x

a)2

L =

 

 

e

1

 

2

 

 

e

2

 

2

...

 

e

n

 

2

 

 

 

 

 

2σ

 

 

 

 

 

2σ

 

 

 

 

 

2σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

2π

 

 

 

 

σ 2π

 

 

 

 

σ 2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Логарифмируя это выражение, получим:

 

 

 

 

 

 

 

 

(x

a)2

 

 

1

 

 

i

 

= −nlnσ + ln(

 

 

 

 

 

 

 

 

 

ln L = ln

 

 

 

 

 

+ lne

 

2σ 2

 

n

 

 

 

 

n

 

(

 

2π )

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x

a)2

 

 

 

1

 

e

i

 

=

 

 

 

2σ 2 .

 

 

 

 

 

σ n (

 

2π )n

 

 

 

 

 

2π )n ∑(xi 2 a)2 .

2σ

Частные производные от логарифмической функции правдоподобия по a и σ равны:

 

ln L

= −

 

1

 

[2(x1

a) 2(x2 a) ...2(xn a)]=

1

∑(xi na),

 

a

2σ 2

σ 2

 

 

 

 

 

 

 

 

 

 

 

ln L

= −

n

+

∑(xi

a)2

.

 

 

 

 

 

σ

 

σ

σ

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому система уравнений правдоподобия примет вид

 

 

 

 

 

 

 

 

 

 

 

ln L = 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ln L

= 0

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

113

σ12 ∑(xi na)= 0,

n + ∑(xi a)2 = 0.

σ σ 3

Решая эту систему, получим:

a =

xi

,

σ

2

=

∑(xi a)2

.

n

 

n

 

 

 

 

 

 

Следовательно, искомые оценки максимального правдоподобия бу-

дут:

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

 

(xi a )2

 

 

a =

= xв,

σ* = D

*

=

 

.

n

 

 

n

 

 

 

 

 

 

 

 

 

7.6. Точность оценки. Доверительный интервал и доверительная вероятность

Точечные оценки параметров распределения при выборках малого объема могут существенно отличаться от действительных значений оцениваемых параметров. Поэтому в статистике часто пользуются интервальными оценками (особенно при небольшом числе наблюдений), которые служат для оценки точности и надежности точечных оценок. Интервальной называется оценка, которая определяется двумя числами – концами интервала, в котором заключено неизвестное значение параметра.

Пусть для неизвестного параметра θ найдена по данным выборки несмещенная оценка θ*. Чтобы оценить возможную при этом ошибку, назначим некоторую достаточно большую вероятность γ такую, что любое событие, происходящее с вероятностью γ, можно считать практически достоверным. Найдем далее такое ε > 0, при котором с вероятностью γ можно утверждать, что отклонение θ* от θ по модулю не будет превосходить ε, то есть

P(

 

θ θ

 

<ε)=γ

или

P(θ ε <θ <θ +ε)=γ.

 

 

Величина ε называется точностью оценки. Вероятность γ, с которой осуществляется неравенство θ θ <ε , называется доверительной

114

вероятностью или надежностью оценки. Обычно γ задается равным 0,95;

0,99;

0,999.

 

 

 

 

 

Интервал Iγ =

 

θ* ε; θ + ε

 

, в котором с надежностью γ заклю-

 

 

 

 

 

 

 

 

 

чено неизвестное значение параметра θ, называется доверительным интервалом. Так как длина интервала и положение его на оси абсцисс, определяемое центром θ*, случайны, то говорят, что доверительный интервал Iγ накрывает неизвестный параметр θ с заданной надежностью γ.

 

 

7.7. Доверительный интервал для оценки

 

 

генеральной средней при известном среднем

 

 

квадратическом отклонении

 

Пусть для случайной величины X с неизвестной генеральной сред-

ней

x0 по данным выборки объема n найдена точечная оценка

xв =

n

Будем предполагать для простоты, что σ(xв ) известно. Для

1xi .

 

n i=1

 

построения доверительного интервала необходимо найти такое ε > 0, чтобы выполнялось неравенство

 

 

 

P(

 

xв x0

 

<ε)=γ .

 

 

 

 

 

 

 

Воспользуемся тем, что

xв

 

как сумма независимых

одинаково рас-

пределенных случайных величин

 

Xi при достаточно большом n (а прак-

тически уже при n >10-20)

согласно теореме Ляпунова имеет закон рас-

пределения, близкий к нормальному. Итак, считая, что X распределена по

нормальному закону с параметрами M (xв )= x0

(так как

xв -несмещенная

оценка) и σ(xв ), можно записать

 

 

 

 

 

 

 

 

 

 

P(

 

xв x0

 

<ε)= 2Ф

ε

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

Учитывая, что вероятность Р задана и равна γ, получим

P(xв tσ < x0 < xв + tσ )= 2Ф(t)=γ,