Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лабораторные работы / Бочаров (5 вариант) / Лабораторная работа 3

.docx
Скачиваний:
20
Добавлен:
28.06.2014
Размер:
301.82 Кб
Скачать

НИУ МЭИ (МЭИ(ТУ))

Кафедра прикладной математики

Лабораторная работа №3 по дисциплине: «Математическая статистика»

на тему: «Сравнение оценок»

Выполнил:

студент группы А-13-08

Бочаров Иван

Москва, 2011

Решение конкретной задачи

Пример. Пусть на заводе имеется большая партия из N (тысячи) транзисторов, используемых для сборки некоторого прибора. Выходные параметры прибора (например, надежность, уровень шума, вероятность выхода из режима и т.д.) зависят от обратных токов транзисторов; обратный ток у разных экземпляров различен, и потому можно считать его случайной величиной, причем, как известно технологам, распределённой равномерно в диапазоне от 0 до Imax, где Imax— порог отбраковки, установленный на заводе - изготовителе транзисторов. Следовательно, выходные параметры прибора определяются величиной Imax. Предположим, что по каким-либо причинам значение Imax производителю приборов неизвестно. Ясно, что в этом случае из партии нужно случайным выбором извлечь n (сравнительно немного: десятки) транзисторов, измерить их ток, и по измерениям оценить Imax (неизвестный параметр а). Таким образом, возникает

Статистическая задача: по наблюдениям x1, ..., xn над случайной величиной C , распределённой равномерно на отрезке [0, a], оценить неизвестный параметр a.

сравним три способа оценивания (три оценки):

оценку, полученную методом моментов,

1 = ,                      (1)

оценку, полученную методом максимального правдоподобия (после исправления смещённости),

2 = max xi                  (2)

и оценку, полученную методом порядковых статистик,

3 = 2 0.5 = x(k) + x(k+1), (3)

где 0.5 = — выборочная квантиль порядка 0.5, т.е. выборочная медианаx(k) — член вариационного ряда с номером k; здесь полагаем n = 2k. Точность этих оценок можно сравнить теоретически и экспериментально (статистически).

Теоретическое сравнение оценок

Все три оценки являются несмещенными.

Определим дисперсии оценок:

Da 1 = D(  ) = ,

Da 2 = D(max xi ) = ,

Da 3 = D(x(k) + x(k+1)) » ,

откуда ясно, что a 2 — наиболее точная оценка, а a 3 — наименее.

Поясним приведенные формулы для дисперсий.

Первая:

Da 1 =  =  =  = .

Вторая: определим функцию распределения статистики max xi :

F(z) P{ max xi < z} = P{x1 < z, ..., xn < z} =  ;

Плотность распределения

p(z) = F? (z) = , zI [0, a].

Далее

Ma 2 = M( max xi ) =  = ,

Ma 22 = M=,

Da 2 = Ma 22 — (Ma 2)2= 

ТретьяЖ используем теорему Крамера, согласно которой выборочная p -квантиль имеет дисперсию, равную приближенно  , где xp — истинная p-квантиль, f(x) - плотность распределения наблюдений выборки. В нашем случае (при n = 2k) статистика

0.5 (x(k) +x (k+1) ) m

является выборочной медианой (p = 0.5) , f(x0.5) = 1/a , a 3 = 2m, и потому

Da 3=Dm = =.

Статистическое сравнение оценок

Сформируем 20 выборок из равномерного на [0,10] распределения объема 10:

Вычислим необходимые для оценок статистики, а на их основе вычислим построенные оценки:

Вычислим характеристики оценок:

Приведем график, иллюстрирующий полученные результаты:

Запишем полученные данные в итоговую таблицу и проведем аналогичные манипуляции с выборками объема 40 и 160 с занесением данных в таблицу:

A1

A2

A3

N=10

Amin

6.084

7.398

4.348

Amax

14.221

10.980

18.103

W

8.137

3.582

13.755

Sa

2.236

1.021

3.578

N=40

Amin

8.490

10.208

7.149

Amax

11.459

10.980

12.034

W

2.969

0.772

4.885

Sa

0.951

0.196

1.623

N=160

Amin

9.052

10.752

8.897

Amax

10.767

10.998

11.133

W

1.715

0.246

2.236

Sa

0.453

0.063

0.615

Графически покажем уменьшение СКО с увеличением объема выборки:

Сравнение значений размахов w и СКО Sа для 3 оценок показывает, что оценка a2 1, ... , хn) наиболее точна, а оценка a3 1, ... , хn) - наименее.

Приведенные результаты экспериментального сравнения 3 способов обработки наблюдений показывают следующее:

1. Значения оценок концентрируются в окрестности оцениваемого параметра (проявление свойства несмещенности оценок).

2. С ростом числа наблюдений точность (величина разброса) оценок улучшается (проявление свойства состоятельности).

3. Различные оценки различаются по величине средней ошибки, откуда ясно, что различные способы обработки наблюдений нужно сравнивать по величине среднего значения некоторого критерия качества, например, среднего значения квадрата ошибки.

Задание на самостоятельную работу

Сравним статистически на выборках объема n=10,40,160 две оценки: оценку максимального правдоподобия и медианную оценку

1) среднего нормального распределения и

2) параметра показательного распределения

Приведем заполненные итоговые таблицы:

Для среднего нормального распределения (m=3):

A1

A2

N=10

Amin

1.994

2.046

Amax

3.340

3.549

W

1.346

1.503

Sa

0.313

0.347

N=40

Amin

2.671

2.600

Amax

3.189

3.463

W

0.518

0.863

Sa

0.144

0.232

N=160

Amin

2.861

2.788

Amax

3.176

3.209

W

0.315

0.421

Sa

0.089

0.103

Для параметра показательного распределения (a=1):

A1

A2

N=10

Amin

0.625

0.407

Amax

1.926

1.725

W

1.301

1.318

Sa

0.324

0.375

N=40

Amin

0.643

0.668

Amax

1.379

1.680

W

0.736

1.012

Sa

0.180

0.251

N=160

Amin

0.899

0.834

Amax

1.116

1.285

W

0.217

0.451

Sa

0.051

0.130

Сравнение значений размахов w и СКО Sа для 2 оценок показывает, что оценка a1 1, ... , хn) более точна, чем оценка a2 1, ... , хn).

Приведенные результаты экспериментального сравнения 3 способов обработки наблюдений показывают следующее:

1. Значения оценок концентрируются в окрестности оцениваемого параметра (проявление свойства несмещенности оценок).

2. С ростом числа наблюдений точность (величина разброса) оценок улучшается (проявление свойства состоятельности).