- •Математическая статистика вводные замечания
- •I. Относительная частота как оценка вероятности
- •II. Эмпирическая функция распределения как оценка функции распределения
- •III. Среднее выборочное как оценка математического ожидания
- •IV. Задача точечного оценивания
- •V. Группировка наблюдений
- •VI. Оценка плотности вероятности
- •VII. Интервальное оцениваеие
- •1°. Приближённый доверительный интервал для вероятности события.
- •2°. Доверительный интервал для параметра a нормального закона при известном s.
- •3°. Доверительные интервалы для параметров нормального закона.
- •VII. Проверка статистических гипотез
- •VIII. Метод наименьших квадратов
VII. Интервальное оцениваеие
Пусть X~F(x, q), причём вид функции распределения F(x, q) известен, а параметр q неизвестен (считаем его одномерным). Требуется по выборке указать такой интервал [ , ], который с заданной вероятностью a накрывает неизвестный параметр q:
P{ £q£ }a.
Сам
интервал [
,
] называется
доверительным,
а a
– доверительной
вероятностью.
Концы интервала – функции от выборки:
(x1, x2, ¼ , xn), (x1, x2, ¼ , xn)
и являются случайными величинами. Желательно иметь a близким к единице, а интервал – поменьше. Однако увеличивая a, мы будем получать всё более широкие интервалы и тем самым всё менее информативные интервалы, всё менее интересные. Желательным свойством можно считать условие: 0, тогда при достаточно большом числе наблюдений можно как угодно точно локализовать параметр q.
В качестве a обычно берут числа 0,99, 0,95, 0,9. Выбор доверительной вероятности зависит от практических последствий в случае, когда доверительный интервал не накроет q. При a0,9 следует ожидать, что в среднем мы будем промахиваться в десятой части всех применений данного доверительного интервала. Если это не страшно, то можно брать a0,9. Если же нас в этих случаях ждут большие материальные потери или это ведёт к опасностям для человеческой жизни, то такая доверительная вероятность недопустимо мала.
Легко
строить доверительный интервал для q,
если мы имеем для параметра точечную
оценку
(x1,
x2,
¼
, xn)
и хотя бы приближённо знаем закон её
распределения. Именно в этом случае по
закону распределения
,
задавая a,
мы можем находить такое e,
чтобы
P{|
q|£e}a.
Иногда a называют надёжностью оценки, а e – её точностью. Здесь можно переписать неравенство под знаком вероятности в следующем виде:
P{ e£q£ e}a,
и искомый доверительный интервал имеет вид [ e, e] и длину 2e.
Разберём несколько задач на построение доверительных интервалов.
1°. Приближённый доверительный интервал для вероятности события.
Пусть имеется событие A и для его вероятности P(A)p мы хотим построить доверительный интервал, сделав n опытов. Допустим, что в этих опытах событие A наступило m раз.
По интегральной теореме Муавра-Лапласа:
P{a£
£b}»
dy.
Возьмём ae, be:
P{|
|£e}»
dyF(e),
"0.
Стоящее под знаком вероятности неравенство заменим равносильным:
P{m22mnpn2p2£e2npq}»F(e), "0,
или, заменяя q на 1p:
P{p2(n2e2n)p(2mne2n)m2£0}»F(e), "0.
Кривая yp2(n2e2n)p(2mne2n)m2 как функция p является параболой.
Пусть её корни p1, p2, причём p1p2, т. е.
P{p1£p£p2}»F(e), "0
и теперь мы можем указать процедуру построения доверительного интервала для p:
a) Задаём доверительную вероятность a.
b) По a находим e из уравнения F(e)a; корень уравнения легко определяется с помощью таблицы функции Лапласа.
c) Решаем квадратное уравнение p2(n2e2n)p(2mne2n)m20, находим его корни p1, p2, p1p2.
d) Искомый приближённый доверительный интервал имеет вид: [p1, p2].
Точность этого интервала зависит от того, достаточно ли мала ошибка при использовании теоремы Муавра-Лапласа, можно ли практически считать, что
m~N(np,
).
