
- •Содержание
- •Введение
- •Глава 3. Элементы математической статистики
- •3.1. Выборочный метод
- •3.1.1 Задачи и методы математической статистики
- •3.1.2 Виды выборки
- •3.2. Графическое представление эмпирических данных
- •3.2.1. Эмпирическая функция распределения. Кумулята
- •3.2.2 Полигон и гистограмма
- •3.3. Числовые характеристики вариационного ряда
- •3.4. Статистические оценки параметров распределения
- •3.4.2 Точечные оценки параметров распределения
- •3.4.3. Метод моментов
- •3.4.4 Метод наибольшего (максимального) правдоподобия
- •3.5. Интервальные оценки параметров распределения
- •3.5.1 Доверительная вероятность. Доверительные интервалы
- •3.5.2 Доверительный интервал для оценки математического ожидания нормального распределения при известном среднем квадратическом отклонении
- •3.5.3 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном среднем квадратическом отклонении
- •3.5.4 Доверительный интервал для дисперсии и среднего квадратического отклонения
- •3.5.5 Доверительный интервал для вероятности успеха в схеме Бернулли
- •3.6. Статистическая проверка статистических гипотез
- •3.6.1 Статистические гипотезы. Основные понятия
3.5.5 Доверительный интервал для вероятности успеха в схеме Бернулли
Пусть проводится n независимых испытаний, в которых событие А наступает с неизвестной постоянной вероятностью p. Найдем для p точечную и интервальную оценки с помощью выборочных испытаний.
Точечная оценка вероятности. Составим таблицу статистического распределения выборки объема n, в которой m раз произошел «успех» (выпала «1») и n-m раз «неуспех» (выпал «0») (таб. 4):
Таблица 4
xi |
0 |
1 |
|
(n-m)/n |
m/n |
Неизвестная вероятность р равна математическому ожиданию генерального распределения. В качестве оценки для вероятности р возьмем эмпирическое среднее:
.
Т.о., точечной оценкой неизвестной вероятности p может служить значение относительной частоты (статистической вероятности)
,
(3.29)
где m – число успехов в серии n испытаний.
Относительная частота успеха является несмещенной оценкой, т.к. ее математическое ожидание равно оцениваемому параметру:
M(W)=M(m/n)=M(m)/n=np/n=p.
Т.к. дисперсия биномиального распределения D(n)=npq, то
D(W)=D(m/n)=.
Тогда среднее квадратическое отклонение относительной частоты найдем по формуле
.
(3.30)
Интервальная оценка вероятности. Согласно свойству статистической устойчивости относительной частоты в испытаниях Бернулли (ч.1, п.2.12.4) вероятность отклонения относительной частоты от вероятности в независимых повторных испытаниях можно найти с помощью функции Лапласа по формуле:
где
аргумент функции Лапласа u=
зависит от значения надежности .
Тогда справедливо неравенство:
(3.31)
Заменив
на
,q
на 1-p,
а также учитывая, что относительная
частота
получаем, что с вероятностью
выполняется неравенство:
.
Итак, для построения доверительного интервала для вероятности р при поиске аргумента u функции Лапласа необходимо воспользоваться таблицами нормального распределения (Таблица 3, приложение 1).
Границы
интервала зависят от неизвестной
величины р,
однако, при большом объеме выборки n
неизвестное р
можно заменить его эмпирическим значением
:
.
(3.32)
Полученная
формула доверительного интервала
позволяет решить еще одну задачу:
установить объем выборки n,
для которого с надежностью
точность оценки
,
полученной по ней для вероятностир,
не превосходит заданного значения ,
т.е.
.
Действительно,
по формуле доверительного интервала с
вероятностью
выполняется неравенство
.
Это означает, что результат тем точнее,
чем больше объем выборки. Нужное значение
объемаn
можно найти из уравнения
,
т.е.
,
причем «хороший» результат получается
уже дляnpq9.
Замечание. Для бесповторной выборки (выборки без возвращения) из генеральной совокупности объема N длина доверительного интервала с надежностью (уровнем доверия) может быть вычислена по формуле:
.
(3.33)
Такую же поправку (уменьшение дисперсии в (1-n/N) раз) следует сделать и для случая бесповторной выборки в формулах доверительных интервалов для среднего значения нормального распределения.
Задача 15. Выборочный статистический опрос ста студентов показал, что из них 80 человек устраиваются на работу в процессе учебы в ВУЗе. Найти интервальную оценку вероятности того, что случайно выбранный студент совмещает учебу в ВУЗе и работу, при условии, что полученный результат допускает ошибку не более, чем в 5% случаев.
Решение:
В
качестве точечной оценки возьмем частоту
(или эмпирическую вероятность):
.
Зная вероятность ошибки =0.05 (или доверительную вероятность 1-=0.95, по таблицам значений функций Лапласа (Таблица 3, приложение 1) найдем значение параметра u=1.96. Тогда двусторонний доверительный интервал вычисляем по формуле (3.32):
.
Итак, доверительный интервал для эмпирической вероятности в нашей задаче имеет вид: 0.72p0.88.
Правила построения доверительных интервалов для неизвестных параметров распределения сведем в таблице 5:
Таблица 5.
Неизвестный параметр |
Условия оценки |
Вид используемого распределение |
Границы интервала |
Доверительный интервал | |
Математическое
ожидание
|
|
|
m,
где
|
| |
|
|
m,
где
| |||
Дисперсия
|
|
|
|
| |
|
распределение |
|
| ||
|
|
| |||
Вероятность
|
|
|
p, где |
|