5.2.3. Интервальное оценивание генеральной доли
(вероятности события)
Для определения
вероятностей интересующих нас событий
мы применяем выборочный метод: проводим
n
независимых экспериментов, в каждом из
которых может произойти (или не произойти)
событие А
(вероятность р
появления события А в каждом эксперименте
постоянна). Тогда относительная частота
появлений
событий А
в серии из n
испытаний принимается в качестве
точечной оценки для вероятности p
появления события А
в отдельном испытании. При этом величину
называют выборочной долей
появлений события А,
а р —
генеральной долей.
В силу следствия
из центральной предельной теоремы
(теорема Муавра-Лапласа) относительную
частоту события при большом объеме
выборки можно считать нормально
распределенной с параметрами
и
Поэтому при
доверительный
интервал для генеральной доли можно
построить, используя формулы (5.2)–(5.4):
(5.6)
где
находится
по таблицам функции Лапласа с учетом
заданной доверительной вероятности
При малом объеме
выборки
предельная ошибка
определяется
по таблице распределения Стьюдента
(5.7)
где
и
число степеней свободы
вероятность
(двустороння область).
Формулы (3.6), (3.7) справедливы, если отбор проводился случайным повторным образом (генеральная совокупность бесконечна), в противном случае необходимо сделать поправку на бесповторность отбора (табл. 5.2).
Таблица 5.2
Средняя ошибка выборки для генеральной доли
Генеральная совокупность |
Бесконечная |
Конечная объема N |
Тип отбора |
Повторный |
Бесповторный |
Средняя ошибка выборки |
|
|
Пример 3. С помощью случайного повторного отбора руководство фирмы провело выборочный опрос 900 своих служащих. Среди опрошенных оказалось 270 женщин. Постройте доверительный интервал, с вероятностью 0.95 накрывающий истинную долю женщин во всем коллективе фирмы.
Решение. По условию
выборочная доля женщин составляет
(относительная частота женщин среди
всех опрошенных). Так как отбор является
повторным, и объем выборки велик
предельная ошибка выборки определяется
по формуле
Значение
находим по таблице функции Лапласа из
соотношения
т.е.
Функция Лапласа (приложение 1) принимает
значение 0.475 при
Следовательно,
предельная ошибка
и искомый доверительный интервал
Итак, с вероятностью 0.95 можно гарантировать, что доля женщин во всем коллективе фирмы находится в интервале от 0.12 до 0.48.
Пример 4. Владелец автостоянки считает день «удачным», если автостоянка заполнена более, чем на 80 %. В течение года было проведено 40 проверок автостоянки, из которых 24 оказались «удачными». С вероятностью 0.98 найдите доверительный интервал для оценки истинной доли «удачных» дней в течение года.
Решение.
Выборочная доля «удачных» дней составляет
По таблице функции Лапласа найдем значение при заданной
доверительной
вероятности
Считая отбор бесповторным (т.е. две проверки в один день не проводилось), найдем предельную ошибку:
где
(дней). Отсюда
и доверительный интервал для генеральной доли
С вероятностью 0.98 можно ожидать, что доля «удачных» дней в течение года находится в интервале от 0.43 до 0.77.
