Три основных формы интегральной теоремы Лапласа
Для лучшего усвоения материала введем условную классификацию утверждений интегральной теоремы Лапласа и перечислим задачи, которые решаются с помощью каждой из них.
1.
В качестве первой формы теоремы примем
общую формулу для вычисления вероятности
попадания случайной величины в заданные
интервалы:
.
2. Вторая форма предназначена для вычисления вероятности попадания случайной величины в интервалы, симметричные относительно центра: Р(|m – a| tm) = 2Ф(t).
Действительно,
для симметричных интервалов m2 = a + tm ,
m1 = a ‑ tm ,
,
.
Вычисляем:
Р(|m – a| tm) = Р(m1 m m2) = Ф(t) – Ф(–t) = Ф(t) + Ф(t) = 2Ф(t).
В качестве примера применения выведенной формулы ответим на вопросы: "Какова вероятность того, что отклонения случайной величины m от центра a = np не превысят m , 2m , 3m ?
Используя таблицы интегральной функции Лапласа, получим:
Р(|m – a| m) = 2Ф(1) = 20,3413 = 0,6826; Р(|m ‑ a| 2m) = 2Ф(2) = 20,4772 = 0,9544; Р(|m ‑ a| 3m) = 2Ф(3) = 20,4987 = 0,9974.
Только в 3-х случаях из 1000 возможны появления отклонений, превышающие три сигмы; с гарантией 95% можно утверждать, что для распределения Лапласа (и нормального закона Гаусса) случайные отклонения не превысят две сигмы (это утверждение может быть ошибочным лишь в 5-и случаях из 100).
3. Запишем
неравенство |m – a| tm
в эквивалентном виде
и далее (разделив обе части неравенства
на n):
.
Получаем
следующее выражение, которое мы назовем
"Третьей формой интегральной теоремы
Лапласа":
или же
.
В описании этой формулы два раза
встречается слово вероятность Р
и р,
что приводит к неприятным словосочетаниям
типа: "Вероятность того, что относительная
частота
отклонится от вероятности р
появления события в одном испытании не
более чем на ,
равна удвоенному значению функции
Лапласа с аргументом
".
Громоздко и малопонятно. Желательно
избегать в одном предложении двух
одинаковых слов, да еще с разным смыслом;
для этого в любом языке есть синонимы.
Например, вероятность некоторого
утверждения
можно назвать "гарантией",
"надежностью", "уровнем доверия".
Кстати, вероятность противоположного
утверждения называют "уровнем
значимости" и обычно обозначают
греческой буквой альфа: = 1 – Р.
Если потребуется, то вероятность р
появления события в одном испытании
можно назвать "долей в совокупности",
а относительную частоту – просто долей.
Выражение
называется "погрешностью". Теперь
теорему можно сформулировать так: "С
уровнем доверия P = 2Ф(t)
можно утверждать, что отклонение
относительной частоты
от своей доли в совокупности р
(от своего предельного значения р)
не превысит погрешности
.
Формула или связывает вместе четыре величины n, p, , P. Если в условиях задачи заданы любые три величины, то четвертую можно найти по вышеприведенной формуле. В связи с этим появляется 4 типа задач.
I. Дано n, p, . Требуется найти Р.
Заданы
параметры распределения n,
p.
Дополнительно задана допустимая
погрешность .
Требуется найти гарантию утверждения
,
как часто оно будет выполняться.
Решение: Из выражения для погрешности находим t и вычисляем уровень доверия (гарантию) P = 2Ф(t).
Пример. В процессе статистических испытаний монета (р = 0,5) будет подброшена n = 100 раз. Можно ли утверждать, что в результате опыта отклонение относительной частоты от своего теоретического значения (погрешность ) не превысит 0,01?
Найдем
уровень доверия утверждения
.
Из выражения
вычисляем t = 0,2
и далее по таблицам Лапласа находим
P = 2Ф(0,2) = 20,079 = 0,158.
Уровень доверия 15,8% не достаточен, чтобы
гарантировать выполнение заданного
условия; т.к. только в 16 случаях из 100
возможны столь отклонения ( = 0,01).
II. Дано n, p, Р. Требуется найти .
Наши утверждения должны быть надежными со стандартным уровнем доверия 90% , 95% , или 99% . Какую предельную погрешность мы можем ожидать с таким заданным уровнем доверия?
Решение: Из соотношения P = 2Ф(t) при заданном Р по таблицам интегральной функции Лапласа находим t. Далее вычисляем предельную ожидаемую погрешность
.
Пример. Предполагается подбросить монету 100 раз. Какую погрешность следует ожидать с гарантией 95% ?
Из
выражения 0,95 = 2Ф(t)
с помощью таблиц Лапласа находим
t = 1,96 2.
Далее вычисляем
.
Иными словами, относительная частота
при 100 испытаниях может варьировать в
довольно широких пределах от 0,4 до 0,6.
III. Дано, p, , Р. Требуется найти n.
Погрешность уменьшается с увеличением числа испытаний. Сколько же требуется провести испытаний, чтобы получать надежные и точные прогнозы?
Решение:
Из соотношения P = 2Ф(t)
при заданном Р
находим t.
Далее записываем условие для предельной
погрешности
,
откуда при известных p,
,
t находим
n:
.
Пример. Сколько раз надо подкинуть монету, чтобы с гарантией 90% снизить погрешность до 0,05? Иными словами, сколько требуется испытаний, чтобы с гарантией 90% относительная частота появления герба при бросании монеты не выходила за пределы интервала (0,45; 0,55)?
Из
соотношения 0,9 = 2Ф(t)
находим t = 1,64.
далее из неравенства
определяем
.
IV. Дано n, P и m/n . Найти р.
В предыдущих задачах были заданы параметры распределения и требовалось предсказать результат опыта (задача теории вероятностей). В задаче IV известен результат опыта, и надо сделать заключение о параметрах распределения (именно в этом и заключается статистический способ определения вероятности).
Решение:
Соотношение P = 2Ф(t)
при заданном Р
определяет t.
Далее записываем условие | m/n – p | ,
которое должно выполняться с заданным
уровнем доверия Р:
.
Из этого неравенства находим р.
Пример. В результате 400 бросков монеты относительная частота появления герба получилась равной 0,5. Какие значения параметра р согласуются с такими результатами опыта? Заключение должно иметь 90%‑й уровень доверия.
Из
соотношения 0,9 = 2Ф(t)
находим t = 1,64.
Далее выписываем неравенство
,
возводим его в квадрат и преобразуем:
(0,5 – р)2 0,0822р(1 – р);
1,0067р2 – 1,0067р + 0,25 0;
отсюда р1 р р2 ,
где р1 , р2
– корни квадратного трехчлена:
р1,2 = 0,5 0,041.
Итак, по результатам опыта можно сделать
заключение, что с гарантией 90% искомая
вероятность р
не выйдет за пределы интервала
0,46 р 0,54.
В
заключение темы "Интегральная теорема
Лапласа" заметим, что основная
асимптотическая формула
дает достаточно точные значения лишь
для больших n > 100.
Причина этого – в слишком неточной
замене интегральной суммы интегралом
с теми же самыми пределами интегрирования.
На рис. 5.4 изображен полигон распределения
Лапласа для n = 10,
p = 0,3
(локальная формула Лапласа является
достаточно точной аппроксимацией
распределения Бернулли даже для небольших
значений n).
Пусть требуется вычислить
Р(2 m 6) =P(2) + P(3) + P(4) + P(5) +
+ P(6) = P(m).
Так как m = 1,
то Р(2 m 6) = P(m)m.
Это – площадь столбиковой фигуры
(см. рис. 5.4) с границами (m1 – 0,5)
и (m2 + 0,5),
поэтому более правильным будет замена
интегральной суммы интегралом, пределы
которого несколько шире, чем в общепринятой
формуле:
.
Так, для нашего примера n = 10, p = 0,3 точное значение Р(2 m 6), рассчитанное по формулам Бернулли, равно P(m) = 0,840; по стандартной формуле Лапласа – Ф(t6) – Ф(t2) = 0,736 (погрешность 12,4%); по уточненной формуле – Ф(t6,5) – Ф(t1,5) = 0,842 (погрешность всего 0,2%).
