2.4 Закон больших чисел.
Закон больших чисел – это группа теорем, описывающих поведение случайных величин (СВ) в предельной ситуации, когда число опытов бесконечно возрастает. Эти теоремы играют важную роль в практической деятельности, так как позволяют нам ориентироваться при принятии решений об устойчивости событий, моделируемых с использованием СВ, обосновывают замену числовых характеристик СВ их приближенными значениями (оценками) и решают другие подобные вопросы. Естественно, что перед нами не стоит задача подробного изложения и доказательства этой обширной группы теорем. Мы познакомимся с некоторыми из них, особо подчеркнув практическую важность каждой.
Исторически первая предельная теорема принадлежит Я. Бернулли. На её доказательство в XVIII веке он потратил 20 (двадцать!) лет. Сейчас эта теорема рассматривается как частный случай другой, более общей, теоремы, чем мы и воспользуемся ниже.
2.4.1 Неравенство Чебышёва.
Теорема. Вероятность того, что СВ X, имеющая конечную дисперсию D(X), уклонится по модулю от своего центра рассеивания E(X) на величину, не меньшую некоторого > 0, ограничена сверху отношением D(X) / 2, т.е.:
P(|X – E(X)| ) D(X) / 2. (159)
Доказательство (на примере ДСВ). Дисперсия ДСВ по определению (59) имеет вид:
D(X) = *pi.
Исключим из этой суммы те слагаемые, для которых |xi – E(X)| < . В результате такой операции возникнет неравенство
D(X) > *pi,
которое только усилится, если в правой части все сомножители |xi – E(X)| сделать равными :
D(X) > 2 *=2 * P(|X – E(X)|).
Если теперь левую и правую части полученного неравенства разделить на 2 и заменить это неравенство противоположным, то мы придем к искомому утверждению (159). #
Данный результат примечателен тем, что он получен на уровне числовых характеристик, а не на уровне конкретного закона распределения, т.е. он применим к любым дискретным распределениям, удовлетворяющим условиям теоремы. Аналогично проводится доказательство для НСВ, которые удовлетворяют тем же условиям.
Задача 2.19. Каков верхний предел вероятности того, что результаты, получаемые с помощью прибора, характеризующегося стандартом X, уклонятся от известного центра рассеивания E(X) по модулю на величину , не меньшую 2X?
Дано: E(X); D(X) = ; = 2X.
Найти: P(|X – E(X)|) – ?
Решение: Вычисляем искомую вероятность по формуле (159), подставляя в неё исходные данные:
P(|X – E(X)|X) D(X) / 2 = / 4= 0,25. #
Итак, не более 25% результатов (сопоставьте это число с ответом, полученным в предположении нормальности распределения в Задаче 2.11) могут уклониться по модулю от центра рассеивания больше чем на двойной стандарт. Иначе, можно предположить, что мы имеем дело с экспериментом, устойчивость частот которого не наблюдается, и следует искать причины этой неустойчивости.
2.4.2 Теорема Чебышёва.
Теорема. Среднее арифметическое неограниченного числа стохастически не связанных в совокупности и равноточных измерений одной и той же величины, имеющих конечные математическое ожидание и дисперсию, сходится по вероятности к МО этих измерений, т.е.
P(|/n – E(X)| < ) вер.1, (160)
где – некоторое малое положительное число, а запись «вер.1» – это условная запись фразы «сходится по вероятности», смысл которой будет раскрыт в следующих абзацах.
Перед доказательством этой теоремы, играющей важную роль связующего звена между теорией вероятностей и математической статистикой, необходимо ввести новые понятия: сходимость по вероятности [1] и статистическая копия (СК) [8].
Первое понятие близко по форме к понятию предела в математическом анализе, но имеет принципиальное качественное отличие от него. Если некоторая функция F детерминированного аргумента x, зависящая от параметра n, имеет предел L, когда n ≥ N, то это значит, что она ни при каких обстоятельствах не уклонится от данного предела по модулю больше, чем на величину > 0. Сходимость по вероятности определяется для функции случайного аргумента x. В этой ситуации, при n ≥ N, вероятность уклонения F от L по модулю больше, чем на величину > 0, стремится к нулю, хотя сам выход остается возможным событием.
Второе понятие заключается в следующем. СВ X, имеющую возможные значения xi и числовые характеристики E(X) и D(X), можно представить как ССВ, все компоненты которой Xi имеют одинаковые числовые характеристики, т.е. E(xi) = E(X) = E(Xi) и D(xi) = D(X) ==D(Xi). Суть дела состоит в том, что числовые характеристики СВ – это сконцентрированная информация о некоторых её особенностях. В связи с этим утверждение типа результат xi измерен со средним квадратическим отклонением x некорректно. Каждый результат xi имеет конкретное, но неизвестное отклонение от среднего =xi = xi – E(X). По совокупности этих отклонений и находят обобщённый показатель x. Замена же xi (элементов спектра СВ X) на компоненты Xi случайного вектора Xn1 с идентичными характеристиками допустима и не противоречива.
Вернемся к теореме.
Дано: X – СВ; xi – результат измерений (элемент спектра X); i=1,2,…,n, где n – количество измерений; > 0; E(X) ≠∞ – её конечное МО; D(X) ≠∞ – её конечная дисперсия;
E(xi) = E(X) – по принципу статистической копии;
D(xi) = D(X) – по тому же принципу;
Kij = 0 для всех i ≠ j – следствие стохастической несвязанности измерений в совокупности.
Доказать: P(|/n – E(X)| < )вер.1.
Доказательство. Рассмотрим СВ – среднее арифметическое (СА):
= /n (161)
и найдем её МО и дисперсию по формулам (109) и (123):
= E(/ n) = () / n = (n *E(X)) / n = E(X); (162)
D(X) =D(/ n) = () / n2 = (n *D(X)) / n2 = D(X) / n. (163)
Теперь запишем неравенство Чебышёва (155) для СА
≤ / ε2
и заменим в нем СА и его ЧХ в соответствие с результатами (162)-(163):
P(|(/ – E(X)| ≥ ε) ≤ D(X) / (n ε2).
Нас интересует вероятность противоположного события:
P(|(/n – E(X)|< ) > 1 – D(X) / (n ε2)
Устремив в правой части n к бесконечности, мы увидим, что
(D(X) / (n ε2)) = 0,
так как дисперсия D(X) – конечна.
Окончательно, получаем теорему (160):
P(|/ n – E(X)| < ) вер.1. #
Практическая значимость теоремы Чебышёва заключается в том, что она обосновывает состоятельность СА в качестве приближенного значения МО. Смысл термина состоятельность заключается в том, что при корректной математической обработке измерений увеличение их количества ведет к улучшению качества окончательных результатов, т.к.
= D(X) / n. (164)