
- •Раздел 1. Элементы теории вероятностей и математической статистики 2
- •Раздел 2. Основы проверки статистических гипотез 65
- •Раздел 1. Элементы теории вероятностей и математической статистики
- •1. Основные определения и теоремы
- •1.1. Предмет теории вероятности
- •1.2. Событие как результат испытания
- •1.3. Частость и вероятность. Классическое определение вероятности
- •1.4. Теорема сложения вероятностей
- •1.5. Теорема умножения вероятностей
- •2. Повторные независимые испытания
- •2.1. Биномиальное распределение вероятностей
- •2.2. Наивероятнейшее число появлений события
- •2.3. Асимптотическая формула биномиального распределения (локальная терема Лапласа). Формула Пуассона
- •2.4. Интегральная теорема Лапласа
- •Упражнения.
- •3. Случайная величина и ее числовые характеристики
- •3.1. Случайная величина и ее распределение
- •3.2. Математическое ожидание и его свойства
- •3.3. Дисперсия и среднее квадратическое отклонение
- •3.4. Нормальный закон распределения и понятие о теореме Ляпунова
- •4. Закон больших чисел
- •4.1. Неравенства Маркова и Чебышева
- •4.2. Теорема Чебышева
- •5. Основные сведения из математической статистики
- •5.1. Генеральная совокупность и выборка
- •5.2. Устойчивость выборочных средних
- •5.3. Определение параметров выборки с помощью теоремы Ляпунова
- •5.4. Понятие о доверительных границах для средних
- •5.5. Примеры математической обработки данных выборочного наблюдения
- •5.6. Понятие о критериях согласия
- •6. Элементы теории корреляции
- •6.1. Функциональная и корреляционная зависимости
- •6.2. Линейная корреляция.
- •6.3. Коэффициент корреляции
- •6.4. Упрошенный способ вычисления коэффициента корреляции
- •6.5. Простейшие случаи криволинейной корреляции
- •6.6. Понятие о множественной корреляции
- •Упражнения
- •Раздел 2. Основы проверки статистических гипотез
- •1. Статистические модели
- •2. Проверка статистических гипотез (общие положения)
- •3. Примеры статистических моделей и гипотез, ранги и ранжирование
- •4. Проверка статистических гипотез (прикладные задачи)
- •4.1. Схема испытаний Бернулли
- •4.2. Критерий знаков для одной выборки
- •5. Проверка гипотез в двухвыборочных задачах
- •5.1. Критерий Манна-Уитни
- •5.2. Критерий Уилкоксона
- •6. Парные наблюдения
- •6.1. Критерий знаков для анализа парных повторных наблюдений
- •6.2. Анализ повторных парных наблюдений с помощью знаковых рангов (критерий знаковых ранговых сумм Уилкоксона)
- •Список использованной литературы
- •Список рекомендуемой литературы
4. Закон больших чисел
При ознакомлении с результатами проведения серии одинаковых испытаний мы отмечали, что число появлений случайного события при небольшом количестве испытаний не подчиняется той закономерности, которая соответствует объективной возможности (т. е. вероятности его появления в отдельном испытании). Однако с ростом числа испытаний такая закономерность начинает проявляться и чем дальше, тем ярче.
Аналогичный результат имеет место и в применении к случайной величине.
Здесь отдельные значения случайной величины могут значительно отклоняться от ее среднего значения, но средняя арифметическая большого числа отдельных значений случайной величины уже незначительно отклоняется от ее среднего значения.
Эти факты, проверявшиеся на многократных сериях различных наблюдений, неизменно показывали, что отклонения от закономерностей при отдельных наблюдениях взаимно погашаются по мере возрастания числа наблюдений.
Однако соответствующие результаты, если не вскрыть их природы, дают только внешнее содержание закона больших чисел в виде выражения устойчивого характера частости или значения средней как закономерности, связанной с большим числом наблюдений.
Первые теоремы, посвященные таким результатам, были характерны именно этой своей ограниченностью; построенные на частных вопросах, они не касались тех общих условий, без соблюдения которых рассматриваемая закономерность не имеет места. К тому же небезупречным, уже с позиций позднейших требований строгости, было обоснование построенных выводов.
Вот почему относящиеся к этому вопросу теоремы Бернулли и Пуассона привлекли к себе внимание еще молодого Чебышева, который кардинально обосновал условия их применимости и дал безупречный метод их доказательства.
В результате работ Чебышева, Маркова и Ляпунова, продолженных и развитых Бернштейном, Хинчиным, Колмогоровым, Гнеденко и другими советскими математиками, теоремы, относящиеся к закону больших чисел, приобрели глубокое научное содержание и находят свое плодотворное практическое применение в самых разнообразных отраслях деятельности.
4.1. Неравенства Маркова и Чебышева
Чтобы иметь представление о случайной величине, важно знать характеристику ее отклонений от среднего значения. В связи с этим введены понятия среднего отклонения и среднего квадратического отклонения и установлены способы их вычисления. Однако это не дает возможности устанавливать количественные оценки вероятности тех или иных значений этих отклонений.
Между тем эти оценки имеют большое значение во многих вопросах теории вероятностей и ее применения в статистике.
Критерии таких оценок были впервые разработаны знаменитыми русскими учеными А. А. Марковым и П. Л. Чебышевым.
1. Неравенство Маркова.
Если случайная величина Х не принимает
отрицательных значений и
— произвольная положительная
величина, то
где
.
Это неравенство оценивает вероятность того, что значения случайной величины Х не превосходят заданной величины > 0.
Пусть дискретная случайная величина Х
задана таблицей распределения1)
и пусть каждое из значений
не превосходит величины ,
а каждое из значений
превосходит величину .
Так как все значения случайной величины
Х положительны, то
Это неравенство усилится, если каждое из значени заменить величиной . Это дает:
.
Отсюда
Заметим, что сумма, записанная в левой
части этого неравенства, в соответствии
с теоремой сложения вероятностей,
определяет вероятность того, что
случайная величина
.
Поэтому
а так как
,
то
,
или
.
Отсюда
,
что и требовалось доказать.
Доказанное неравенство исходит из того,
что величина
не меньше значений
и меньше значений
.
Пусть теперь
не меньше всех значений X.
Тогда неравенство
-
событие достоверное, и, следовательно,
,
т.е.
Таким образом, неравенство доказано для дискретной случайной величины при любом .
Пример 1. Среднее число молодых специалистов, ежегодно направляемых в аспирантуру при экономических вузах, составляет 200 человек. Пользуясь неравенством Маркова, оценить вероятность того, что в данном году будет направлено в эти вузы не более 220 молодых специалистов.
Решение. Так как здесь а = 200 и = 220, то применяя полученное неравенство, имеем
или
Таким образом,
.
Неравенство Маркова справедливо и для непрерывных случайных величин, но для них доказательство более сложно и мы его не приводим.
2. Неравенство Чебышева.
Если Х — случайная
величина, математическое ожидание
которой
,
а —произвольное
положительное число, то
и
Пусть дискретная случайная величина X
задана распределением и для этой
случайной величины
и
.
|
|
|
... |
|
|
|
|
... |
|
Пусть при этом для некоторых частных
значений Х имеет место неравенство
,
а для других значений —неравенство
.
В виде случайной величины мы будем
рассматривать
.
Тогда условие
равносильно условию
.
Применяя к этому условию соответствующее неравенство Маркова, будем иметь
.
Но , а поэтому
.
Заметив, что
,
приходим к требуемому результату . (1)
Исходя из того, что условия и являются по своему смыслу противоположными [те частные значения случайной величины, которые не удовлетворяют условию , обязательно удовлетворяют условию ], можно записать
Следовательно, если доказано неравенство (1), то справедливо и неравенство
.
(2)
Пример 2. Среднее значение длины детали равно 50 см, а дисперсия равна 0,1. Пользуясь неравенством Чебышева, оценить вероятность того, что изготовленная деталь окажется по своей длине не меньше 49,5 см и не больше 50,5 см.
Решение. Так как здесь а = 50, то условие
49,5Х50,5,
в котором случайная величина Х
обозначает возможную длину детали,
приводится почленным вычитанием числа
а = 50
к виду
.
Таким образом,
,
а так как по условию D(X)
= 0,1, то применяя
неравенство Чебышева, получаем
.
Пример 3. Пусть всхожесть семян некоторой культуры равна 0,75. Пользуясь неравенством Чебышева, оценить вероятность того, что из посеянных 1000 семян число взошедших окажется от 700 до 800 включительно.
Решение. Здесь М(X) = а = 10000,75 и граничные значения случайной величины Х симметричны относительно М(X) = 750. Поэтому от исходных неравенств
700Х800
можно почленным вычитанием величины а = 750 перейти к неравенствам
или
что дает левую часть неравенства Чебышева
с
.
Значение D(X)
легко находится по формуле
,
что дает
.
Учитывая, что
,
получаем правую часть неравенства
Чебышева:
.
Отсюда получается результат в виде
.
Оба вида неравенства Чебышева справедливы и для суммы попарно независимых1) случайных величин.
В частности, если X,
Y, Z,
...,
U, V —
попарно независимые случайные величины,
математические ожидания которых
соответственно равны а, b,
с, ..., k,
l и дисперсии — D(X),
D(Y),
D(Z),
..., D(U),
D(V),
то рассматривая сумму X+Y+Z+
...+U+V
как случайную величину и применяя
свойства о математическом ожидании и
дисперсии суммы случайных величин,
будем иметь:
И .
Поэтому последнее неравенство
в применении к случайной величине X+Y+Z+...+U+V
дает
.