- •Лекции по дисциплине курса «Теория вероятностей и математическая статистика»
- •Часть II
- •Введение
- •1. Закон больших чисел
- •1.2. Неравенства чебышева
- •1.3. Сходимость по вероятности
- •1.4.Теоремы чебышева
- •1.4.1.Первая теорема Чебышева.
- •1.4.2. Вторая теорема Чебышева:
- •1.5. Теорема бернулли
- •1.6. Центральная предельная теорема
- •1.7. Предельные теоремы
- •1.7.1. Локальная теорема Муавра-Лапласа.
- •1.7.2. Интегральная теорема Муавра-Лапласа.
- •2. Базовые понятия математической статистики
- •2.1. Эмпирическая функция распределения
- •2.2. Гистограмма
- •2.3. Оценки параметров распределения и их свойства
- •2.4. Оценки моментов и квантилей распределения
- •2.5. Точечная оценка параметров распределения
- •2.5.1. Сущность задачи точечного оценивания параметров
- •2.5.2. Метод максимального правдоподобия
- •2.5.3. Метод моментов
- •2.5.4. Метод квантилей
- •3. Проверка статистических гипотез
- •3.1. Сущность задачи проверки статистических гипотез
- •3.2. Типовые распределения
- •3.2.1. Нормальное распределение
- •3.2.2. Распределение χ2 (хи-квадрат)
- •3.2.3. Распределение Стьюдента
- •3.3.4. Распределение Фишера
- •3.3. Проверка гипотез о законе распределения
- •3.3.1. Критерий хи-квадрат к. Пирсона
- •3.3.2. Критерий а.Н. Колмогорова
- •3.3.3. Критерий р. Мизеса
- •4. Интервальная оценка параметров распределения
- •4.1. Сущность задачи интервального оценивания параметров
- •4.2. Общий метод построения доверительных интервалов
- •4.3. Доверительный интервал для математического ожидания
- •4.4. Доверительный интервал для дисперсии
- •4.5. Доверительный интервал для вероятности
- •5. Аппроксимация закона распределения экспериментальных данных
- •5.1. Задачи аппроксимации
- •5.2. Аппроксимация на основе типовых распределений
- •6. Обработка однотипных выборок
- •6.1. Однотипные выборки эд и задачи их обработки
- •6.2. Объединение выборок
- •6.2.1. Объединение однородных выборок
- •6.2.2. Объединение неоднородных выборок
- •6.3. Однофакторный дисперсионный анализ
- •6.3.1. Задачи дисперсионного анализа
- •6.3.2. Проверка однородности совокупности дисперсий
- •6.3.3. Сравнение факторной и остаточной дисперсий
- •7. Корреляционный и регрессионный анализ
- •7.1. Матрица данных
- •7.2. Корреляционный анализ
- •7.3. Регрессионный анализ
- •7.3.1. Постановка задачи
- •7.3.2. Выбор вида уравнения регрессии
- •7.3.4. Вычисление коэффициентов уравнения регрессии
1.6. Центральная предельная теорема
Данная теорема определяет условия, при которых возникает СВ с нормальным законом распределения – т.е. закон распределения суммы большого числа СВ близок к нормальному.
Эта теорема впервые была сформулирована русским математиком Ляпуновым А.М. (1857-1918).
Одна из простейших форм – относится к случаю одинаково распределенных слагаемых.
Теорема. Если X1…Xn-случайные независимые величины имеющие одно т тоже распределение с математическим ожиданием m и дисперсией σ2, то при увеличении n закон распределения суммы
неограниченно приближается к нормальному.
Теорема Ляпунова. Пусть X1, …,Xn – независимые случайные величины с математическими ожиданиями m1, …, mn и дисперсиями D1, …, Dn, причем при n→∞
.
При наличии данных условий закон распределения
неограниченно стремится к нормальному при n
Например, теоремы Муавра–Лапласа – частный случай ЦПТ. Если производится m независимых опытов, в каждом из которых событие А появляется с вероятностью р, то справедливо соотношение:
Упрощенный вариант – Если СВ есть сумма большого числа независимых СВ, влияние которых на всю сумму мало, то Х имеет закон распределения, близкий к нормальному.
Пример1.2. Требуется произвести 60 выплат. Размер выплат случаен, но средняя выплата равна 50, а средне квадратичное отклонение равно 20.
Сколько должно быть денег в кассе, чтобы с вероятностью 0Б95 хватило всем?
Сколько денег с вероятностью 0,95 останется в кассе, если первоначально было 3500.
Решение. Суммарная выплата . На основании центральной предельной теореме для одинаково распределенных слагаемыхY имеет приблизительно нормальное распределение с параметрами
Необходимый запас определяем с использованием функции Лапласа:
Остается
3500-3255,6=244.4.
1.7. Предельные теоремы
1.7.1. Локальная теорема Муавра-Лапласа.
Теорема Муавра-Лапласа устанавливает условия, при которых биномиальную случайную величину можно приближённо рассматривать как нормальную.
Пусть XB(n, p). При n и любых фиксированных a и b, ab:
pmqnmexp[] *)
для любых m, удовлетворяющих неравенствам:ab.
Ошибка приближения зависит от того, достаточно ли велико n, не слишком ли близко p к 0 или к 1 и каково интересующее нас значение m. Эта ошибка в настоящее время хорошо изучена и оценена; при необходимости всю нужную информацию можно найти в литературе.
1.7.2. Интегральная теорема Муавра-Лапласа.
Пусть XB(n, p). Тогда при n и любых фиксированных a и b, ab:
Теорема Муавра-Лапласа позволяет уточнить связь относительной частоты и вероятности.
По этой формуле можно приближённо находить вероятность заданного отклонения относительной частоты от вероятности, вычислять необходимое число опытов n, при котором с данной вероятностью указанное отклонение не превышает . Исходное уравнение выглядит так:.
2. Базовые понятия математической статистики
2.1. Эмпирическая функция распределения
Методы обработки ЭД опираются на базовые понятия теории вероятностей и математической статистики. К их числу относятся понятия генеральной совокупности, выборки, эмпирической функции распределения.
Под генеральной совокупностью понимают все возможные значения параметра, которые могут быть зарегистрированы в ходе неограниченного по времени наблюдения за объектом. Такая совокупность состоит из бесконечного множества элементов. В результате наблюдения за объектом формируется ограниченная по объему совокупность значений параметра x1, x2, …, xn. С формальной точки зрения такие данные представляют собой выборку из генеральной совокупности. Наблюдаемые значения xi называют вариантами, а их количество – объемом выборки n. Для того чтобы по результатам наблюдения можно было делать какие-либо выводы, выборка должна быть репрезентативной (представительной), т. е. правильно представлять пропорции генеральной совокупности. Это требование выполняется, если объем выборки достаточно велик, а каждый элемент генеральной совокупности имеет одинаковую вероятность попасть в выборку.
Пусть в полученной выборке значение x1 параметра наблюдалось n1 раз, значение x2 – n2 раз, значение xk – nk раз, n1 + n2 + … + nk= n. Совокупность значений, записанных в порядке их возрастания, называют вариационным рядом, величины ni – частотами, а их отношения к объему выборки ni = ni / n – относительными частотами (частостями). Очевидно, что сумма относительных частот равна единице. Другой формой вариационного ряда является ряд накопленных частот, называемый кумулятивным рядом.
Под распределением понимают соответствие между наблюдаемыми вариантами и их частотами или частостями. Пусть nx – количество наблюдений, при которых случайные значения параметра Х меньше x. Частость события X<x равна nx / n. Это отношение является функцией от x и от объема выборки: Fn(x)= nx / n. Величина Fn(x) обладает всеми свойствами функции распределения:
Fn(x) – неубывающая функция, ее значения принадлежат отрезку [0 – 1];
если x1 – наименьшее значение параметра, а xk – наибольшее, то Fп(x)=0, когда x<=x1, и Fп(x)=1, когда x>xk .
Функция Fп(x) определяется по ЭД, поэтому ее называют эмпирической функцией распределения. В отличие от эмпирической функции Fn(x) функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения, она характеризует не частость, а вероятность события X<x. Из теоремы Бернулли вытекает, что частость Fn(x) стремится по вероятности к вероятности F(x) при неограниченном увеличении n. Следовательно, при большом объеме наблюдений теоретическую функцию распределения F(x) можно заменить эмпирической функцией Fn(x).
Основные свойства функции Fn ( x).
1. 0 £ Fn(x) £ 1.
2. Fn (x) - неубывающая ступенчатая функция.
3. Fn(x) = 0,x£x1.
4. Fn(x) = 1,x>xn .
Пример 2.1 Задана выборка случайной величины X: {4 3 3 5 2 4 3 4 4 5}. Построить график эмпирической функции распределения Fn(x).
Решение. Вариационный ряд случайной величины имеет вид {2 3 3 3 4 4 4 4 5 5}. Затем выделяем полуинтервалы (-¥,2], (2,3], (3,4], (4,5], (5,+¥]. На полуинтервале (-¥,2] Fn(x)=0/10=0. При 2<x£3 Fn(x)=1/10=0,1.
Аналогично определяем значения Fn(x) на остальных полуинтервалах:
.
График функции Fn(x)приведен на рис. 2.1.
Замечание. В каждой точке оси x, соответствующим значениям xi функция Fn(x) имеет скачок. В точке разрыва Fn(x) непрерывна слева и принимает значение, выделенное знаком .