Основные понятия темы
Неравенство Чебышева.
Если СВ Х имеем MX=a и DX, то для любого ε>0 справедливо неравенство Чебышева
P(|X-MX|
)
или
P(|X-MX|<ε)
1-
.
Неравенство Маркова
P(X>ε)<
или P(X<ε)
1-
.
Теорема Чебышева (закон больших чисел ЗБЧ):
Если СВ Х
,
Х
,…,
Х
независимы и существует такое число
С>0, что DX
С,
i=1, 2, …, n, то для любого ε>0
Р(|
|<ε)>1-
или
Р(|
|<ε)=1,
т.е. среднее арифметическое этих СВ сходится по вероятности к среднему арифметическому их м.о.
Закон больших чисел (ЗБЧ) – это совокупность предложений, в которых утверждается, что с вероятностью, как угодно близкой к 1, отклонение средней арифметической достаточно большого числа случайных величин от постоянной величины – средней арифметической их математических ожиданий, не превзойдёт заданного как угодно малого числа ε>0. Теорема Чебышева – наиболее общий ЗБЧ. Теорема Бернулли – простейшая.
Теорема Бернулли.
Если в каждом из n
независимых испытаний вероятность p
появления события А постоянна, то
вероятность того, что отклонение частоты
от вероятности p по
модулю не превзойдёт числа ε>0, больше,
чем разность 1-
,
т.е.
Р(|
|
)>1-
или
Р(| | )=1.
Центральная предельная теорема (ЦПТ).
ЦПТ представляет собой вторую группу предельных теорем, которые устанавливают связь между законом распределения сумм СВ и его предельной формой – нормальным законом распределения.
Теорема Ляпунова
Если СВ Х
,
Х
,…,
Х
независимы и имеют один и тот же закон
распределения с математическим ожиданием
m и дисперсией σ
,
то при неограниченном увеличении n
закон распределения суммы Х=
неограниченно приближается к нормальному
закону.
Вероятность попадания СВ Х~N(a,σ) в заданный промежуток (α,β):
P (α<X<β)=Φ ( )-Φ ( ).
Для определения вероятности того, что
сумма нескольких СВ окажется в заданных
пределах нужно сделать переход от СВ
S
=
к стандартной СВ по формуле
P(α
β)≈Φ(
)-Φ(
).
Интегральная теорема Муавра-Лапласа
Следствиями ЦПТ являются рассмотренные ранее теоремы Муавра-Лапласа.
Лекция №4 Основы математической статистики
Генеральная и выборочная совокупности.
Оценка неизвестных параметров.
Точечные оценки параметров.
Интервальные оценки параметров.
Проверка статистических гипотез.
Основные понятия темы
Математическая статистика – раздел математики. В котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей. Говорят, что «математическая статистика - это теория принятия решений в условиях неопределённости».
Предметом математической статистики является изучение случайных величин (случайных событий, процессов) по результатам наблюдений (опытов, экспериментов).
Можно выделить три основных задачи математической статистики:
упорядочить, представить в удобном для обозрения и анализа данные наблюдений;
оценить характеристики наблюдаемой СВ;
проверить статистические гипотезы, т.е. решить вопрос согласования результатов оценивания с опытными данными.
Генеральной совокупностью называется
множество всех возможных значений
исследуемой СВ Х. Выборочной совокупностью
(выборкой)называется совокупность
объектов, отобранных случайным образом
из генеральной совокупности. Число
объектов в совокупности, генеральной
- N или выборочной - n,
называется её объёмом. конкретные
значения выборки, полученные в результате
наблюдений. Называют реализацией
выборки и обозначают строчными буквами
.
Статистической оценкой
параметра
теоретического распределения называют
его приближённое значение, зависящее
от данных выбора. Оценка
есть
значение некоторой функции результатов
наблюдений над СВ, т.е.
=
(
).
Свойства статистических оценок
Оценка параметра называется несмещённой, если M = , в противном случае она называется смещённой.
Оценка называется состоятельной, если при увеличении объёма выборки значение стремится (сходится) по вероятности к истинному значению параметра .
несмещённая оценка параметра называется эффективной. Если она имеет наименьшую дисперсию среди всех возможных несмещённых оценок параметра .
Точечные оценки параметров генеральной совокупности
Пусть - выборка генеральной совокупности, тогда выборочное среднее
=
-
несмещённая и состоятельная оценка
математического ожидания МХ.
Пусть
- выборка генеральной совокупности,
тогда исправленная выборочная дисперсия
Интервальное оценивание параметров
Оценка неизвестного параметра называется
интервальной, если она определяется
двумя числами – концами интервала.
Интервал (
),
накрывающий с вероятностью γ истинное
значение параметра
,
называется доверительным интервалом,
а вероятность γ - надёжностью оценки
или доверительной вероятностью.
Часто доверительный интервал выбирается
симметричным относительно несмещённой
точечной оценки
,
т.е. выбирается интервал вида (
-ε,
+ε)
такой, что Р(|
-
|<ε)=γ.
Число ε>0 характеризует точность
оценки.
Доверительный интервал для математического ожидания при известной дисперсии
γ=Р(|
|)=2Φ
(
)=2Φ
(t),
где t=
.
Тогда ε=
.
Доверительный интервал для a=MX
есть
,
где t определяется из
уравнения Φ
(t)=
или Φ(t)=
Проверка статистической гипотезы состоит из этапов:
Определяем гипотезы H и H
.Определяем по уровню значимости α и по альтернативной гипотезе H критическую область.
По таблицам находим квантиль нужного закона распределения.
Вычисляем по выборке значение статистики.
Сравниваем значение статистики с критической областью.
Принимаем решение.
