- •Раздел 3. Элементы теории вероятностей
- •1. Комбинаторные правила суммы и умножения, перестановки. Размещения. Сочетания.
- •2. Классическое и геометрическое определение вероятности.
- •3. Операции над случайными событиями. Теоремы сложения вероятностей.
- •4. Зависимые и независимые события. Условная вероятность. Теоремы умножения вероятностей.
- •5. Формула полной вероятности.
- •6. Формула Бернулли.
- •7. Дискретные случайные величины, ряд распределения, числовые характеристики..
- •Числовые характеристики дискретных случайных величин
- •8. Непрерывные случайные величины, дифференциальный и интегральный законы распределения, числовые характеристики.
- •9. Статастическиое распределение выборки. Определение статистической и конкурирующей гипотезы, критерии согласия
- •10. Определения точечных и интервальной оценок параметров распределения, несмещенная оценка математического ожидания, доверительный интервал
9. Статастическиое распределение выборки. Определение статистической и конкурирующей гипотезы, критерии согласия
статистическим
распределением выборки или вариационным
рядом называется
перечень вариант (в возрастающем порядке)
и соответствующих им частот (относительных
частот). При этомвариантами
называются
всевозможные значения
генеральной
совокупности.
Статистической гипотезой называется любое предположение о виде неизвестного закона распределения или о параметрах известного распределения.
Теория статистического оценивания используется всякий раз, когда необходим обоснованный вывод о преимуществах того или иного способа инвестиций, измерений, стрельбы, технологического процесса, об эффективности нового метода обучения, управления, о пользе вносимого удобрения, принимаемого лекарства, о значимости математической модели и т.д.
Проверяемую гипотезу называют нулевой или основной и обозначают Н0.
.Противоположную или противоречащую выдвинутой гипотезе Н0 гипотезу Н1 называют альтернативной или конкурирующей.
. Критерии, которые позволяют судить, согласуются ли значения х1, х2,…, хn случайной величины Х с гипотезой относительно ее функции распределения, называются критериями согласия.
Также критерии согласия решают задачу: является ли расхождение между опытным законом распределения и предполагаемым законом распределения следствием ограниченного числа наблюдений, или оно является существенным и связано с тем, что действительное распределение случайной величины отличается от предполагаемого.
Наиболее распространенными в практическом применении – критерий Пирсона (хи-квадрат) и критерий Колмогорова.
10. Определения точечных и интервальной оценок параметров распределения, несмещенная оценка математического ожидания, доверительный интервал
Характеристики генеральной совокупности принято называть параметрами, а выборочной совокупности – оценками.
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше, — точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводит к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами — концами интервала. Интервальные оценки позволяют установить, точность и надежность оценок.
Доверительным называют интервал , который покрывает неизвестный параметр с заданной надежностью .
Интервал имеет случайные концы (их называют доверительными границами). Действительно, в разных выборках получаются различные значения . Следовательно, от выборки к выборке будут изменяться и концы доверительного интервала, т.е. доверительные границы сами являются случайными величинами — функциями от .
Так как случайной величиной является не оцениваемый параметр, а доверительный интервал, то более правильно говорить не о вероятности попадания в доверительный интервал, а о вероятности того, что доверительный интервал покроет .
Метод доверительных интервалов разработал американский статистик Ю. Нейман, исходя из идей английского статистика Р. Фишера.
Оценку называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:
1) при возрастании объема выборки число убывает и, следовательно, точность оценки увеличивается;
2) увеличение надежности оценки приводит к увеличению ( — возрастающая функция), следовательно, и к возрастанию ; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.
Пусть искомый параметр генеральной совокупности есть , а на основе выборки объёма определяется оценка .
Для того, чтобы выборочная оценка давала хорошее приближение оцениваемого параметра, она должна удовлетворять определённым требованиям (несмещенности, эффективности и состоятельности).
Несмещенная оценка
Несмещённая оце́нка в математической статистике — это точечная оценка, математическое ожидание которой равно оцениваемому параметру.
Определение
Пусть X_1,\ldots, X_n,\ldots — выборка из распределения, зависящего от параметра \theta \in \Theta. Тогда оценка \hat{\theta} \equiv \hat{\theta}(X_1,\ldots,X_n) называется несмещённой, если
\mathbb{E}\left[\hat{\theta}\right] = \theta,\quad \forall \theta \in \Theta.
В противном случае оценка называется смещённой, и случайная величина \hat{\theta} - \theta называется её смеще́нием.
Примеры
Выборочное среднее \bar{X} = \frac{1}{n} \sum\limits_{i=1}^n X_i является несмещённой оценкой математического ожидания X_i, так как если \mathbb{E}X_i = \mu<\infty, \; \forall i\in \mathbb{N}, то \mathbb{E}\bar{X} = \mu.
Пусть независимые случайные величины X_i имеют конечную дисперсию \mathrm{D}X_i = \sigma^2. Построим оценки
S_n^2 = \frac{1}{n} \sum\limits_{i=1}^n \left(X_i - \bar{X}\right)^2 — выборочная дисперсия,
и
S^2 = \frac{1}{n-1} \sum\limits_{i=1}^n \left(X_i - \bar{X}\right)^2 — исправленная выборочная дисперсия.
Тогда S^2_n является смещённой, а S^2 несмещённой оценками параметра \sigma^2. Смещённость S^2_n можно доказать следующим образом: пусть \mu и \overline{X} — среднее и его оценка соответственно, тогда:
\begin{align}
\operatorname{E}[S^2_n]
&= \operatorname{E}\bigg[ \frac{1}{n}\sum_{i=1}^n (X_i-\overline{X})^2 \bigg]
= \operatorname{E}\bigg[ \frac{1}{n}\sum_{i=1}^n \big((X_i-\mu)-(\overline{X}-\mu)\big)^2 \bigg] = \\
&= \operatorname{E}\bigg[ \frac{1}{n}\sum_{i=1}^n (X_i-\mu)^2 -
2(\overline{X}-\mu)\frac{1}{n}\sum_{i=1}^n (X_i-\mu) +
(\overline{X}-\mu)^2 \bigg] = \\
&= \operatorname{E}\bigg[ \frac{1}{n}\sum_{i=1}^n (X_i-\mu)^2 - (\overline{X}-\mu)^2 \bigg]
= \sigma^2 - \operatorname{E}\big[ (\overline{X}-\mu)^2 \big] = \\
&= \sigma^2 - \frac{1}{n}\sigma^2 = \frac{n-1}{n}\sigma^2 < \sigma^2.
\end{align}
Доверительный интервал — термин, используемый в математической статистике при интервальной (в отличие от точечной) оценке статистических параметров, что предпочтительнее при небольшом объёме выборки. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.
Метод доверительных интервалов разработал американский статистик Ежи Нейман, исходя из идей английского статистика Рональда Фишера
