Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
математика глава 3. ответы.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
66.4 Кб
Скачать

9. Статастическиое распределение выборки. Определение статистической и конкурирующей гипотезы, критерии согласия

статистическим распределением выборки или вариационным рядом называется перечень вариант (в возрастающем порядке) и соответствующих им частот (относительных частот). При этомвариантами называются всевозможные значения  генеральной совокупности.

Статистической гипотезой называется любое предположение о виде неизвестного закона распределения или о параметрах известного распределения.

Теория статистического оценивания используется всякий раз, когда необходим обоснованный вывод о преимуществах того или иного способа инвестиций, измерений, стрельбы, технологического процесса, об эффективности нового метода обучения, управления, о пользе вносимого удобрения, принимаемого лекарства, о значимости математической модели и т.д.

Проверяемую гипотезу называют нулевой или основной и обозначают Н0.

.Противоположную или противоречащую выдвинутой гипотезе Н0 гипотезу Н1 называют альтернативной или конкурирующей.

. Критерии, которые позволяют судить, согласуются ли значения х1, х2,…, хn случайной величины Х с гипотезой относительно ее функции распределения, называются критериями согласия.

Также критерии согласия решают задачу: является ли расхождение между опытным законом распределения и предполагаемым законом распределения следствием ограниченного числа наблюдений, или оно является существенным и связано с тем, что действительное распределение случайной величины отличается от предполагаемого.

Наиболее распространенными в практическом применении – критерий Пирсона (хи-квадрат) и критерий Колмогорова.

10. Определения точечных и интервальной оценок параметров распределения, несмещенная оценка математического ожидания, доверительный интервал

Характеристики генеральной совокупности принято называть параметрами, а выборочной совокупности – оценками.

Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше, — точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводит к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальной называют оценку, которая определяется двумя числами — концами интервала. Интервальные оценки позволяют установить, точность и надежность оценок.

Доверительным называют интервал , который покрывает неизвестный параметр с заданной надежностью .

Интервал имеет случайные концы (их называют доверительными границами). Действительно, в разных выборках получаются различные значения . Следовательно, от выборки к выборке будут изменяться и концы доверительного интервала, т.е. доверительные границы сами являются случайными величинами — функциями от .

Так как случайной величиной является не оцениваемый параметр, а доверительный интервал, то более правильно говорить не о вероятности попадания в доверительный интервал, а о вероятности того, что доверительный интервал покроет .

Метод доверительных интервалов разработал американский статистик Ю. Нейман, исходя из идей английского статистика Р. Фишера.

Оценку называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:

1) при возрастании объема выборки число убывает и, следовательно, точность оценки увеличивается;

2) увеличение надежности оценки приводит к увеличению ( — возрастающая функция), следовательно, и к возрастанию ; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Пусть искомый параметр генеральной совокупности есть , а на основе выборки объёма определяется оценка .

Для того, чтобы выборочная оценка давала хорошее приближение оцениваемого параметра, она должна удовлетворять определённым требованиям (несмещенности, эффективности и состоятельности).

Несмещенная оценка

Несмещённая оце́нка в математической статистике — это точечная оценка, математическое ожидание которой равно оцениваемому параметру.

Определение

Пусть X_1,\ldots, X_n,\ldots — выборка из распределения, зависящего от параметра \theta \in \Theta. Тогда оценка \hat{\theta} \equiv \hat{\theta}(X_1,\ldots,X_n) называется несмещённой, если

\mathbb{E}\left[\hat{\theta}\right] = \theta,\quad \forall \theta \in \Theta.

В противном случае оценка называется смещённой, и случайная величина \hat{\theta} - \theta называется её смеще́нием.

Примеры

Выборочное среднее \bar{X} = \frac{1}{n} \sum\limits_{i=1}^n X_i является несмещённой оценкой математического ожидания X_i, так как если \mathbb{E}X_i = \mu<\infty, \; \forall i\in \mathbb{N}, то \mathbb{E}\bar{X} = \mu.

Пусть независимые случайные величины X_i имеют конечную дисперсию \mathrm{D}X_i = \sigma^2. Построим оценки

S_n^2 = \frac{1}{n} \sum\limits_{i=1}^n \left(X_i - \bar{X}\right)^2 — выборочная дисперсия,

и

S^2 = \frac{1}{n-1} \sum\limits_{i=1}^n \left(X_i - \bar{X}\right)^2 — исправленная выборочная дисперсия.

Тогда S^2_n является смещённой, а S^2 несмещённой оценками параметра \sigma^2. Смещённость S^2_n можно доказать следующим образом: пусть \mu и \overline{X} — среднее и его оценка соответственно, тогда:

\begin{align}

\operatorname{E}[S^2_n]

&= \operatorname{E}\bigg[ \frac{1}{n}\sum_{i=1}^n (X_i-\overline{X})^2 \bigg]

= \operatorname{E}\bigg[ \frac{1}{n}\sum_{i=1}^n \big((X_i-\mu)-(\overline{X}-\mu)\big)^2 \bigg] = \\

&= \operatorname{E}\bigg[ \frac{1}{n}\sum_{i=1}^n (X_i-\mu)^2 -

2(\overline{X}-\mu)\frac{1}{n}\sum_{i=1}^n (X_i-\mu) +

(\overline{X}-\mu)^2 \bigg] = \\

&= \operatorname{E}\bigg[ \frac{1}{n}\sum_{i=1}^n (X_i-\mu)^2 - (\overline{X}-\mu)^2 \bigg]

= \sigma^2 - \operatorname{E}\big[ (\overline{X}-\mu)^2 \big] = \\

&= \sigma^2 - \frac{1}{n}\sigma^2 = \frac{n-1}{n}\sigma^2 < \sigma^2.

\end{align}

Доверительный интервал — термин, используемый в математической статистике при интервальной (в отличие от точечной) оценке статистических параметров, что предпочтительнее при небольшом объёме выборки. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.

Метод доверительных интервалов разработал американский статистик Ежи Нейман, исходя из идей английского статистика Рональда Фишера