- •Часть II Математическая статистика введение
- •§ 1. Задачи статистики. Понятие выборки
- •§ 2. Первичная обработка данных. Способы задания выборки. Эмпирический закон распределения
- •0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1.
- •§ 3. Точечные оценки
- •3.1Определение оценки и ее качество
- •3.2 Оценки моментов
- •3.3 Оценка функции распределения (эмпирическая функция распределения)
- •3.4 Оценка плотности распределения (гистограмма)
- •§ 4. Точечные оценки параметров распределения
- •4.1 Метод моментов
- •4.2 Метод максимального (наибольшего) правдоподобия
- •§ 5. Понятие интервальной оценки
- •5.1 Основные понятия
- •5.2 Доверительные интервалы для параметров нормального распределения
- •5.2.1Интервальные оценки для математического ожидания при известной дисперсии
- •5.2.2 Интервальные оценки математического ожидания при неизвестной дисперсии
- •5.2.3 Интервальные оценки дисперсии (среднеквадратического отклонения) при известном математическом ожидании
- •5.2.4 Интервальные оценки дисперсии (среднеквдратического отклонения) при неизвестном математическом ожидании
- •§ 6. Проверка статистических гипотез
- •6.1 Основные понятия
- •6.2 Гипотезы о математическом ожидании нормально распределенной генеральной случайной величины
- •6.3 Критерии согласия для предполагаемого закона распределения
- •6.3.1 Критерий согласия (критерий Пирсона)
- •6.3.2 Критерий Колмогорова
5.2.4 Интервальные оценки дисперсии (среднеквдратического отклонения) при неизвестном математическом ожидании
Рассматривается
случайная выборка
генеральной случайной величиныХ,
нормально распределенной с неизвестными
параметрамиаи
Наилучшей оценкой дисперсии является
Распределение статистики
совпадает с распределением
Используем таблицу 3: по
и
находим
по
и
находим
С вероятностью
выполняется неравенство:
![]()
Разрешим это
неравенство относительно
![]()
-

(5.2.4)
С доверительной
вероятностью
доверительный интервал
покрывает параметр
![]()
Пример 1. Дана
выборка случайной величиныХ,
нормально распределенной с неизвестным
математическим ожиданиемаи
среднеквадратическим отклонением
С доверительной вероятностью 0,9 найти
доверительный интервал для параметраа.
-

3
4
5
6
7

6
9
15
10
5
Вычислим п–
объем выборки:
![]()
Найдем оценку математического ожидания:
![]()
Доверительная
вероятность
Используем таблицу 1 для нахождения
![]()
![]()
Тогда
![]()
![]()
Из (5.2.1) следует,
что
![]()
Доверительный
интервал
покрывает параметрас доверительной
вероятностью 0,9.
Пример 2. Дана выборка нормально распределенной случайной величины:
-

-1
0
1
2

6
16
14
4
При уровне значимости 0,05 найти интервальную оценку математического ожидания генеральной случайной величины.
Дана выборка объема
Найдем точечные оценки математического
ожидания и дисперсии:
![]()
![]()
![]()
![]()
Уровень значимости
Из таблицы 2 по
(в таблице нет
берем близкое к нему
)
и
найдем
![]()
Согласно (5.2.2) определим границы доверительного интервала:
![]()
![]()
Тогда
С доверительной вероятностью 95%
доверительный интервал
покрывает параметра.
Пример 3. Дана
выборка нормально распределенной
случайной величины с известным
математическим ожиданием
С доверительной вероятностью 0,9 найти
интервальную оценку среднеквадратического
отклонения
![]()
-

3
5
7
9
11

5
26
40
25
4
Объем выборки
Найдем оценку дисперсии:
![]()
![]()
![]()
Уровень значимости
Из таблицы 3 по
и
находим
по
и
находим
![]()
Находим границы доверительного интервала:


Тогда
и
является требуемым доверительным
интервалом для среднеквадратического
отклонения
![]()
Пример 4. Дана выборка нормально распределенной случайной величины:
-

-0,5
-0,4
-0,2
0
0,2
0,6
0,8
1
1,2
1,5

1
2
1
1
1
1
1
1
2
1
Оценить с доверительной вероятностью 0,9 среднеквадратическое отклонение с помощью доверительного интервала.
Объем выборки
Найдем оценки математического ожидания
и дисперсии:

![]()
![]()
Работаем с таблицей
3: по
и
находим
по
и
находим
![]()
Находим границы доверительного интервала:


Тогда
Интервал
является интервальной оценкой
среднеквадратического отклонения
с доверительной вероятностью 0,9.
§ 6. Проверка статистических гипотез
6.1 Основные понятия
На основе выборочных наблюдений выдвигаются предположения относительно свойств случайных величин, лежащих в основе наблюдаемых явлений. В математической статистике предположения называются гипотезами, при этом рассматриваются только статистические гипотезы, к которым относятся гипотезы о виде неизвестного распределения или о параметрах известных распределений.
Обозначаются
гипотезы
для каждой из них дается словесное
описание. Далее в соответствии с правилами
на основе выборки принимается одна из
гипотез.
Основнойназывается та гипотеза, в справедливости
которой мы желаем убедиться. Основная
гипотеза обозначается
![]()
Конкурирующаягипотеза
противоречит основной. Поэтому гипотеза
часто называетсяальтернативной.
В ходе статистической проверки может быть принято правильное или неправильное решение, то есть допущена ошибка. Различаются ошибки двух родов:
принята гипотеза
тогда, когда на самом деле верна гипотеза
это
ошибка первого рода. Вероятность ошибки
первого рода называетсяуровнем
значимостии обозначается

![]()
принята гипотеза
тогда, когда на самом деле верна гипотеза
это
ошибка второго рода, ее вероятность
обозначается

![]()
В зависимости от
цели наблюдения задается значение
ошибки первого или второго рода. Мы
будем рассматривать тот случай, когда
задается
ошибка
первого рода. В качестве уровня значимости
обычно берется значение из множества
![]()
Правильное решениетоже будет двух родов:
принять гипотезу
тогда, когда на самом деле верна эта
гипотеза. Вероятность такого решения
равна:
![]()
Значение
называетсядоверительной вероятностью.
принять гипотезу
тогда, когда на самом деле она верна.
Вероятность этого события равна:
![]()
Значение
называетсямощностью критерия.
С целью проверки нулевой гипотезы вводится случайная величина, которую называют статистическим критерием, или простокритерием. Обычно критерий обозначается буквойКили буквой, соответствующей распределению критерия. Правомерность выбора статистики в роли критерия доказывается математическими методами. Исследователю, не математику, предлагается готовый вид критерия. Статистический критерий должен удовлетворять следующим основным условиям:
значение критерия подсчитывается на основе выборки, это значение обозначается
.распределение статистики Кизвестно в предположении, что нулевая гипотеза верна.
Зная вид распределения
критерия по данному уровню значимости
,
мы можем определить критические точки
и получить одну или несколько точек.
Критические точки обозначаются
и находятся по таблицам, связанным с
распределением критерия.
Множество значений
критерия Кделится накритическую
областьиобласть принятия решения.
Критические точки отделяют критическую
область от области принятия решения.
Будем обозначать критическую область
.
При изменении гипотезы
критическая область существенно
меняется.
Если наблюдаемое
значение критерия попадает в критическую
область, то принимают гипотезу
![]()
верна.
Если наблюдаемое
значение критерия не попадает в
критическую область, то принимают
гипотезу
![]()
верна.
Отметим основные этапы статистической проверки гипотезы:
Сформулировать нулевую
и альтернативную
гипотезы;Задать уровень значимости

Определить выражения критерия Ки распределение его при предположении, что гипотеза
верна;Определить критическую область
из условия:
![]()
(вероятность того,
что значение критерия Кпопадет в
критическую область
при условии, что нулевая гипотеза верна,
равна уровню значимости
);
По выборке вычислить значение критерия К, то есть найти

Принять решение:
а)если
то принять гипотезу
![]()
б)если
то принять гипотезу
![]()
Выбор решения
носит случайный характер. Поэтому
применяют более точную формулировку.
В случае 6 а)говорят, что при заданном
уровне надежности данные выборки не
подтверждают гипотезу
А в случае 6б)говорят, что при
заданном уровне надежности данные
выборки не противоречат гипотезе
![]()
