- •I. Элементы теории вероятности
- •1. Вероятность по лапласу (Классическая вероятность)
- •2. Элементы комбинаторики
- •2. Основные теоремы комбинаторики.
- •2.2.Перестановки с повторениями.
- •2.3. Упорядоченные множества. Размещения без повторений.
- •2.4. Размещения с повторениями.
- •2.5. Сочетания.
- •2.6. Свойства сочетаний. Формула бинома Ньютона.
- •3. Методы решения комбинаторных задач.
- •1.2 Действия над событиями
- •1.3 Свойства операций над событиями
- •1.4. Геометрическая вероятность
- •2. Вероятность по мизесу (Статистическая вероятность)
- •3. Вероятность по колмогорову (Аксиоматическая вероятность)
- •2. Принципы теории вероятностей.
- •2.1. Принцип сложения.
- •2.2. Принцип умножения.
- •2.3. Полная вероятность и формула Байеса
- •3. Схемы испытаний
- •Случайные величины
- •Повторные испытания.
- •Распределения, связанные с повторными испытаниями.
- •Двумерные случайные величины
- •Свойства функции распределения.
- •Элементы математической статистики
- •1. Что такое математическая статистика?
- •2. Понятие выборки.
- •3. Построение вариационных рядов
- •Точечные оценки параметров генеральной совокупности по выборочным совокупностям, их свойства. Точечные оценки для математического ожидания и дисперсии случайной величины
- •Оценка для математического ожидания случайной величины
- •Оценка для дисперсии случайной величины
- •Интервальные оценки. Доверительный интервал. Нахождение доверительных интервалов для математического ожидания и дисперсии нормального распределения случайной величины
- •1. Доверительный интервал для оценки математического ожидания нормального распределения случайной величины с известным
- •2. Доверительный интервал для оценки математического ожидания нормального распределения с неизвестным
- •3. Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения
- •Статистическая проверка гипотез. Статистическая гипотеза. Нулевая и конкурирующая гипотеза. Статистический критерий. Критическая область
3. Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения
Пусть исследуемая случайная величина X генеральной совокупности распределена по закону N (a,). По статистическим данным найдено “исправленное” среднее квадратическое отклонение S. Требуется найти для него доверительный интервал с надежностью .
Требуется найти такое > 0, чтобы выполнялось равенство
.
Неравенство |-S|< с помощью ряда равносильных преобразований можно переписать в виде
.
Поэтому равенство (5.3.14) можно переписать в виде
P
(|-S|<)=P
(
<<
)
= ,
где
.
Случайная
величина распределена по закону
(имеет
-
распределение) с
степенями свободы. Плотность вероятности
-распределения
с (n-1)
степенями свободы имеет вид
Тогда
равенство (5.3.13) можно переписать в виде
.
Из этого уравнения по заданным
и
можно найти
;
для этого используется табл. 6 вероятности
попадания случайной величины с
-
распределением в заданный интервал,
зависящий от
.
После нахождения
доверительный интервал определяется
равенством
.
Задача
5.3.4.
Количественный признак генеральной
совокупности распределен по нормальному
закону N
(a,).
По выборке объема
найдено “исправленное” среднее
квадратическое отклонение
.
Найти доверительный интервал для этой
оценки с надежностью
.
Решение.
По табл. 6 приложения по
и
найдем
.
Доверительный интервал имеет вид I
= (1,24(1–0,44); 1,24(1+0,44)) = (0,69;1,79).
Замечание. В теории измерений принято точность измерений (точность измерительной системы) характеризовать с помощью . Для оценки используют “исправленное” среднее квадратическое отклонение . Поэтому для оценки точности измерений применяется доверительный интервал для , теория построения которого изложена выше.
Статистическая проверка гипотез. Статистическая гипотеза. Нулевая и конкурирующая гипотеза. Статистический критерий. Критическая область
При исследовании случайной величины X на основании статистических данных довольно часто необходимо знать закон распределения генеральной совокупности или, если закон распределения известен, его параметры. В этих случаях выдвигают гипотезы о виде предполагаемого распределения или о предполагаемой величине параметра известного распределения.
Статистической
называют гипотезу о виде неизвестного
распределения или о параметрах известных
распределений. Нулевой
(основной) называют выдвинутую гипотезу
.
Конкурирующей
(альтернативной)
называют гипотезу
,
которая противоречит основной.
Например,
если нулевая гипотеза состоит в
предположении, что математическое
ожидание
нормального распределения равна 5, то
конкурирующая гипотеза состоит в
предположении, что
.
Кратко это записывают так:
;
.
Проверку выдвинутой гипотезы осуществляют статистическими методами, поэтому ее называют статистической проверкой гипотез. В итоге статистической проверки гипотезы может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов:
1) ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза;
2) ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Правильное решение может быть принято также в двух случаях:
1) гипотеза принимается, причем она и в действительности правильная;
2) гипотеза отвергается, причем она и в действительности неверна.
Вероятность
совершить ошибку первого рода (отвергнуть
правильную гипотезу) принято обозначать
через
;
ее называют уровнем
значимости.
Наиболее часто уровень значимости
принимают равным 0,05 или 0,01. Если, например,
принят уровень значимости 0,01, то это
значит, что имеется риск отвергнуть
правильную гипотезу в одном случае из
ста.
Статистическим
критерием
(или просто критерием) называют случайную
величину
,
которая служит для проверки нулевой
гипотезы. Часто критерием служит
случайная величина, распределенная по
закону
2
или закону Стьюдента.
Наблюдаемым значением наб называют значение критерия, вычисленное по выборке, т.е. получают частное (наблюдаемое) значение критерия, вычисленное с помощью частных значений, входящих в критерий величин. После установления множество его значений разбивается на два пересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, другое – при которых она принимается.
Критической областью называют множество значений критерия, при которых нулевую гипотезу отвергают.
Областью допустимых значений (область принятия гипотезы) называют множество значений критерия, при которых нулевую гипотезу принимают.
Идея метода статистических гипотез состоит в следующем: если наблюдаемое значение критерия принадлежит критической области – нулевую гипотезу отвергают; если наблюдаемое значение принадлежит области допустимых значений – нулевую гипотезу принимают.
Критическая область и область принятия гипотезы представляют собой интервалы, поэтому существуют точки, которые их разделяют.
Критическими
точками
кр
называют точки, разделяющие критическую
область и область принятия гипотезы.
Различают односторонние критические области (правосторонние и левосторонние) и двусторонние.
Правосторонней
называют критическую область, определяемую
неравенством
кр,
где
кр
> 0 (рис. 5.4.1, а).
Л
кр,
где
кр
< 0 (рис. 5.4.1,b).
Двусторонней
называют
критическую область, определяемую
неравенствами
,
где
.
В частности, если критические точки
симметричны, двусторонняя критическая
область определяется неравенствами
кр,
кр
или
кр
Нахождение правосторонней критической области
Как
известно, правосторонняя критическая
область определяется неравенством
кр.
Для нахождения критической точки
кр
задаем достаточно малую вероятность –
уровень значимости
.
Затем находим критическую точку исходя
из требования, чтобы при условии
справедливости нулевой гипотезы
вероятность того, что
кр.,
была равна
кр
=
.
Обоснование
равенства (5.4.1) заключается в следующем:
так как вероятность события
кр
мала (
–
малая вероятность), то при справедливости
нулевой гипотезы это событие не должно
наступить в единичном испытании; если
же оно произошло, т.е. наблюдаемое
значение критерия оказалось больше
кр,
то это можно объяснить тем, что нулевая
гипотеза ложна и должна быть отвергнута.
С другой стороны, наблюдаемое значение
может оказаться большим
кр
не потому, что нулевая гипотеза ложна,
а по другим причинам (малый объем выборки,
недостатки методики эксперимента и
др.). В этом случае, отвергнув нулевую
гипотезу совершают ошибку первого рода.
Вероятность этой ошибки равна уровню
значимости
.
Критическая точка кр находится по таблицам критических точек распределения критерия и заданному уровню значимости .
Если критическая точка кр уже найдена, по данным выборки вычисляют наблюдаемое значение критерия наб и, если окажется, что наб > кр - нулевую гипотезу отвергают; если же наб < кр – нет оснований отвергать нулевую гипотезу.
Нахождение левосторонней критической области
Левосторонняя критическая область определяется неравенством < кр( кр<0). Критическую точку кр находят исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий примет значение, меньшее кр, была равна принятому уровню значимости :
кр
.
Если
наб
кр
–
нулевая гипотеза отвергается, если
наб
> kкр
–
нет оснований отвергать нулевую гипотезу.
Нахождение двусторонней критической области
Двусторонняя
критическая область определяется
неравенствами
(
).
Задаем уровень значимости
.
Критические точки
и
находят исходя из требования, чтобы при
справедливости нулевой гипотезы
выполнялось равенство
.
Ясно,
что критические точки
и
могут быть выбраны бесконечным числом
способов. Если распределение
является симметричным относительно
,
выбирают симметричные критические
точки:
кр,
кр,
(
кр
> 0). В этом случае
кр)
кр),
и поэтому
кр)
.
Из
соотношения определяют
кр.
После ее нахождения находят
наб
и, если
наб
кр
– нулевую гипотезу отвергают; если
наб
кр
– нет оснований отвергать нулевую
гипотезу.
