
- •Федеральное агентство по образованию
- •Случайное событие
- •Алгебра событий.
- •Элементы комбинаторики
- •Формула полной вероятности.
- •Формула для апостериорной вероятности (формула Байеса)
- •Локальная теорема Лапласа
- •Интегральная теорема Лапласа
- •Случайные величины.
- •Совместное распределение случайных величин.
- •Числовые характеристики случайных величин
- •Математическое ожидание
- •Дисперсия
- •Коэффициент корреляции
- •Функция распределения, ее свойства.
- •Биномиальное распределение
- •Распределение Гаусса.
- •Законы больших чисел.
- •Характеристики выборки.
- •Выборочное среднее, выборочная дисперсия.
- •Гистограмма и полигон
- •Оценка характеристик выборки.
- •Точечные оценки
- •Доверительный интервал. Общее понятие.
- •Доверительный интервал математического ожидания. Случай 1.
- •Распределение
- •Доверительный интервал для дисперсии
- •Распределение Стьюдента.
- •Доверительный интервал математического ожидания. Случай 2.
- •Понятие о теории проверки статистических гипотез.
- •Ошибки при проверке гипотез
- •Проверка гипотезы о функции распределения.
- •Однофакторный дисперсионный анализ
- •Литература
Ошибки при проверке гипотез
Принятие решения на основе статистического критерия носит случайный характер, поэтому не исключены ошибки. Возможны следующие ситуации.
1.
Гипотеза
верна, и она не отвергается.
Все в порядке: наше решение отражает
истинное положение.
2.
Гипотеза
верна, но она
отвергается.
В этом случае говорят, что допущена
ошибка I
рода. Поскольку
нулевая гипотеза верна, статистика Z
действительно имеет то распределение,
на основании которого принималось
решение. Тем не менее выборочное значение
статистики попало в критическую область.
Вероятность этого события по определению
равна уровню значимости
.
Вероятность ошибки I рода равна уровню значимости критерия.
Но уровень значимости задается произвольно. Поэтому в нашей власти снизить вероятность ошибки I рода до сколь угодно низкого уровня.
3.
Гипотеза
неверна, и она отвергается.
Снова все в порядке: отвергнута неверная
гипотеза.
4.
Гипотеза
неверна, но она не отвергается.
Тогда говорят, что допущена ошибка
II
рода. В этой
ситуации выборочное значение попало в
область принятия решения, тогда как
гипотеза
на самом деле неверна. Если распределение
статистики Z
известно и в предположении, что верна
альтернативная гипотеза
,
то можно посчитать вероятность ошибки
II
рода: это условная вероятность того,
что Z
попадает в область
при условии, что верна гипотеза
.
Вероятность ошибки II
рода обычно обозначают через
.
В
большинстве случаев нельзя добиться
минимального значения вероятностей
и
одновременно.
Поступают обычно следующим образом:
вероятность
ошибки I
рода фиксируется, а затем добиваются
минимума вероятности
ошибки II
рода. За счет чего можно уменьшить
при фиксированном значении
?
Только за счет выбора критической
области: при заданной альтернативе
критическую область выбирают таким
образом, чтобы значение
(вероятность принять неверную гипотезу)
было наименьшим из возможных. В этом
случае вероятность отвергнуть неверную
гипотезу
максимальна. Это число называют мощностью
критерия.
Таким образом, задача состоит в построении
наиболее
мощного критерия
при заданном уровне значимости.
Проверка гипотезы о функции распределения.
Пусть
- выборка
наблюдений некоторой случайной величины
.
Гипотеза:
:
генеральная совокупность имеет функцию
распределения F(x)
против альтернативы, что функция распределения не такова.
За
меру расхождения примем величину
Теорема
(Пирсона).
Пусть
т параметров
функции распределения
оцениваются по выборке. Тогда при
распределение меры расхождения
стремится к распределению
с
степенями свободы
.
Однофакторный дисперсионный анализ
Пусть
результаты наблюдений составляют k
независимых выборок (групп), полученных
из k
нормально распределенных генеральных
совокупностей, которые имеют, вообще
говоря, различные средние
.
Каждая группа содержит
значений,
.
Общее число наблюдений равно
:
Проверяется гипотеза о равенстве средних во всех k выборках:
Нулевая гипотеза является сложной: предполагается лишь, что математические ожидания совпадают, о конкретном значении ничего не известно. Альтернативная гипотеза состоит в том, что хотя бы две выборки имеют различные средние.
Обозначим
через
-й
элемент j-й выборки,
.
Групповое
среднее
:
Общее среднее
Основное тождество дисперсионного анализа
Общая сумма квадратов отклонений от среднего есть сумма квадратов между группами плюс сумма квадратов внутри групп.
.
,
Теорема
Если нулевая
гипотеза верна, то случайные величины,
имеют распределение
соответственно с
и
степенями свободы.
Если
нулевая гипотеза верна, то случайная
величина
распределена по закону Фишера с
,
степенями свободы.
Распределение
Фишера строится на основе распределения
:
При
заданном уровне значимости а
критическая область находится на правом
хвосте распределения
Фишера, то
есть правее квантили порядка
Фактор, в соответствии с которым сгруппированы данные, можно признать статистически значимым, если выборочное значение статистики F удовлетворяет неравенству
.
В этом случае гипотеза о равенстве математических ожиданий не подтверждается экспериментальными данными.