
- •Раздел 3
- •1. Основные понятия
- •Генеральная и выборочная совокупность. Вариационный ряд
- •Эмпирическая функция распределения. Полигон. Гистограмма
- •1.3. Статистические оценки параметров распределения
- •Требования, которым должны удовлетворять оцениваемые параметры
- •2. Точечные и интервальные оценки
- •Доверительные интервалы для оценки математического ожидания нормального распределения при известном
- •Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном
- •Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения
- •3. Статистические гипотезы
- •3.1. Основные понятия
- •Критическая область. Область принятия гипотез. Критические точки
- •Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона
- •Правило проверки нулевой гипотезы
- •4. Элементы теории корреляции
- •Свойства коэффициента корреляции
- •5. Элементы дисперсионного анализа
3. Статистические гипотезы
3.1. Основные понятия
Во многих случаях результаты выборки используются для проверки предположений (гипотез) относительно тех или иных свойств распределения генеральной совокупности. В частности, такого рода задачи возникают при сравнении различных технологических процессов или методов обработки по определенным измеряемым признакам, например по точности, производительности и т.д.
Пусть
изучаемая
(наблюдаемая) дискретная или непрерывная
случайная величина.
Определение 3.1.Статистической гипотезой Hназывается любое предположение относительновидаилипараметровфункции распределения (тогдаHназывают параметрической гипотезой) СВX.
По своему содержанию статистические гипотезы можно подразделить на несколько основных типов:
гипотезы о виде закона распределения исследуемой случайной величины.
гипотезы о числовых значениях параметров случайной величины.
гипотезы об общем виде модели, описывающей статистическую зависимость между признаками.
гипотезы о принадлежности некоторого признака к тому или иному классу.
Определение 3.2.Статистическая гипотезаHназываетсяпростой, если она однозначно определяет распределение случайной величиныX; в противном случае гипотезаHназываетсясложной.
Например, если - параметр показательного распределения, то гипотеза H0:=5 является простой гипотезой. ГипотезаH0: математическое ожидание нормального распределения равно 3 (известно) – также простая гипотеза.
Например, гипотеза H:5 является сложной гипотезой, т.к. состоит из бесчисленного множества простых видов гипотезHi:= bi, гдеbi– любое число. ГипотезаH0: математическое ожидание нормального распределения равно 3 (неизвестно) – также сложная гипотеза.
Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипотезы целесообразно различать.
Определение 3.3.Нулевой (основной)
гипотезойназывают выдвигаемую
гипотезу.Конкурирующей (альтернативной)
гипотезойназывают гипотезу
,
которая противоречит нулевой.
Например, предположим, что по выборке
построена модель нормального распределения
СВ
с параметрами
выборочной средней
и
выборочным средним
квадратическим отклонением. Тогда
относительно параметров генеральной
совокупности
математического
ожидания и
среднего
квадратического отклонения можно
выдвинуть следующие гипотезы:
.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверку производят статистическими методами, ее называют статистической.
Определение 3.4.Правило, по которому
принимается или отвергается гипотеза,
называетсястатистическим критериемК.
Проверку статистических гипотез выполняют на основании результатов выборки. Статистический критерий устанавливает, при каких результатах случайной выборки проверяемая гипотеза принимается, а при каких отвергается. В итоге проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов.
Ошибка первого родасостоит в
том, что нулевая гипотезаотвергается, в то время как она в
действительности верна.Ошибка
второго родасостоит в том, что
нулевая гипотеза
принимается, а на самом деле она неверна.
В таблице 3.1 даны возможные сочетания объективного состояния гипотезы H0и субъективных действий на основании выборки.
Таблица 3.1
Объективное состояние гипотезы H0 |
Субъективное статистическое решение | |
H0 принимается |
H0 отвергается | |
Верна |
Правильное решение |
Ошибка 1-го рода |
Неверна |
Ошибка 2-го рода |
Правильное решение |
Вероятность отвергнуть гипотезу
,
если она верна, т.е. принять гипотезу
,
называетсявероятностью ошибки
первого родаилиуровнем
значимости, которая обозначается
:
.
Наиболее часто уровень значимости
принимают равным 0,05 или 0,01. Например,
если принять
,
то это значит, что в пяти случаях из ста
рискуем допустить ошибку первого рода.
Величина
равна вероятности принять верную
гипотезу и называетсяуровнем
доверия:
.
Вероятность принять основную гипотезу,
если она неверна, называется ошибкой
второго родаи обозначается:
.
Вероятность принять гипотезу
,
если она верна, называетсямощностью
критерия:
.
Чем больше величина
,
тем мощнее критерий
,
если зафиксирован уровень значимости
вероятность сделать
ошибку 1-го рода.
Дело в том, что ошибки 1-го и 2-го рода
нельзя сделать одновременно как угодно
маловероятными. Поэтомужелательно
задать вероятность ошибки 1-го рода
заранее некоторым числом
,
а среди критерия
выбрать такой, который при данном уровне
значимости
сводит к минимуму вероятность ошибки
2-го рода.