
- •Проверка статистических гипотез
- •Статистические гипотезы
- •1. Простые и сложные гипотезы и их проверка
- •2. Критерий согласия Пирсона
- •Поведение , когда гипотезаверна.
- •Поведение , когда гипотезаневерна.
- •Критерий проверки.
- •Границы применимости критерия на практике.
- •3. Критерий согласия для сложных гипотез
- •4. О критериях согласия Колмогорова и Смирнова
- •5. Проверка нормальности при помощи вероятностной бумаги
- •Статистические критерии.
- •[Править] Уровень значимости и мощность.
- •[Править] Состоятельность и несмещенность критериев.
- •[Править] Некоторые типовые задачи прикладной статистики [править] Статистические данные и прикладная статистика
- •[Править] Статистический анализ точности и стабильности технологических процессов и качества продукции
- •[Править] Задачи одномерной статистики (статистики случайных величин)
- •[Править] Непараметрическое оценивание математического ожидания.
- •[Править] Непараметрическое оценивание функции распределения.
- •[Править] Таблица 1
- •[Править] Проблема исключения промахов.
- •[Править] Многомерный статистический анализ
- •[Править] Корреляция и регрессия.
- •[Править] Дисперсионный анализ.
- •[Править] Методы классификации.
- •[Править] Дискриминантный анализ.
- •[Править] Кластер-анализ.
- •[Править] Задачи группировки.
- •[Править] Снижение размерности.
- •[Править] Статистика случайных процессов и временных рядов
- •[Править] Статистика объектов нечисловой природы
- •Лабораторная работа №14. Изучение критериев Колмогорова и омега-квадрат
- •Лабораторная работа №15. Изучение критерия хи-квадрат Пирсона
Лекция 4
Проверка статистических гипотез
Основные вопросы лекции:
Общая постановка задачи проверки гипотез.
Проверка гипотезы о равенстве центров распределений двух нормальных генеральных совокупностей при известном и неизвестном среднем квадратическом отклонении.
F – распределение.
Проверка гипотезы о равенстве дисперсий двух нормальных генеральных совокупностей.
Проверка гипотез о законе распределения.
Критерий согласия Хи – квадрат.
Статистические гипотезы
Как отмечалось выше, в математической статистике считается, что данные, получаемые в результате наблюдений, подчинены некоторому неизвестному вероятностному распределению, и задача состоит в том, чтобы извлечь из данных правдоподобную информацию об этом неизвестном распределении. В настоящей главе мы обсудим еще один подход к этой общей задаче, состоящий в проверке гипотез. Статистической гипотезойназывают предположение о распределении вероятностей, которое необходимо проверить по имеющимся данным.
Параграфы этой главы:
1. Простые и сложные гипотезы и их проверка
Пусть
--
независимая выборка, соответствующая
неизвестной функции распределения
.Простой гипотезойназывают
предположение, состоящее в том, что
неизвестная функция
отвечает некоторому совершенно
конкретному вероятностному распределению.
Пример простой гипотезы:
:
данные являются выборкой из равномерного
распределения
в
отрезке
.
Сложной гипотезойназывают предположение о том, что
неизвестная функцияпринадлежит некоторому множеству
распределений, состоящему из более чем
одного элемента. В качестве иллюстрации
можно привести Пример6.3.
Проверить
статистическую гипотезу -- это значитна основе имеющихся данных
принять
или отвергнутьсделанное предположение.
Для этого используется подход, основанный
на выборе так называемогокритического
множества
.
Мы поступаем следующим образом: если
данные наблюденийпопадают в критическое
множество(то есть,
),
то гипотеза
отвергается; если же данные находятсявне критического множества(то есть,
),
то гипотеза
принимается. Такое решающее правило
будем называтькритерием, основанным
на критическом множестве
.
Существует много методов построения критических множеств для проверки статистических гипотез, некоторые из этих методов обсуждаются в последующих параграфах. Сейчас мы кратко коснемся вопроса о возможных ошибках, которые мы допускаем, принимая или отвергая гипотезы.
В силу случайной
природы наблюдаемых данных возможна
ситуация
в
то время, когда гипотеза
справедлива.
Однако, согласно решающему правилу, в
этом случае мы отвергнем верную гипотезу
и, тем самым, допустим ошибку. Очевидно,
что в случае простой гипотезы
вероятность
такой ошибки равна
.
Эту вероятность называют такжеуровнем
значимостистатистического критерия.
Такого рода ошибки неизбежны при анализе
случайных данных, и их не следует
драматизировать. На практике уровень
значимости критерия задается изначально,
исходя из реальных приложений и
потенциальных последствий возможных
ошибок.
2. Критерий согласия Пирсона
Наше изложение
близко к [7,
§ 30.1] и [13,
§ 10.4]. Мы рассматриваем независимую
выборку,
обозначая неизвестную функцию
распределения
.
Нас интересует вопрос о том, согласуются
ли данные наблюдений
с
простой гипотезой
где
--
некоторая конкретная фиксированная
функция распределения.
Вначале разобъем
множество
на
конечное число непересекающихся
подмножеств
.
Пусть
--
вероятность, соответствующая функции
распределения
,
обозначим
Очевидно,
что
Теперь сделаем
группировку данных аналогично процедуре,
описанной в
6.3,
а именно, определим
|
(50) |
Очевидно, что в
силу случайных колебаний эмпирические
частоты
будут
отличаться от теоретических вероятностей
.
Чтобы контролировать это различие,
следует подобрать хорошую меру расхождения
между экспериментальными данными и
гипотетическим теоретическим
распределением. По аналогии с идеей
метода наименьших квадратов в качестве
такой меры расхождения можно взять,
например,
,
где положительные числа
можно
выбирать более или менее произвольно.
Как показал К. Пирсон, если выбрать
,
то полученная величина будет обладать
рядом замечательных свойств. Таким
образом, положим
|
(51) |
Подчеркнем, что
величина
вычисляется
по выборке. Функцию
принято называтьстатистикой
Пирсона.
Обсудим ее свойства.