
- •Алгоритм проверки статистических гипотез
- •3.6.2 Проверка статистических гипотез о числовом значении генерального среднего
- •3.6.3 Сравнение генеральных средних двух нормально распределенных совокупностей
- •3.6.4 Гипотезы о числовом значении дисперсии
- •3.6.5 Гипотезы о законе распределения
- •3.6.6 Гипотеза об однородности выборок
- •Список литературы
- •Приложение 1
- •Приложение 2
Алгоритм проверки статистических гипотез
Проверку статистической гипотезы можно осуществить по следующему алгоритму.
1) Сформулировать основную H0 и альтернативную H1 гипотезы в вероятностных терминах на основе выборочных данных и цели исследования.
2) Выбрать соответствующий уровень значимости (риска) критерия (обычно ={0.001, 0.05, 0.01, 0.1}.)
3) Определить (если он не задан) объем выборки n и число степеней свободы k.
4) Вычислить статистическую характеристику критерия, т.е. наблюдаемую по выборке статистику Kнабл, по формулам, в зависимости от характера проверяемой гипотезы.
5) Найти границу между областью принятия гипотезы и критической областью Iкр, которая зависит от объема выборки n (степень свободы k) и уровня значимости , т.е. по таблицам найти квантили соответствующего критерия.
6) Сформулировать правила проверки гипотезы.
Гипотеза H0 не отвергается на уровне значимости , если значение статистической характеристики данной выборки попадет в область принятия гипотезы. Если же значение статистической характеристики попадает в критическую для H0 область, то принимается альтернативная гипотеза H1, т.к. H0 противоречит опытным данным.
Вероятность принятия гипотезы H0 основана на принципе практической невозможности наступления маловероятных событий. В то же время, если вероятность события близка к единице, то событие считают практически достоверным.
Пример 6. Пусть, необходимо оценить влияние нового фактора – новой системы пенсионной помощи пенсионерам – на уровень их жизни. Сравним средние результаты до введения системы и после ее введения, т.е. сравним показатели контрольной и экспериментальной групп пенсионеров.
Тогда нулевой гипотезой может быть гипотеза о том, что уровень их жизни не изменился и в среднем контрольная (к) и экспериментальная (э) группы пенсионеров имеют одинаковый достаток соответственно mк=mэ (ден.ед), т.е. H0: mк=mэ. Тогда альтернативная гипотеза говорит о том, что новая система пенсионной помощи улучшила уровень жизни и среднее значение генеральных совокупностей (достатка) – увеличилось, т.е. H1: mк< mэ.
Для исследования этой гипотезы необходимо:
Взять выборку объема n – пенсионные отчисления пенсионерам в контрольной и экспериментальной группах, найти среднее арифметическое
– разницу между размером пенсий и реальными затратами на коммунальные услуги, оплату лечения, поездок и т.д.
В зависимости от полученного результата
сделать вывод о справедливости гипотезыH0.
Тогда
распределение среднего
при условии, что гипотезаH0
будет иметь вид f(
|H0),
а при справедливости альтернативной
гипотезы – f(
|H1).
Графически эти распределения можно представить рисунком (Рис.5):
Рис.5
Например,
пусть гипотеза H0
отвергается, если выборочное среднее
превосходит значение критерияК,
т.е.
>К.
Уровень
значимости
соответствует площади критической
области, например, при двухсторонней
критической области
(К;Iкр2).
Тогда вероятность ошибки второго рода
равна площади под кривой распределения
на интервале
(Iкр1;К).
Т.о., если представить ошибки I и II рода в общей системе координат в виде двух кривых плотностей нормального распределения, то видно, что нельзя одновременно уменьшить вероятность появления обоих видов ошибок. Однако при принятии управленческих решений важно их свести до минимума. Обычно, в зависимости от условия задачи, решается вопрос о том, какие из ошибок будут иметь более серьезные последствия – приходится делать выбор между ошибками I и II рода. Поэтому, при принятии управленческих решений с целью одновременного уменьшения ошибок I и II рода, самым действенным средством является увеличение объема выборки, что согласуется с Законом больших чисел.
Обозначим
через up
корень уравнения
,
т.е. вероятность того события, что
стандартно распределенная нормальная
случайная величина попадает в интервал
(-;up),
равна P.
Тогда граница критической области для
гипотезы H0
имеет вид
Ккр
= m0
+
.
Справа
от этой точки ошибка I
рода с вероятностью
– попадание в критическую область,
слева – область принятия гипотезыH0
с вероятностью
.
С другой стороны эта граница разделяет
область принятия альтернативной гипотезыH1,
с вероятностью
(мощность
критерия), тогда как слева от границыКкр
остается
ошибка II
рода с вероятностью
,
которые вычисляются по значениямm0,
m1,
иn.
На
бытовом уровне ошибки II
рода (ошибки потребителя) могут иметь
более трагические последствия, чем
ошибки I
рода. Говорят: ошибки I
рода – «ошибки поставщика» – ошибки
осторожных людей, ошибки II
рода – пропуск брака – порой лихачество.
Например, принимая решение о продаже
партии машин, в которой замечены и не
устранены дефекты, поставщик подвергает
потребителя риску с вероятностью
,
последствия которого могут привести к
человеческим жертвам.
Рассмотрим подробнее некоторые статистические гипотезы.