- •1. Статистическое оценивание характеристик случайных величин
- •1.1. Общие сведения
- •1.2. Предварительная обработка результатов наблюдений
- •1.3. Критерий для неприятия резко выделяющихся наблюдений
- •1.4. Интервальное оценивание
- •2. Определение законов распределения случайных величин по опытным данным
- •2.1. Статистическая оценка гипотез. Уровень значимости
- •2.2. Критерии статистической оценки гипотез
- •2.3. Проверка гипотезы о нормальном распределении случайной величины
- •2.4. Проверка гипотезы о принадлежности опытных данных к показательному закону распределения
- •2.5. Проверка гипотезы о принадлежности опытных данных закону Пуассона
- •2.6. Проверка гипотезы о принадлежности опытных данных к закону Вейбулла
- •2.7. Выравнивание экспериментальных данных логарифмически нормальным законом
- •2.8. Статистическая проверка гипотезы о принадлежности опытных данных к гамма-распределению
- •2.9. Статистическая проверка гипотезы о принадлежности опытных данных к закону Эрланга
- •2.10. Блок-схема алгоритма предварительной обработки экспериментальных данных
2. Определение законов распределения случайных величин по опытным данным
2.1. Статистическая оценка гипотез. Уровень значимости
При статистической обработке опытных данных одной из важных задач является задача проверки ряда гипотез, например:
о принадлежности опытных данных (гистограмм) к нормальному закону, показательному закону и другим вероятностным законам;
об однородности двух дисперсий при дискриминации двух математических моделей;
об однородности нескольких дисперсий;
о статистической значимости коэффициентов математической модели;
об адекватности полученной математической модели;
о достаточной согласованности показаний группы экспертов и т.п.
Как видим, статистические гипотезы могут носить различный характер. Например, если известен вид закона и проверяется гипотеза о величине его параметров (математического ожидания и дисперсии), то в этом случае говорят о параметрической гипотезе. Если же проверяется гипотеза относительно характера распределения изучаемого признака, то говорят, что проверяется непараметрическая гипотеза.
При выдвижении и принятии указанных гипотез могут иметь место следующие четыре случая:
1. Гипотеза Н0 верна и принимается.
2. Гипотеза Н0 верна, но ошибочно отвергается. Возникающую при этом ошибку называют ошибкой первого рода, а вероятность ее появления называют уровнем значимости и обозначают α.
3. Гипотеза Н0 неверна и отвергается.
4. Гипотеза Н0 неверна, но ошибочно принимается. Возникающую при этом ошибку называют ошибкой второго рода, а вероятность ее появления обозначают β.
Для решения отмеченных задач различными исследователями, например: Пирсоном, Колмогоровым, Романовским, Кохреном, Бартлетом, Стьюдентоы, Фишером и др., были предложены соответствующие критерии и заранее, при заданном уровне значимости α, были подсчитаны и составлены таблицы, в которых помещены критические (табличные) значения указанных критериев.
При этом область возможных значений каждого из критериев делят на две части:
область принятия гипотезы, и
область непринятия гипотезы (так называемая критическая область), которая для различных критериев может быть левосторонней или правосторонней (рис. 2.1).
Рис. 2.1 - Левосторонняя (α) и правосторонняя (β) критические области:
К1 и К2 - критические точки (табличные значения критериев)
При практической проверке рассматриваемых гипотез происходит сопоставление опытных значений критерия Копыт с табличным значением критерия Ктабл и далее в зависимости от соотношения
Копыт < Ккрит или Копыт > Ккрит (2.1)
принимают или отвергают выдвинутую гипотезу.
Порядок проверки статистических гипотез можно сформулировать так: если опытное значение критерия Копытн, вычисляемое при заданном уровне значимости α, попадает в область принятия гипотезы, то гипотезу принимают. Если же опытное значение критерия Копытн попадает в критическую область, то гипотезу отвергают.
Уровню значимости α соответствует доверительная вероятность PА = 1 - α.
На первый взгляд кажется, что чем меньше уровень значимости α, тем строже условия проверки гипотезы. Например, при α = 0,05 разрешается совершить ошибку первого рода в пяти случаях из ста. При α = 0,01 разрешается совершить ошибку первого рода в одном случае из ста. Однако с ошибкой первого рода связана ошибка второго рода. Поэтому рассмотрим этот вопрос подробнее.
Поясним физическую сущность уровня значимости. Как уже отмечалось выше, уровень значимости α (ошибка первого рода), есть вероятность того, что верная гипотеза будет отклонена, и значит, будет принята неверная гипотеза. Принятие неверной гипотезы называют ошибкой второго рода и ее вероятность обозначают β. Очевидно, что указанные ошибки взаимосвязаны, т.е. при уменьшении одной, вторая увеличивается и наоборот (рис. 2.2). Поэтому, между указанными ошибками должен быть какой-то компромисс. Компромиссные значения для α и β выбирают в зависимости от важности ошибок первого и второго рода.
Рис. 2.2. Качественное соотношение между ошибками первого и второго рода
Вероятность ошибки второго рода зависит от целого ряда обстоятельств, что сильно усложняет ее вычисление. Поэтому при статистической проверке правдоподобия выдвинутой гипотезы пользуются ошибкой первого рода, т.е. уровнем значимости α.
Уровнем значимости α пользуются не только при проверке различных статистических гипотез, но и при статистическом контроле качества продукции. При этом:
1. Ошибка первого рода α возникает тогда, когда заказчик бракует на основании выборочного контроля годную партию продукции с низким процентом брака, так как отобранная выборка содержала больше дефектных изделий, чем это предусмотрено приемочным числом С. Например, если в партии объемом 100 изделий будет обнаружено два дефектных изделия, то при уровне значимости α = 0,01 вся партия бракуется. Такое ошибочное решение называется риском изготовителя или риском поставщика.
2. С другой стороны, при статистическом контроле качества продукции может оказаться, что партия изделий с высоким содержанием брака (например, с 15 процентами бракованных изделий) может быть принята, если взятая из нее выборка случайно содержит небольшое число дефектных изделий. Такое ошибочное решение называют ошибкой второго рода, или риском заказчика, т.е. риском потребителя, вероятность указанной ошибки обозначают β.
Очевидно, что ошибка второго рода нежелательна для заказчика и не наносит ущерба поставщику. Ошибка первого рода нежелательна для изготовителя и не наносит ущерба заказчику.
Абсолютное значение допускаемых ошибок первого и второго рода зависит от условий, при которых проверяется выдвинутая гипотеза, от точности применяемых при этом приборов, квалификации персонала, объема и методов отбора выборки, процента изделий, подвергаемых проверке, многократности проверки и от др. факторов. Выбор отмеченных абсолютных значений ошибок α и β зависит от характера решаемой задачи и производится с учетом (как уже отмечалось выше) важности последствий, которые могут при этом иметь место.
Если проверяемая гипотеза имеет важное значение, (например, при оценке годности партии парашютов), то при этом выдвигается жесткое требование, чтобы ошибка второго рода β (принятие негодной партии) имела бы как можно меньшее значение, порядка β = 0,00000000001. Лучше забраковать годную партию парашютов (пусть изготовитель понесет при этом материальные потери), чем принять негодную партию и рисковать жизнью парашютистов. Однако измерить ошибку второго рода β как уже отмечалось выше, нельзя. Поэтому пользуются ошибкой первого рода, т.е. уровнем значимости α, который связан компромиссной зависимостью с ошибкой второго рода, и, следовательно, уровень значимости для рассматриваемой задачи, будет иметь значение, близкое к отмеченному значению ошибки, второго рода, т.е. иметь, например, значение α = 0,0000000001.
Если решается менее важная задача, например, производится оценка качества изготовленных отвалов (ножей) для бульдозеров, то в этом случае абсолютная величина ошибки второго рода β может иметь значительно большее значение, и связанный с ней уровень значимости α будет составлять 0,1 или 0,05,
Последствия принятия неверной гипотезы (принятие негодной партии отвалов) не будет иметь столь катастрофических последствий, как в выше рассматриваемом примере с парашютами.
При статистическом контроле качества промышленной продукции в иностранной литературе рекомендуется брать уровень значимости α = 0,0027, соответствующий правилу трех "сигм".
При решении задач, связанных с исследованием эффективности функционирования автомобильно-дорожных средств и систем, коэффициент доверия (надежность РА) принимается равной 0,95 и, следовательно, уровень значимости α = 0,05 или 5 процентов.
