Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистическая обработка эксперимента в задачах...doc
Скачиваний:
82
Добавлен:
26.08.2019
Размер:
1.51 Mб
Скачать

2. Определение законов распределения случайных величин по опытным данным

2.1. Статистическая оценка гипотез. Уровень значимости

При статистической обработке опытных данных одной из важных задач является задача проверки ряда гипотез, например:

о принадлежности опытных данных (гистограмм) к нормаль­ному закону, показательному закону и другим вероятностным законам;

об однородности двух дисперсий при дискриминации двух математических моделей;

об однородности нескольких дисперсий;

о статистической значимости коэффициентов математической модели;

об адекватности полученной математической модели;

о достаточной согласованности показаний группы экспер­тов и т.п.

Как видим, статистические гипотезы могут носить различ­ный характер. Например, если известен вид закона и проверя­ется гипотеза о величине его параметров (математического ожидания и дисперсии), то в этом случае говорят о параметри­ческой гипотезе. Если же проверяется гипотеза относительно характера распределения изучаемого признака, то говорят, что проверяется непараметрическая гипотеза.

При выдвижении и принятии указанных гипотез могут иметь место следующие четыре случая:

1. Гипотеза Н0 верна и принимается.

2. Гипотеза Н0 верна, но ошибочно отвергается. Возникающую при этом ошибку называют ошибкой первого рода, а веро­ятность ее появления называют уровнем значимости и обозначают α.

3. Гипотеза Н0 неверна и отвергается.

4. Гипотеза Н0 неверна, но ошибочно принимается. Возникающую при этом ошибку называют ошибкой второго рода, а вероят­ность ее появления обозначают β.

Для решения отмеченных задач различными исследователями, например: Пирсоном, Колмогоровым, Романовским, Кохреном, Бартлетом, Стьюдентоы, Фишером и др., были предложены соот­ветствующие критерии и заранее, при заданном уровне значи­мости α, были подсчитаны и составлены таблицы, в которых помещены критические (табличные) значения указанных крите­риев.

При этом область возможных значений каждого из крите­риев делят на две части:

область принятия гипотезы, и

область непринятия гипотезы (так называемая крити­ческая область), которая для различных критериев может быть левосторонней или правосторонней (рис. 2.1).

Рис. 2.1 - Левосторонняя (α) и правосторонняя (β) критические области:

К1 и К2 - критические точки (табличные значения критериев)

При практической проверке рассматриваемых гипотез происхо­дит сопоставление опытных значений критерия Копыт с табличным значением критерия Ктабл и далее в зависимости от соотношения

Копыт < Ккрит или Копыт > Ккрит (2.1)

принимают или отвергают выдвинутую гипотезу.

Порядок проверки статистических гипотез можно сформули­ровать так: если опытное значение критерия Копытн, вычис­ляемое при заданном уровне значимости α, попадает в область принятия гипотезы, то гипотезу принимают. Если же опытное значение критерия Копытн попадает в критическую область, то гипотезу отвергают.

Уровню значимости α соответствует доверительная веро­ятность PА = 1 - α.

На первый взгляд кажется, что чем меньше уровень значи­мости α, тем строже условия проверки гипотезы. Например, при α = 0,05 разрешается совершить ошибку первого рода в пяти случаях из ста. При α = 0,01 разрешается совершить ошибку первого рода в одном случае из ста. Однако с ошибкой первого рода связана ошибка второго рода. Поэтому рассмотрим этот вопрос подробнее.

Поясним физическую сущность уровня значимости. Как уже отмечалось выше, уровень значимости α (ошибка первого рода), есть вероятность того, что верная гипотеза будет отклонена, и значит, будет принята неверная гипотеза. Приня­тие неверной гипотезы называют ошибкой второго рода и ее вероятность обозначают β. Очевидно, что указанные ошибки взаимосвязаны, т.е. при уменьшении одной, вторая увеличивается и наоборот (рис. 2.2). Поэтому, между указанными ошибками должен быть какой-то компромисс. Компромиссные значения для α и β выбирают в зависимости от важности ошибок первого и второго рода.

Рис. 2.2. Качественное соотношение между ошибками первого и второго рода

Вероятность ошибки второго рода зависит от целого ряда обстоятельств, что сильно усложняет ее вычисление. Поэтому при статистической проверке правдоподобия выдвинутой гипотезы пользуются ошибкой первого рода, т.е. уровнем значимости α.

Уровнем значимости α пользуются не только при проверке различных статистических гипотез, но и при статистическом контроле качества продукции. При этом:

1. Ошибка первого рода α возникает тогда, когда заказ­чик бракует на основании выборочного контроля годную партию продукции с низким процентом брака, так как отобранная выборка содержала больше дефектных изделий, чем это предусмотрено приемочным числом С. Например, если в партии объемом 100 изде­лий будет обнаружено два дефектных изделия, то при уровне значимости α = 0,01 вся партия бракуется. Такое ошибочное решение называется риском изготовителя или риском поставщика.

2. С другой стороны, при статистическом контроле качества продукции может оказаться, что партия изделий с высоким содержанием брака (например, с 15 процентами бракованных изделий) может быть принята, если взятая из нее выборка случайно со­держит небольшое число дефектных изделий. Такое ошибочное решение называют ошибкой второго рода, или риском заказчика, т.е. риском потребителя, вероятность указанной ошибки обоз­начают β.

Очевидно, что ошибка второго рода нежелательна для за­казчика и не наносит ущерба поставщику. Ошибка первого рода нежелательна для изготовителя и не наносит ущерба заказчику.

Абсолютное значение допускаемых ошибок первого и второ­го рода зависит от условий, при которых проверяется выдвинутая гипотеза, от точности применяемых при этом приборов, квали­фикации персонала, объема и методов отбора выборки, процента изделий, подвергаемых проверке, многократности проверки и от др. факторов. Выбор отмеченных абсолютных значений ошибок α и β зависит от характера решаемой задачи и производится с учетом (как уже отмечалось выше) важности последствий, кото­рые могут при этом иметь место.

Если проверяемая гипотеза имеет важное значение, (напри­мер, при оценке годности партии парашютов), то при этом выд­вигается жесткое требование, чтобы ошибка второго рода β (принятие негодной партии) имела бы как можно меньшее значе­ние, порядка β = 0,00000000001. Лучше забраковать годную партию парашютов (пусть изготовитель понесет при этом матери­альные потери), чем принять негодную партию и рисковать жизнью парашютистов. Однако измерить ошибку второго рода β как уже отмечалось выше, нельзя. Поэтому пользуются ошибкой первого рода, т.е. уровнем значимости α, который связан компромиссной зависимостью с ошибкой второго рода, и, следовательно, уровень значимости для рассматриваемой задачи, будет иметь значение, близкое к отмеченному значению ошибки, второго рода, т.е. иметь, например, значение α = 0,0000000001.

Если решается менее важная задача, например, производится оценка качества изготовленных отвалов (ножей) для бульдозеров, то в этом случае абсолютная величина ошибки второго рода β может иметь значительно большее значение, и связанный с ней уровень значимости α будет составлять 0,1 или 0,05,

Последствия принятия неверной гипотезы (принятие негод­ной партии отвалов) не будет иметь столь катастрофических последствий, как в выше рассматриваемом примере с парашютами.

При статистическом контроле качества промышленной про­дукции в иностранной литературе рекомендуется брать уровень значимости α = 0,0027, соответствующий правилу трех "сигм".

При решении задач, связанных с исследованием эффектив­ности функционирования автомобильно-дорожных средств и систем, коэффициент доверия (надежность РА) принимается равной 0,95 и, следовательно, уровень значимости α = 0,05 или 5 процентов.