Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы и средства исследований.doc
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
2.36 Mб
Скачать

5 Сравнение числовых характеристик по выборочным данным

5.1Понятие о статистических гипотезах и критериях оценки

При обработке экспериментальных данных (измерений) часто возникает задача определения значимости различия между числовыми характеристиками и , т.е. между ге­неральными средними и , дисперсиями и , ко­эффициентами вариации , и и др. Это бывает в следую­щих случаях:

  1. при оценке влияния изменения уровня фактора (в ка­ком-либо процессе) на выходной параметр. Например, будет ли значимая разница в прочности пряжи при изменении ко­эффициента крутки на 10 единиц (130 вместо 120) или в плотности ткани по утку при увеличении заправочного на­тяжения основы на 10 %, или в плотности трикотажа (по вертикали) при увеличении глубины кулирования на 0,5 мм;

  2. при сравнении свойств двух партий сырья или готовой продукции, полученной из этого сырья, Например, будет ли значимая разница между двумя марками хлопка одного сорта, полученного фабрикой в разное время года;

  3. при сравнении двух систем прядения, технологических процессов или объектов. Например, будет ли значимая раз­ница по чистоте и степени разъединенности волокон в ват­ке-прочесе, полученной на двух различного типа кардочесальных машинах;

  4. при сравнении разного состава или структуры про­дуктов производства;

  5. при определении воспроизводимости и стационарно­сти процесса;

  6. при сравнении двух методов исследования свойств продукта или работы машины.

Такие задачи могут быть решены только на основе анализа статистических данных и проверки статистических гипотез.

Различают два вида статистических гипотез: предполо­жение о числовых характеристиках (параметрах) генеральной совокупности (в том случае, если известен тип распре­деления генеральной совокупности) и предположение о типе распределения (в том случае, если об изучаемой переменной ничего неизвестно).

На практике чаще встречается первый вид статистиче­ских гипотез, т.е. так называемая нулевая гипотеза - , на­пример, «О равенстве числовых характеристик и » для рассматриваемых двух выборок вместо конкурирующей (аль­тернативной) гипотезы «О неравенстве числовых характе­ристик и ». Поскольку при проверке гипотез речь идет об оценках генеральных совокупностей на основании случайных выборок, то выводы будут носить вероятностный характер.

Из математической статистики известны две группы критериев проверки нулевой гипотезы - параметрические и непараметрические.

Первая группа критериев в качестве необходимого условия их применимости требует, в частности, независимости рядов измерений выходного параметра и распределения этих рядов по нормальному закону. При выполнении этих условий мощ­ность параметрических критериев достаточно высока; по мере отступления от них она снижается. Другими словами, невы­полнение необходимых условий влечет за собой увеличение вероятности принятия нулевой гипотезы в качестве истин­ной, хотя в действительности она является ложной.

Вторая группа критериев, обладая меньшей мощностью по сравнению с первой, не налагает на ряды измерений никаких не­обходимых условий, их вычисления проще. Это объясняет пред­почтительность практического применения критериев второй группы, а в некоторых случаях делает его единственно возмож­ным.

Искомый параметрический критерий проще всего полу­чить, если предположить, что проверяемая гипотеза верна, т.е. рассматриваемая случайная величина ξ действительно распределена по закону, задаваемому функцией , и рас­смотреть область, в которой оказалось значение величины ξ. Пусть ξ попало в область, расположенную вблизи правого (Рисунок 8, а) или левого (Рисунок 8, б) хвоста функции , и, следовательно, вероятность попадания случайной величины в эту область, вычисленная при помощи функции , прак­тически равна или достаточно близка к нулю. В этой ситуа­ции целесообразно признать ошибочность гипотезы . Если значение ξ оказалось в интервале, достаточно удаленном от обоих хвостов функции , то целесообразно считать, что гипотеза может быть принята.

Рисунок 8 - Критические области дифференциального закона распределения для одностороннего и двустороннего критерия принятия гипотезы

Искомый критерий оценки соответствия анализируемой ги­потезы опыту можно получить, если этим качественным рассуждениям придать количественный характер. Вероятность попадания случайной величины ξ в критическую область (за­штрихованная часть на Рисунок 8, а) называют уровнем значимо­сти . Он равен:

Если ξ > ξκρ для выбранного уровня значимости , то ξ попадает в критическую область функции распределения и гипотеза должна быть отброшена. Если ξ < ξκρ, то ξ лежит вне критической области и гипотеза может быть принята. Однако утверждать правильность гипотезы нельзя, можно лишь сказать, что на основе проведенных измерений она не является неправильной (может оказаться, что после оценки какой-то большой выборки гипотеза окажется не­правильной). Область допустимых значений с уменьшением уровня значимости увеличивается.

Если критическая область целиком расположена в правой (или левой) части графика , то критерий назы­вается односторонним. Он используется, когда заранее имеются веские основания для утверждения, что попадание случайной величины в противоположную область функции распределения или невозможно, или не имеет практиче­ского значения.

Если у исследователя заранее нет оснований для подоб­ного предположения, критическую область необходимо рас­сматривать состоящей из двух частей.

В этом случае уровень значимости критерия а численно равен сумме заштрихованных на Рисунок 8,в площадей, а со­ответствующий критерий называется двусторонним.

Следовательно, осуществляя проверку гипотезы, можно допустить две взаимосвязанные ошибки: отвергнуть пра­вильную гипотезу (ошибка первого рода); принять непра­вильную гипотезу (ошибка второго рода). Вероятность до­пустить ошибку первого рода равна уровню значимости . Вероятность ошибки второго рода обозначается β, а вели­чина 1 - β называется мощностью критерия. Последняя определяет вероятность того, что отвергнута нулевая гипо­теза, если верна конкурирующая (альтернативная) гипотеза. С уменьшением увеличивается значение β и наоборот.

Одновременное уменьшение вероятностей ошибок пер­вого и второго рода возможно только при увеличении объ­ема выборок. Для выбранного уровня значимости крити­ческую область целесообразно выбирать так, чтобы мощ­ность критерия была максимальной и тем самым достигалась максимальная ошибка второго рода.

По­следовательность проверки гипотезы следующая:

  1. формулировка проверяемой, т.е. нуль-гипотезы , и конкурирующей (альтернативной) гипотез;

  2. выбор критерия или статистической характеристики для проверки гипотезы и определение выборочного рас­пределения критерия, когда допускается гипотеза ;

  3. выбор уровня значимости ;

  4. определение критической области для проверки ги­потезы ;

  5. расчет критерия по данным выборки;

  6. сравнение расчетного критерия с табличным, который определяется критической областью.

При выборе параметрического критерия для проверки гипотезы необходимо, прежде всего, сопоставить оба ряда измерений с целью определения соизмеримости их числовых статистических характеристик. При этом воз­можны два случая: ряды равноточны , и ряды не­равноточны .