- •1 Виды и этапы научных исследований
- •1.1Виды научно-исследовательских работ в текстильной промышленности
- •1.2Основные особенности механико-технологических процессов и методов их исследования
- •1.3Этапы научно-исследовательских работ (нир)
- •1.4Выбор темы для исследовательской работы
- •1.5Подготовительный этап нир
- •1.5.1Изучение библиографии
- •1.5.2Методическая программа нир и ее содержание
- •1.5.3Рабочая программа нир и ее содержание
- •1.6Математическое описание технологических процессов. Математические модели
- •1 Число аргументов, от которых зависят параметры процесса или оператор системы:
- •1.7Методы получения математических моделей
- •2Эксперимент как предмет исследования
- •2.1Понятие эксперимента
- •2.2Классификация видов экспериментальных исследований
- •3Краткие сведения из теории вероятностей и математической статистики
- •3.1Случайные величины и параметры их распределений
- •3.2Нормальный закон распределения
- •4 Предварительная обработка экспериментальных данных
- •4.1Вычисление параметров эмпирических распределений. Точечное оценивание
- •4.2Термины и определения в области обработки экспериментальных данных
- •4.3Оценивание с помощью доверительного интервала
- •4.3.1Построение доверительного интервала для математического ожидания
- •4.3.2Построение доверительного интервала для дисперсии
- •4.3.3Отсев грубых погрешностей
- •5 Сравнение числовых характеристик по выборочным данным
- •5.1Понятие о статистических гипотезах и критериях оценки
- •5.2Сравнение дисперсии свойств нового продукта со стандартной дисперсией
- •5.3Сравнение двух дисперсий нормальных генеральных совокупностей
- •5.4Сравнение выборочной средней с теоретически предполагаемым средним или стандартным значением
- •5.5Сравнение двух средних больших независимых выборок
- •5.6Сравнение двух средних из нормально распределенных генеральных совокупностей
5 Сравнение числовых характеристик по выборочным данным
5.1Понятие о статистических гипотезах и критериях оценки
При обработке
экспериментальных данных (измерений)
часто возникает задача определения
значимости различия между числовыми
характеристиками
и
,
т.е. между генеральными средними
и
,
дисперсиями
и
,
коэффициентами вариации
,
и
и др. Это бывает в следующих
случаях:
при оценке влияния изменения уровня фактора (в каком-либо процессе) на выходной параметр. Например, будет ли значимая разница в прочности пряжи при изменении коэффициента крутки на 10 единиц (130 вместо 120) или в плотности ткани по утку при увеличении заправочного натяжения основы на 10 %, или в плотности трикотажа (по вертикали) при увеличении глубины кулирования на 0,5 мм;
при сравнении свойств двух партий сырья или готовой продукции, полученной из этого сырья, Например, будет ли значимая разница между двумя марками хлопка одного сорта, полученного фабрикой в разное время года;
при сравнении двух систем прядения, технологических процессов или объектов. Например, будет ли значимая разница по чистоте и степени разъединенности волокон в ватке-прочесе, полученной на двух различного типа кардочесальных машинах;
при сравнении разного состава или структуры продуктов производства;
при определении воспроизводимости и стационарности процесса;
при сравнении двух методов исследования свойств продукта или работы машины.
Такие задачи могут быть решены только на основе анализа статистических данных и проверки статистических гипотез.
Различают два вида статистических гипотез: предположение о числовых характеристиках (параметрах) генеральной совокупности (в том случае, если известен тип распределения генеральной совокупности) и предположение о типе распределения (в том случае, если об изучаемой переменной ничего неизвестно).
На практике чаще
встречается первый вид статистических
гипотез, т.е. так называемая нулевая
гипотеза -
,
например, «О равенстве числовых
характеристик
и
»
для рассматриваемых двух выборок
вместо конкурирующей (альтернативной)
гипотезы
«О неравенстве числовых характеристик
и
».
Поскольку при проверке гипотез речь
идет об оценках генеральных совокупностей
на основании случайных выборок, то
выводы будут носить вероятностный
характер.
Из математической статистики известны две группы критериев проверки нулевой гипотезы - параметрические и непараметрические.
Первая группа критериев в качестве необходимого условия их применимости требует, в частности, независимости рядов измерений выходного параметра и распределения этих рядов по нормальному закону. При выполнении этих условий мощность параметрических критериев достаточно высока; по мере отступления от них она снижается. Другими словами, невыполнение необходимых условий влечет за собой увеличение вероятности принятия нулевой гипотезы в качестве истинной, хотя в действительности она является ложной.
Вторая группа критериев, обладая меньшей мощностью по сравнению с первой, не налагает на ряды измерений никаких необходимых условий, их вычисления проще. Это объясняет предпочтительность практического применения критериев второй группы, а в некоторых случаях делает его единственно возможным.
Искомый параметрический
критерий проще всего получить, если
предположить, что проверяемая гипотеза
верна, т.е. рассматриваемая случайная
величина ξ действительно
распределена по закону, задаваемому
функцией
,
и рассмотреть область, в которой
оказалось значение величины ξ.
Пусть ξ попало в
область, расположенную вблизи правого
(Рисунок 8, а) или левого (Рисунок 8,
б) хвоста функции
,
и, следовательно, вероятность
попадания случайной величины в эту
область, вычисленная при помощи функции
,
практически равна или достаточно
близка к нулю. В этой ситуации
целесообразно признать ошибочность
гипотезы
.
Если значение ξ оказалось
в интервале, достаточно удаленном от
обоих
хвостов функции
,
то
целесообразно считать, что гипотеза
может быть принята.
Рисунок 8 - Критические области дифференциального закона распределения для одностороннего и двустороннего критерия принятия гипотезы
Искомый критерий
оценки соответствия анализируемой
гипотезы
опыту можно получить, если этим
качественным рассуждениям придать
количественный характер. Вероятность
попадания случайной величины ξ
в критическую область (заштрихованная
часть на Рисунок 8, а) называют уровнем
значимости
.
Он равен:
Если ξ > ξκρ для выбранного уровня значимости , то ξ попадает в критическую область функции распределения и гипотеза должна быть отброшена. Если ξ < ξκρ, то ξ лежит вне критической области и гипотеза может быть принята. Однако утверждать правильность гипотезы нельзя, можно лишь сказать, что на основе проведенных измерений она не является неправильной (может оказаться, что после оценки какой-то большой выборки гипотеза окажется неправильной). Область допустимых значений с уменьшением уровня значимости увеличивается.
Если критическая область целиком расположена в правой (или левой) части графика , то критерий называется односторонним. Он используется, когда заранее имеются веские основания для утверждения, что попадание случайной величины в противоположную область функции распределения или невозможно, или не имеет практического значения.
Если у исследователя заранее нет оснований для подобного предположения, критическую область необходимо рассматривать состоящей из двух частей.
В этом случае уровень значимости критерия а численно равен сумме заштрихованных на Рисунок 8,в площадей, а соответствующий критерий называется двусторонним.
Следовательно, осуществляя проверку гипотезы, можно допустить две взаимосвязанные ошибки: отвергнуть правильную гипотезу (ошибка первого рода); принять неправильную гипотезу (ошибка второго рода). Вероятность допустить ошибку первого рода равна уровню значимости . Вероятность ошибки второго рода обозначается β, а величина 1 - β называется мощностью критерия. Последняя определяет вероятность того, что отвергнута нулевая гипотеза, если верна конкурирующая (альтернативная) гипотеза. С уменьшением увеличивается значение β и наоборот.
Одновременное уменьшение вероятностей ошибок первого и второго рода возможно только при увеличении объема выборок. Для выбранного уровня значимости критическую область целесообразно выбирать так, чтобы мощность критерия была максимальной и тем самым достигалась максимальная ошибка второго рода.
Последовательность проверки гипотезы следующая:
формулировка проверяемой, т.е. нуль-гипотезы , и конкурирующей (альтернативной) гипотез;
выбор критерия или статистической характеристики для проверки гипотезы и определение выборочного распределения критерия, когда допускается гипотеза ;
выбор уровня значимости ;
определение критической области для проверки гипотезы ;
расчет критерия по данным выборки;
сравнение расчетного критерия с табличным, который определяется критической областью.
При выборе
параметрического критерия для проверки
гипотезы
необходимо, прежде всего, сопоставить
оба ряда измерений с целью определения
соизмеримости их числовых статистических
характеристик. При этом возможны два
случая: ряды равноточны
,
и ряды неравноточны
.
