- •1 Виды и этапы научных исследований
- •1.1Виды научно-исследовательских работ в текстильной промышленности
- •1.2Основные особенности механико-технологических процессов и методов их исследования
- •1.3Этапы научно-исследовательских работ (нир)
- •1.4Выбор темы для исследовательской работы
- •1.5Подготовительный этап нир
- •1.5.1Изучение библиографии
- •1.5.2Методическая программа нир и ее содержание
- •1.5.3Рабочая программа нир и ее содержание
- •1.6Математическое описание технологических процессов. Математические модели
- •1 Число аргументов, от которых зависят параметры процесса или оператор системы:
- •1.7Методы получения математических моделей
- •2Эксперимент как предмет исследования
- •2.1Понятие эксперимента
- •2.2Классификация видов экспериментальных исследований
- •3Краткие сведения из теории вероятностей и математической статистики
- •3.1Случайные величины и параметры их распределений
- •3.2Нормальный закон распределения
- •4 Предварительная обработка экспериментальных данных
- •4.1Вычисление параметров эмпирических распределений. Точечное оценивание
- •4.2Термины и определения в области обработки экспериментальных данных
- •4.3Оценивание с помощью доверительного интервала
- •4.3.1Построение доверительного интервала для математического ожидания
- •4.3.2Построение доверительного интервала для дисперсии
- •4.3.3Отсев грубых погрешностей
- •5 Сравнение числовых характеристик по выборочным данным
- •5.1Понятие о статистических гипотезах и критериях оценки
- •5.2Сравнение дисперсии свойств нового продукта со стандартной дисперсией
- •5.3Сравнение двух дисперсий нормальных генеральных совокупностей
- •5.4Сравнение выборочной средней с теоретически предполагаемым средним или стандартным значением
- •5.5Сравнение двух средних больших независимых выборок
- •5.6Сравнение двух средних из нормально распределенных генеральных совокупностей
5.5Сравнение двух средних больших независимых выборок
Если выборки имеют большой объем (т > 30) и независимы, то выборочные средние распределены приближенно нормально, а выборочные дисперсии являются достаточно хорошими оценками генеральных дисперсий, и поэтому их можно считать известными приближенно. При этих условиях случайная величина:
распределена
приближенно нормально с параметрами
(при
условии справедливости нулевой гипотезы)
и
(если выборки независимы).
Для проверки
нулевой гипотезы
:
принимается приближенный
критерий, расчетное значение которого
равно:
Критическая область строится в зависимости от вида конкурирующей гипотезы.
Первый случай.
Если конкурирующая гипотеза
:
то
при заданном уровне значимости а по
таблице функции Лапласа (Таблица 11)
находят табличное значение двустороннего
критерия по равенству:
Если
то нет оснований отвергнуть нулевую
гипотезу о равенстве
и
,
т.е.
.
Если
,
то нулевую гипотезу отвергают.
Пример.
Проведено измерение
прочности двух образцов пряжи, и получены
следующие данные:
;
;
;
;
;
.
При уровне значимости α =
0,05 требуется проверить нулевую гипотезу
:
при конкурирующей гипотезе
:
.
Находим расчетное значение критерия по формуле (2.66):
Используя равенство
по таблице Лапласа (Таблица 11) находим
.
Так как
то
нулевую гипотезу отвергаем, т.е. разница
между средними значениями прочности
двух образцов пряжи существенна.
Второй случай.
Если конкурирующая гипотеза
:
то при заданном уровне
значимости а, используя таблицу
функции Лапласа (Таблица 11), находят
табличное значение одностороннего
критерия по равенству:
.
Если
то
нулевая гипотеза не отвергается.
В противном случае гипотеза отвергается.
Пример.
Исследователь после введения конструктивных изменений в прядильное пневмомеханическое устройство ожидает повышения прочности пряжи, т.е. принимает по отношению к гипотезе : конкурирующую гипотезу : . Числовые статистические характеристики двух образцов пряжи приведены в предыдущем примере, поэтому
Используя равенство по таблице функции Лапласа (Таблица 11) находим . Так как , нулевую гипотезу отвергают, т.е. конструктивное изменение в прядильном устройстве обусловило значимое изменение прочности пряжи.
5.6Сравнение двух средних из нормально распределенных генеральных совокупностей
Если проверяется гипотеза о равенстве двух средних из нормально распределенных генеральных совокупностей, дисперсии которых неизвестны, то, прежде всего, следует проверить с помощью F-критерия гипотезу о равенстве дисперсий в генеральных совокупностях. При этом возможны два случая.
Первый случай
- равноточность двух рядов измерений
доказана. Для проверки гипотезы о
равенстве средних, найденных по
независимым малым выборкам, используется
критерий t, расчетное
значение которого определяется по
формуле:
где
-
среднее квадратическое отклонение
разности
,
или ошибка разницы;
Доказано, что
величина t при
справедливости нулевой гипотезы
:
имеет t-распределение
Стьюдента с
степенями свободы. Критическая область
строится в зависимости от вида
конкурирующей гипотезы.
Если проверяется
гипотеза
:
при конкурирующей гипотезе
:
,
то в этом случае используется двусторонний
критерий
,
табличное значение которого
определяют по Таблица 12 при заданном
уровне значимости α и
числе степеней свободы
.
Если
нулевую гипотезу отвергают, т.е.
исследователь устанавливает, например,
что применение уровня фактора или
конструктивные изменения в машине
обусловили значимое различие между
выходными параметрами. Если
,
то нет оснований отвергать гипотезу
о равенстве средних, т.е. оба ряда
измерений относятся к одной и той же
совокупности, для которой среднее
значение определяется по формуле:
а дисперсия - по
формуле указанной выше
.
Если разность
между средними двух выборок значима
только при доверительной вероятности
в пределах
,
то прежде чем идти на риск по принятию
нулевой гипотезы
:
,
следует увеличить объем выборки, т.е.
провести дополнительный эксперимент.
Оптимальным
соотношением объемов сравниваемых
выборок является
где
так
как при этом ошибка разности
оказывается
наименьшей.
Считая дисперсии
сравниваемых совокупностей одинаковыми
и равными
при
из формулы получаем:
В этом случае расчетное значение критерия Стьюдента:
Чтобы разность
можно было бы считать значимой,
должна быть если не больше, то, по крайней
мере, равна
для заданной доверительной вероятности
и заданного числа степеней свободы
.
После замены на , сосредоточивая в левой части предыдущей формулы члены, зависящие от m, и возводя обе части в квадрат, получим:
где
Зная
К2
при
заданной
,
по
Таблица 14 определяют искомое значение
т.
Таблица 14 -
Достаточная численность выборок m
в зависимости от величины
Для случая, когда К2< 0,13, искомое т находят по формуле:
(что
также нашло отражение в Таблица 14).
Величина
,
входящая
в формулу для К2,
определяется по данным проведенного
эксперимента или по данным других
исследований. Величину разности
принимают
равной или наименьшему различию между
средними, которое может представлять
практический интерес, или разности,
которая оказалась незначимой в
предварительном эксперименте. При
использовании формул для К2
предполагается,
что увеличение объема выборки не вызовет
значительного изменения
и
.
Пример.
При испытании
прочности полосок двух вариантов ткани,
выработанной при различной плотности
по утку, получены следующие числовые
статистические характеристики двух
рядов измерений:
;
;
т1 = 12;
;
;
т2 = 10. Проверяем
гипотезу о равенстве дисперсий
:
при конкурирующей гипотезе
:
.
Расчетное значение
критерия Фишера
.
Табличное значение критерия определяем
по Таблица 8 при уровне значимости а
= 0,05 и числе степеней свободы ft
= 12 - 1 = 11 и f2
= 10-1=9, т.е.
.
Так как FR
< FT,
гипотеза о равенстве дисперсий не
отвергается, т.е. нельзя было доказать
значимого различия по дисперсии
прочности полосок ткани.
Проверим гипотезу о равенстве средних : при конкурирующей гипотезе : . По формуле определяем дисперсию:
Затем находим расчетное значение критерия Стьюдента:
и его табличное
значение (Таблица 12):
.
Так как
гипотеза о равенстве средних
значений прочности полоски ткани
отвергается, т.е. увеличение плотности
ткани по утку обусловило значимое
различие в их прочности.
Если проверяется
гипотеза средних
:
при конкурирующей
гипотезе
:
,
то используется односторонний
критерий, табличное значение которого
определяют по Таблица 12 при заданном
уровне значимости а и числе степеней
свободы
т.е.
.
Если
то
нет оснований отвергать нулевую
гипотезу. Если tR>
(л, то нулевую гипотезу отвергают.
Для предыдущего
примера при конкурирующей гипотезе
:
,табличное
значение критерия Стьюдента находится
по Таблица 12:
.
Так как
,
то гипотеза
должна быть отброшена, т.е. и при второй
конкурирующей гипотезе статистическое
исследование показало, что проведенное
изменение плотности ткани по утку
обусловило значимое изменение ее
прочности.
Второй случай - равноточность двух рядов измерений не доказана. Для проверки нулевой гипотезы о равенстве средних используется также критерий t (Стьюдента), расчетное значение которого определяется по приближенной формуле:
Табличное значение двустороннего критерия определяется при заданном уровне значимости а и числе степеней свободы:
где
;
;
.
Если
то разница
незначима, а если
,
то разница между средними значима.
Пример.
Статистическая
обработка трех рядов измерений выходного
параметра, полученных при трех типах
конструктивных рабочих органов машины,
дала следующие числовые характеристики:
1-й ряд -
;
;
т1 = 10.
2-й ряд -
;
;
т2 = 10.
3-й ряд -
;
;
т3 = 10.
Следует установить, имеется ли значимая разница между средними трех этих рядов измерений.
1 Сопоставим 1-й и 2-й ряды. Вначале определим значимость различия дисперсий, используя критерий Фишера. Проверяем гипотезу : при конкурирующей гипотезе : . Для этого находим расчетное значение критерия F по формуле (2.57):
По Таблица 8
определяем:
.
Так как FR
> FT,
то гипотеза
отвергается и принимается конкурирующая
гипотеза, т.е.
.
При этих условиях для проверки гипотезы : определим расчетное значение критерия Стьюдента по формуле:
Вычислим число степеней свободы:
,
.
Табличное значение
двустороннего критерия находим по Таблица 12:
.
Так как tR
< tT,
нулевая гипотеза не подтвердилась,
т.е. разница между средними 1-го и 2-го
рядов незначима.
2 Сопоставим 2-й и 3-й ряды. Проверяем гипотезу : при конкурирующей гипотезе : .
Так как
.
,
следовательно, FR>FT,
гипотеза
с уровнем значимости а = 0,05 не может
быть принята.
Оценим теперь
возможность отбрасывания гипотезы
.
Для этого определяем FT,
при уровне значимости а = 0,01 по Таблица 10:
.
Так как FR
< FT,
при а = 0,01 оцениваемую гипотезу
отбросить нельзя. То же самое нельзя
сделать и при а = 0,025, так как FR
= 3,9 < FT
= 4,03. В данной ситуации рекомендуется
сравнить средние при условии
и
.
а) если
,
то для проверки гипотезы
:
по
формулам находим:
Табличное значение
двустороннего критерия
,
.
Так как при уровнях значимости 0,05 и 0,01
имеем tR
> tT,
то это дает основание заключить, что
средние 2-го и 3-го рядов значимо отличаются;
б) если
,
то для проверки гипотезы
:
при конкурирующей
гипотезе
:
по
формулам находим:
Так как табличное
значение двустороннего критерия
,
нулевая гипотеза отвергается, т.е.
средние 2-го и 3-го рядов значимо отличаются.
3 Сопоставим
1-й и 3-й ряды. Проверяем гипотезу
:
при конкурирующей гипотезе
:
.
Так как
.
,
следовательно, FR<FT,
гипотеза
с уровнем значимости а = 0,05 о равенстве
дисперсий принимается.
При уровне значимости а = 0,05 и FR<FT. Поэтому гипотеза о равенстве дисперсий безусловно не отвергается.
Если
,
то для проверки гипотезы
:
при конкурирующей
гипотезе
:
по
формулам находим:
Односторонний
критерий при уровне значимости α
= 0,05 и числе степеней свободы
f=10+10-2 =18 равен:
.
Так как tR
< tT,
то нулевая гипотеза не отвергается,
т.е. средние 1-го и 3-го рядов отличаются
не значимо.
В тех случаях,
когда разница средних оказалась при pD
= 0,95 незначимой, рекомендуется увеличить
объем двух выборок. Ниже приводится
метод определения этого объема с
оптимальным соотношением
и
.
Если предполагается,
что дисперсии двух выборок не равны
(
),
то при данном
наилучшим соотношением величин
и
является такое, при котором среднее
квадратическое отклонение разности
средних
.
получается по возможности наименьшим, а число степеней свободы для критерия Стьюдента - наибольшим.
Оптимальным соотношением является такое, когда
и объемы выборок
.
При этих условиях формула для критерия Стьюдента принимает вид:
.
и tR
имеет распределение
Стьюдента с
степенями свободы в очень широкой
области значений a
и т. Это позволяет определять
объем необходимой выборки при сравнении
средних двух выборок, если известно,
что их дисперсии не равны. Для этого
принимается
,
и предыдущая формула после возведения
в квадрат принимает вид:
.
Определив по данным
предварительного эксперимента
и задаваясь желаемой разностью
средних, находят по Таблица 14 при
выбранном значении
искомый объем выборки т. Затем по
формулам определяют т1
и т2.
Пример.
При анализе данных предыдущего примера установлено, что разница незначима. Найдем необходимый объем выборки, чтобы различия между средними, если они превышают 2,4, были значимы c pD = 0,95.
По данным предыдущего примера, используя формулы, находим:
а по Таблица 14 - искомый объем: т = 25. Затем по формулам определяем оптимальное соотношение объемов:
;
.
Определим значимость
разницы
при вновь найденных объемах выборок.
Прежде проверим значимость различия
дисперсий, используя формулу
.
По Таблица 8 находим:
.
Так как FR
= 7,2 > FT=
3,9, то различие дисперсий значимо. При
этой ситуации для решения поставленной
задачи необходимо использовать критерий
Стьюдента. По формулам и рассчитываем:
,
,
.
По Таблица 12
находим:
.
Так как tR
=2,1 > tT2
= 2,07, при pD
= 0,95 разница
значима. Следовательно, разница
будет
тем более значима.
