Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы и средства исследований.doc
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
2.36 Mб
Скачать

5.5Сравнение двух средних больших независимых выборок

Если выборки имеют большой объем (т > 30) и незави­симы, то выборочные средние распределены приближенно нормально, а выборочные дисперсии являются достаточно хорошими оценками генеральных дисперсий, и поэтому их можно считать известными приближенно. При этих усло­виях случайная величина:

распределена приближенно нормально с параметрами (при условии справедливости нулевой гипотезы) и (если выборки независимы).

Для проверки нулевой гипотезы : принимается приближенный критерий, расчетное значение которого равно:

Критическая область строится в зависимости от вида конкурирующей гипотезы.

Первый случай. Если конкурирующая гипотеза : то при заданном уровне значимости а по таблице функции Лапласа (Таблица 11) находят табличное зна­чение двустороннего критерия по равенству:

Если то нет оснований отвергнуть нулевую гипотезу о равенстве и , т.е. .

Если , то нулевую гипотезу отвергают.

Пример.

Проведено измерение прочности двух образцов пряжи, и получены сле­дующие данные: ; ; ; ; ; . При уровне значимости α = 0,05 требуется проверить нулевую гипотезу : при конкурирующей гипотезе : .

Находим расчетное значение критерия по формуле (2.66):

Используя равенство по таблице Лапласа (Таблица 11) находим .

Так как то нулевую гипотезу отвергаем, т.е. разница между средними значениями прочности двух образцов пряжи существенна.

Второй случай. Если конкурирующая гипотеза : то при заданном уровне значимости а, используя таблицу функции Лапласа (Таблица 11), находят табличное значение одностороннего критерия по равенству:

.

Если то нулевая гипотеза не отвергается.

В противном случае гипотеза отвергается.

Пример.

Исследователь после введения конструктивных изменений в прядильное пневмомеханическое устройство ожидает повышения прочности пряжи, т.е. принимает по отношению к гипотезе : конкурирующую ги­потезу : . Числовые статистические характеристики двух об­разцов пряжи приведены в предыдущем примере, поэтому

Используя равенство по таблице функции Лапласа (Таблица 11) находим . Так как , нулевую гипотезу отвергают, т.е. конструктивное изменение в прядильном устройстве обусловило значимое изменение прочности пряжи.

5.6Сравнение двух средних из нормально распределенных генеральных совокупностей

Если проверяется гипотеза о равенстве двух средних из нормально распределенных генеральных совокупностей, дис­персии которых неизвестны, то, прежде всего, следует про­верить с помощью F-критерия гипотезу о равенстве диспер­сий в генеральных совокупностях. При этом возможны два случая.

Первый случай - равноточность двух рядов измерений доказана. Для проверки гипотезы о равенстве сред­них, найденных по независимым малым выборкам, исполь­зуется критерий t, расчетное значение которого определяется по формуле:

где - среднее квадратическое отклонение разности , или ошибка разницы;

Доказано, что величина t при справедливости нулевой гипотезы : имеет t-распределение Стьюдента с степенями свободы. Критическая область строится в зависимости от вида конкурирующей гипотезы.

Если проверяется гипотеза : при конкурирующей гипотезе : , то в этом случае используется двусторонний критерий , табличное зна­чение которого определяют по Таблица 12 при задан­ном уровне значимости α и числе степеней свободы . Если нулевую гипотезу отвергают, т.е. исследователь устанавливает, например, что применение уровня фактора или конструктивные изменения в машине обусловили значимое различие между выходными параметрами. Если , то нет оснований отвергать гипотезу о равенстве средних, т.е. оба ряда измере­ний относятся к одной и той же совокупности, для которой среднее значение определяется по формуле:

а дисперсия - по формуле указанной выше .

Если разность между средними двух выборок значима только при доверительной вероятности в пределах , то прежде чем идти на риск по принятию нулевой гипотезы : , следует увеличить объем выборки, т.е. провести дополнительный эксперимент.

Оптимальным соотношением объемов сравниваемых выборок является где так как при этом ошибка разности оказывается наименьшей.

Считая дисперсии сравниваемых совокупностей одина­ковыми и равными при из фор­мулы получаем:

В этом случае расчетное значение критерия Стьюдента:

Чтобы разность можно было бы считать значимой, должна быть если не больше, то, по крайней мере, равна для заданной доверительной вероятности и задан­ного числа степеней свободы .

После замены на , сосредоточивая в левой части предыдущей формулы члены, зависящие от m, и возводя обе части в квадрат, получим:

где

Зная К2 при заданной , по Таблица 14 определяют искомое значение т.

Таблица 14 - Достаточная численность выборок m в зависимости от величины

Для случая, когда К2< 0,13, искомое т находят по формуле:

(что также нашло отражение в Таблица 14). Величина , входящая в формулу для К2, определяется по данным проведенного эксперимента или по данным других иссле­дований. Величину разности принимают равной или наименьшему различию между средними, которое может представлять практический интерес, или разности, которая оказалась незначимой в предварительном эксперименте. При использовании формул для К2 предполагается, что увеличение объема выборки не вызовет значительного из­менения и .

Пример.

При испытании прочности полосок двух вариантов ткани, выработанной при различной плотности по утку, получены следующие числовые стати­стические характеристики двух рядов измерений: ; ; т1 = 12; ; ; т2 = 10. Проверяем гипотезу о равенстве дисперсий : при конкурирующей гипотезе : .

Расчетное значение критерия Фишера . Табличное значение критерия определяем по Таблица 8 при уровне значимости а = 0,05 и числе степеней свободы ft = 12 - 1 = 11 и f2 = 10-1=9, т.е. . Так как FR < FT, гипотеза о равенстве дисперсий не отвергается, т.е. нельзя было доказать зна­чимого различия по дисперсии прочности полосок ткани.

Проверим гипотезу о равенстве средних : при кон­курирующей гипотезе : . По формуле определяем дис­персию:

Затем находим расчетное значение критерия Стьюдента:

и его табличное значение (Таблица 12): . Так как гипотеза о равенстве средних значений прочности полоски ткани отвергается, т.е. увеличение плотности ткани по утку обусловило значимое различие в их прочности.

Если проверяется гипотеза средних : при кон­курирующей гипотезе : , то используется односторонний критерий, табличное зна­чение которого определяют по Таблица 12 при заданном уровне значимости а и числе степеней свободы т.е. . Если то нет ос­нований отвергать нулевую гипотезу. Если tR> (л, то нулевую гипотезу отвер­гают.

Для предыдущего примера при конкурирующей гипотезе : ,табличное значение критерия Стьюдента находится по Таблица 12: . Так как , то гипотеза должна быть отброшена, т.е. и при второй конкурирующей гипотезе статисти­ческое исследование показало, что проведенное изменение плотности ткани по утку обусловило значимое изменение ее прочности.

Второй случай - равноточность двух рядов измерений не доказана. Для проверки нулевой гипотезы о ра­венстве средних используется также крите­рий t (Стьюдента), расчетное значение которого определя­ется по приближенной формуле:

Табличное значение двустороннего критерия определя­ется при заданном уровне значимости а и числе степеней свободы:

где ; ; .

Если то разница незначима, а если , то разница между средними значима.

Пример.

Статистическая обработка трех рядов измерений выходного параметра, полученных при трех типах конструктивных рабочих органов машины, дала следующие числовые характеристики: 1-й ряд - ; ; т1 = 10.

2-й ряд - ; ; т2 = 10.

3-й ряд - ; ; т3 = 10.

Следует установить, имеется ли значимая разница между средними трех этих рядов измерений.

1 Сопоставим 1-й и 2-й ряды. Вначале определим значимость различия дис­персий, используя критерий Фишера. Проверяем гипотезу : при конкурирующей гипотезе : . Для этого находим расчетное значение критерия F по формуле (2.57):

По Таблица 8 определяем: . Так как FR > FT, то гипотеза отвергается и принимается конку­рирующая гипотеза, т.е. .

При этих условиях для проверки гипотезы : определим расчетное значение критерия Стьюдента по формуле:

Вычислим число степеней свободы:

,

.

Табличное значение двустороннего критерия находим по Таблица 12: . Так как tR < tT, нулевая гипотеза не подтвердилась, т.е. разница между средними 1-го и 2-го рядов незначима.

2 Сопоставим 2-й и 3-й ряды. Проверяем гипотезу : при конкурирующей гипотезе : .

Так как . , следовательно, FR>FT, гипотеза с уровнем значимости а = 0,05 не может быть принята.

Оценим теперь возможность отбрасывания гипотезы . Для этого опре­деляем FT, при уровне значимости а = 0,01 по Таблица 10: . Так как FR < FT, при а = 0,01 оцениваемую гипотезу отбросить нельзя. То же самое нельзя сделать и при а = 0,025, так как FR = 3,9 < FT = 4,03. В данной ситуации рекомендуется сравнить средние при условии и .

а) если , то для проверки гипотезы : по формулам находим:

Табличное значение двустороннего критерия , . Так как при уровнях значимости 0,05 и 0,01 имеем tR > tT, то это дает основание заключить, что средние 2-го и 3-го рядов значимо отличаются;

б) если , то для проверки гипотезы : при конку­рирующей гипотезе : по формулам находим:

Так как табличное значение двустороннего критерия , нулевая гипотеза отвергается, т.е. средние 2-го и 3-го рядов значимо отличаются.

3 Сопоставим 1-й и 3-й ряды. Проверяем гипотезу : при конкурирующей гипотезе : .

Так как . , следовательно, FR<FT, гипотеза с уровнем значимости а = 0,05 о равенстве дисперсий принимается.

При уровне значимости а = 0,05 и FR<FT. Поэтому гипотеза о равенстве дисперсий безусловно не отвергается.

Если , то для проверки гипотезы : при конку­рирующей гипотезе : по формулам находим:

Односторонний критерий при уровне значимости α = 0,05 и числе степеней сво­боды f=10+10-2 =18 равен: . Так как tR < tT, то нулевая гипотеза не отвергается, т.е. средние 1-го и 3-го рядов отличаются не значимо.

В тех случаях, когда разница средних оказалась при pD = 0,95 незначимой, рекомендуется увеличить объем двух выборок. Ниже приводится метод определения этого объема с опти­мальным соотношением и .

Если предполагается, что дисперсии двух выборок не равны ( ), то при данном наилучшим со­отношением величин и является такое, при котором среднее квадратическое отклонение разности средних

.

получается по возможности наименьшим, а число степеней свободы для критерия Стьюдента - наибольшим.

Оптимальным соотношением является такое, когда

и объемы выборок

.

При этих условиях формула для критерия Стьюдента принимает вид:

.

и tR имеет распределение Стьюдента с степенями свободы в очень широкой области значений a и т. Это позволяет определять объем необходимой выборки при сравнении средних двух выборок, если известно, что их дисперсии не равны. Для этого принимается , и предыдущая формула после возведения в квадрат принимает вид:

.

Определив по данным предварительного эксперимента и задаваясь желаемой разностью средних, находят по Таблица 14 при выбранном значении искомый объем выборки т. Затем по формулам опре­деляют т1 и т2.

Пример.

При анализе данных предыдущего примера установлено, что разница незначима. Найдем необходимый объем выборки, чтобы различия ме­жду средними, если они превышают 2,4, были значимы c pD = 0,95.

По данным предыдущего примера, используя формулы, на­ходим:

а по Таблица 14 - искомый объем: т = 25. Затем по формулам определяем оптимальное соотношение объемов:

; .

Определим значимость разницы при вновь найденных объе­мах выборок. Прежде проверим значимость различия дисперсий, используя формулу . По Таблица 8 находим: . Так как FR = 7,2 > FT= 3,9, то различие дисперсий значимо. При этой ситуации для решения поставленной задачи необходимо использовать критерий Стьюдента. По формулам и рассчитываем:

,

,

.

По Таблица 12 находим: . Так как tR =2,1 > tT2 = 2,07, при pD = 0,95 разница значима. Следовательно, разница будет тем более значима.

44