Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
107 группе.doc
Скачиваний:
4
Добавлен:
04.09.2019
Размер:
717.82 Кб
Скачать

2.1 Проверка гипотез относительно средних по данным двух независимых выборок

При независимых выборках в качестве нулевой гипотезы выдвигается предположение, что средние по двум генеральным совокупностям из которых произведены выборки равны между собой: Н0: , в качестве альтернативной может быть выдвинута ненаправленная гипотеза НА : или направленная НА : или наоборот

Направленная гипотеза может носить еще более сложный характер. Например , . Такая постановка гипотез отражает особенности распределения используемых для проверки критериев, а также то обстоятельства, что экспериментатор в подавляющем большинстве случаев уверен в преимуществе контрольного варианта опыта.

Выбор уровня значимости происходит традиционно, только особое внимание следует уделить анализу ошибок первого и второго рода с целью выбора приоритетных из них с последующим выбором того или иного уровня значимости.

В качестве критериев для проверки обозначенных выше гипотез используются два : критерий t - нормального распределения, если численность каждой из выборок, на основе которых проверяется гипотеза превышает 30 единиц. Если хотя бы одна выборка содержит меньшее число единиц, то используется критерий t - Стьюдента

Алгоритм расчета фактического значения критерия видоизменяется в зависимости от 4-х возможных ситуаций:

1-я ситуация - выборки равны по численности (n1 =n2) и равны дисперсии по генеральным совокупностям ( );

2-я ситуация - выборки по численности не равны ( ), но дисперсии по генеральным совокупностям остаются равными ( );

3-я ситуация- выборки по численности равны ( ) , но дисперсии по генеральным совокупностям не равны между собой ( );

4-я ситуация нет равенства ни в численностях выборок ( ) , ни в дисперсиях по генеральным совокупностям ( );

Равенство или неравенство выборок по численности установить просто, а для установления равны или не равны дисперсии по генеральным совокупностям необходимо проверить вспомогательную гипотезу: Н0: и соответственно НА: . Проверка этой вспомогательной гипотезы производится на основе F – критерия, представляющего собой отношение двух выборочных дисперсий, как оценок дисперсий генеральных, при этом в числителе всегда стоит большая по величине дисперсия.

Таким образом, фактическое значение критерия будет равно , если или , если .

Фактическое значение критерия сопоставляется с табличным, которое зависит от принятого уровня значимости и от числа степеней свободы для первой выборки d f ( )1 = n1 – 1 и для по второй- d f ( )2 =п2 - 1 . Принятие решение о равенстве или неравенстве дисперсий по генеральным совокупностям происходит по традиционной схеме.

В зависимости от ситуации, к которой принадлежат исходные данные , фактическое значение критерия рассчитывается по следующим алгоритмам :

При первой ситуации , где - среднее значение признака по первой выборке ; - среднее значение признака по второй выборке, при этом разность между средними берется по абсолютной величине.

Поскольку дисперсии по генеральным совокупностям равны, находится усредненная по 2-м выборкам дисперсия - ,

- значения признака по первой выборке, - значения признака по второй выборке; = - численность равных по величине выборок.

При второй ситуации фактическое значение критерия находится по следующей формуле , то есть, поскольку дисперсии равны опять используется усредненная дисперсия, однако так как численности выборок не равны формула для расчета усредненной дисперсии будет выглядеть так:

При третьей ситуации фактическое значение критерия определяется по формуле . Поскольку дисперсии по генеральным совокупностям не равны, каждая из выборочных дисперсий берется отдельно.

При четвертой ситуации фактическое значение критерия определяется аналогично как и при третьей.

Если в качестве альтернативной гипотезы взято предположение. что числитель для всех ситуаций приобретает вид

Табличное значение критерия t – нормального распределения зависит только от уровня значимости; табличное значение критерия t-Стьюдента для первых трех ситуаций , кроме уровня значимости зависит от числа степеней свободы , которое для первых двух ситуаций определяется по формуле: d f ( ) = ( . Для третьей ситуации при определении числа степеней свободы вносится поправка и формула приобретает вид : d f ( ) = [ ( ] [0,5 + ]

Для четвертой ситуации табличное значение критерия является расчетной величиной и определяется по формуле: , где и - табличные значения критерия t – Стьюдента для первой и второй выборок, соответственно с числом степеней свободы и .

Величина стоящая в знаменателя при расчете фактического значения критерия представляет собой среднюю ошибку двух выборочных средних. Она показывает насколько в среднем из-за игры случая могут различаться две выборочных средних, если выборки сделаны из одной генеральной совокупности. На основе средней ошибки двух выборочных средних может быть по известному алгоритму может быть определена предельная случайная разность двух выборочных средних, которая получила название наибольшей случайной разности или НСР, то есть

НСР = (для первой и второй ситуации) и НСР = (для третьей и четвертой ситуации). Сравнивая НСР с фактической разницей между выборочными средними можно без расчета фактического значения критерия принять или опровергнуть выдвинутые гипотезы, при этом если ( ) НСР принимается нулевая гипотеза, поскольку различия между выборочными средними находятся в пределах игры случая. Если же ( ) НСР нулевая гипотеза о равенстве генеральных средних отвергается и принимается альтернативная гипотеза.