Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпора ТВМС.doc
Скачиваний:
4
Добавлен:
23.04.2019
Размер:
958.98 Кб
Скачать

Вопрос 26

Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности

Критерий Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.

Итак, пусть по выборке объема п получено эмпири­ческое распределение:

варианты ……. хi х1 х2 … хs

эмп. частоты... пi п1 п2 ... пs

Допустим, что в предположении нормального распре­деления генеральной совокупности вычислены теорети­ческие частоты п'i (например, так, как в следующем па­раграфе). При уровне значимости а требуется проверить нулевую гипотезу: генеральная совокупность распреде­лена нормально.

В качестве критерия проверки нулевой гипотезы при­мем случайную величину

(*)

.Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значе­ния. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (*), и, следовательно, он в известной степени характеризует близость Эмпирического и теоретического распределений.

Заметим, что возведением в квадрат разностей частот устраняют возможность взаимного погашения положи­тельных и отрицательных разностей. Делением на до­стигают уменьшения каждого из слагаемых; в против­ном случае сумма была бы настолько велика, что при­водила бы к отклонению нулевой гипотезы даже и тогда. когда она справедлива. Разумеется, приведенные сооб­ражения не являются обоснованием выбранного крите­рия, а лишь пояснением.

Доказано, что при п—>∞ закон распределения слу­чайной величины (*) независимо от того, какому закон распределения подчинена генеральная совокупность, стре­мится к закону распределения χ2 с k степенями свободы Поэтому случайная величина (*) обозначена через χ2, :

сам критерий называют критерием согласия «хи квадрат»

Число степеней свободы находят по равенству k == s—1г, где s—число групп (частичных интервалов выборки; г—число параметров предполагаемого распре­деления, которые оценены по данным выборки.

В частности, если предполагаемое распределение—нормальное, то оценивают два параметра (математическское ожидание и среднее квадратическое отклонение), поэтому г =2 и число степеней свободы k==s—1—r =s1—2=

=s—3.

Если, например, предполагают, что генеральная сово­купность распределена по закону Пуассона, то оцени­вают один параметр К, поэтому г==1 и k=s2.

Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требо­вания, чтобы вероятность попадания критерия в эту об­ласть в предположении справедливости нулевой гипотезы была равна принятому уровню значимости а:

.

Таким образом, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы—неравенством .

Обозначим значение критерия, вычисленное по дан­ным наблюдений, через и сформулируем правило проверки нулевой гипотезы.

.

Билет 27

Пусть генеральные совокупности Х1,Х2, . • ., Хр распределены нормально и имеют одинаковую, хотя и неизвестную, дисперсию; математические ожидания также неизвестны, но могут быть различными. Требуется при заданном уровне значимости по выборочным средним

проверить нулевую гипотезу Н0:М (Х1) = М (Х2) ==...=М (Хр) о равенстве всех математических ожиданий. Другими словами, требуется установить, значимо или незначимо различаются выборочные средние. Казалось бы, для сравнения нескольких средних > 2) можно сравнить их попарно. Однако с возрастанием числа средних возрастает и наибольшее различие между ними: среднее новой выборки может оказаться больше наибольшего или меньше наименьшего из средних, полученных до нового опыта. По этой причине для сравнения нескольких сред­них пользуются другим методом, который основан на :равнении дисперсий и поэтому назван дисперсионным анализом (в основном развит английским статистиком Р. Фишером).

На практике дисперсионный анализ применяют, чтобы ; становить, оказывает ли существенное влияние некото­рый качественный фактор F, который имеет р уров­ней F1, F2.. ., Fр на изучаемую величину X. Например, если требуется выяснить, какой вид удобрений наиболее эффективен для получения наибольшего урожая, то фак­тор Fудобрение, а его уровни—виды удобрений.

Основная идея дисперсионного анализа состоит в срав­нении «факторной дисперсии», порождаемой воздействием фактора, и «остаточной дисперсии», обусловленной слу­чайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на X; в этом случае средние наблюдаемых зна­чений на каждом уровне (групповые средние) различа­ются также значимо.

Если уже установлено, что фактор существенно влияет на X, а требуется выяснить, какой из уровней оказывает наибольшее воздействие, то дополнительно произ­водят попарное сравнение средних..

Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предполо­жению; если дисперсионный анализ покажет, что и мате­матические ожидания одинаковы, то в этом смысле сово­купности однородны). Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы.

В более сложных случаях исследуют воздействие нескольких факторов на нескольких постоянных или случайных уровнях и выясняют влияние отдельных уров­ней и их комбинаций (многофакторный анализ).

Мы ограничимся простейшим случаем однофакторного анализа, когда на Х воздействует только один фактор, который имеет р постоянных уровней.