- •11. Ковариация двух сл. Вел-н, ее св-ва, коэффициент корреляции двух сл. Вел-н и его св-ва.
- •12. Биноминальное распределен., вычисление мат. Ожид. И дисперсии бином-ой сл. Вел-ны.
- •13. Пуассоновское распределение
- •14. Непрерывные случайные величины
- •19. Постановка и решение задачи линейной регрессии. Метод наименьших квадратов.
- •20. Основные понятия математической статистики.
- •21. Методы получения оценок: метод моментов и метод наибольшего правдоподобия, функция правдоподобия( дискретный и непрерывный случаи), примеры.
- •24. Статистические гипотезы, постановка задачи построения критерия проверки статистической гипотезы. Уровень значимости и мощность критерия. Параметрический критерий. Теорема Неймана-Пирсона.
- •Вопрос 25
- •Вопрос 26
Вопрос 26
Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности
Критерий Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.
Итак, пусть по выборке объема п получено эмпирическое распределение:
варианты ……. хi х1 х2 … хs
эмп. частоты... пi п1 п2 ... пs
Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты п'i (например, так, как в следующем параграфе). При уровне значимости а требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.
В качестве критерия проверки нулевой гипотезы примем случайную величину
(*)
.Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (*), и, следовательно, он в известной степени характеризует близость Эмпирического и теоретического распределений.
Заметим, что возведением в квадрат разностей частот устраняют возможность взаимного погашения положительных и отрицательных разностей. Делением на достигают уменьшения каждого из слагаемых; в противном случае сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже и тогда. когда она справедлива. Разумеется, приведенные соображения не являются обоснованием выбранного критерия, а лишь пояснением.
Доказано, что при п—>∞ закон распределения случайной величины (*) независимо от того, какому закон распределения подчинена генеральная совокупность, стремится к закону распределения χ2 с k степенями свободы Поэтому случайная величина (*) обозначена через χ2, :
сам критерий называют критерием согласия «хи квадрат»
Число степеней свободы находят по равенству k == s—1—г, где s—число групп (частичных интервалов выборки; г—число параметров предполагаемого распределения, которые оценены по данным выборки.
В частности, если предполагаемое распределение—нормальное, то оценивают два параметра (математическское ожидание и среднее квадратическое отклонение), поэтому г =2 и число степеней свободы k==s—1—r =s—1—2=
=s—3.
Если, например, предполагают, что генеральная совокупность распределена по закону Пуассона, то оценивают один параметр К, поэтому г==1 и k=s—2.
Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости а:
.
Таким образом, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы—неравенством .
Обозначим значение критерия, вычисленное по данным наблюдений, через и сформулируем правило проверки нулевой гипотезы.
.
Билет 27
Пусть генеральные совокупности Х1,Х2, . • ., Хр распределены нормально и имеют одинаковую, хотя и неизвестную, дисперсию; математические ожидания также неизвестны, но могут быть различными. Требуется при заданном уровне значимости по выборочным средним
проверить нулевую гипотезу Н0:М (Х1) = М (Х2) ==...=М (Хр) о равенстве всех математических ожиданий. Другими словами, требуется установить, значимо или незначимо различаются выборочные средние. Казалось бы, для сравнения нескольких средних (р > 2) можно сравнить их попарно. Однако с возрастанием числа средних возрастает и наибольшее различие между ними: среднее новой выборки может оказаться больше наибольшего или меньше наименьшего из средних, полученных до нового опыта. По этой причине для сравнения нескольких средних пользуются другим методом, который основан на :равнении дисперсий и поэтому назван дисперсионным анализом (в основном развит английским статистиком Р. Фишером).
На практике дисперсионный анализ применяют, чтобы ; становить, оказывает ли существенное влияние некоторый качественный фактор F, который имеет р уровней F1, F2.. ., Fр на изучаемую величину X. Например, если требуется выяснить, какой вид удобрений наиболее эффективен для получения наибольшего урожая, то фактор F—удобрение, а его уровни—виды удобрений.
Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием фактора, и «остаточной дисперсии», обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на X; в этом случае средние наблюдаемых значений на каждом уровне (групповые средние) различаются также значимо.
Если уже установлено, что фактор существенно влияет на X, а требуется выяснить, какой из уровней оказывает наибольшее воздействие, то дополнительно производят попарное сравнение средних..
Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предположению; если дисперсионный анализ покажет, что и математические ожидания одинаковы, то в этом смысле совокупности однородны). Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы.
В более сложных случаях исследуют воздействие нескольких факторов на нескольких постоянных или случайных уровнях и выясняют влияние отдельных уровней и их комбинаций (многофакторный анализ).
Мы ограничимся простейшим случаем однофакторного анализа, когда на Х воздействует только один фактор, который имеет р постоянных уровней.