
- •Вопрос 1.
- •Вопрос 2.
- •Вопрос 3.
- •Вопрос 4.
- •Вопрос 5.
- •Вопрос 6.
- •Вопрос 7.
- •Вопрос 8.
- •Вопрос 9.
- •Вопрос 10.
- •Вопрос 11.
- •Вопрос 12.
- •Вопрос 13.
- •Вопрос 14.
- •Вопрос 15.
- •Вопрос16.
- •Вопрос 17.
- •Вопрос 18.
- •2. Ф(х) - монотонно возрастает
- •Вопрос 19.
- •2. Ф(х) - монотонно возрастает
- •Вопрос 20. Пуассоновское распределение (дискретное)
- •Вопрос 21.
- •Вопрос 22. Равномерное распределение.
- •Вопрос 23.
- •Вопрос 24.
- •Вопрос 25.
- •Вопрос 26.
- •Теорема: При достаточно большом числе независимых опытов среднее арифметическое полученных в опытах значений случайной величины X сходится по вероятности к ее математическому ожиданию
- •Вопрос 27.
- •Вопрос 28.
- •Вопрос 29.
- •Вопрос 30.
- •Вопрос 31.
- •Вопрос 32.
- •Вопрос 33.
- •Вопрос 34.
- •Вопрос 35.
- •Вопрос 36.
- •Вопрос 38.
- •Вопрос 39.
- •Вопрос 40.
- •Вопрос 41.
- •Вопрос 42.
Вопрос 38.
Критерий согласия Пирсона, его сущность, применение для проверки гипотезы о нормальном распределении.
Критерий
согласия Пирсона
– один из основных
:
где k – число групп, на которые разбито
эмпирическое распределение, fi–
наблюдаемая частота признака в i-й
группе,
f`i
– теоретическая частота. Для распределения
составлены таблицы, где указано
критическое значение критерия согласия
для выбранного уровня значимости
и степеней свободы df.(или
)
Уровень значимости
– вероятность ошибочного отклонения
выдвинутой гипотезы, т.е. вероятность
того, что будет отвергнута правильная
гипотеза. В статистике пользуются тремя
уровнями: a= 0,10, тогда Р=0,90 (в 10 случаях
их 100 может быть отвергнута правильная
гипотеза); a= 0,05, тогда Р=0,95; a= 0,01, тогда
Р=0,99. Число степеней свободы df определяется
как число групп в ряду распределения
минус число связей: df
= k –z.
Под числом связей понимается число
показателей эмпирического ряда,
использованных при вычислении
теоретических частот, т.е. показателей,
связывающих эмпирические и теоретические
частоты. Например, при выравнивании по
кривой нормального распределения
имеется три связи:
;
;
. Поэтому при выравнивании по кривой
нормального распределения число степеней
свободы определяется как df
= k –3.
Для оценки существенности расчетное
значение
сравнивается с табличным
. При полном совпадении теоретического
и эмпирического распределений
,
в противном случае
>0. Если
>
,
то при заданном уровне значимости и
числе степеней свободы гипотезу о
несущественности (случайности) расхождений
отклоняем. В случае, если
, заключаем, что эмпирический ряд хорошо
согласуется с гипотезой о предполагаемом
распределении и с вероятностью Р=(1-a)
можно
утверждать, что расхождение между
теоретическими и эмпирическими частотами
случайно. Критерий согласия Пирсона
используется, если объем совокупности
достаточно велик
,
при этом частота каждой группы должна
быть не менее 5
Вопрос 39.
Критерий согласия Пирсона, его сущность, применение для проверки гипотезы распределения Пуассона.
При
объеме выборки
для
проверки гипотезы о законе распределения
используют критерий c2 (критерий
Пирсона, критерий согласия). Он применяется
для группированных данных (как при
построении гистограммы), когда в каждом
интервале находится не менее 5 измерений
(иначе интервал называется малонаселенным).
Если число измерений в интервале
оказывается меньше 5, тогда он объединяется
с соседним.
Современный взгляд на этот вопрос заключается в следующем: не должно быть «пустых» интервалов [8].
Если
рассматривать частоту i-го
интервала как случайную величину, то
–
число появлений «успеха» в
независимых
испытаниях, где под «успехом» понимается
попадание случайной величины
в
-й
интервал. Таким образом, вероятность
«успеха» равна
,
а случайная величина
имеет
биномиальное распределение с
параметрами
и
.
В частности,
.
Рассмотрим статистику c2 –
функцию от случайных величин
,
определяемую формулой
,
где
–
число данных в i-м
интервале (
),
–
теоретическая вероятность попадания
случайной величины
в i-й
интервал,
–
объем выборки,
–
число интервалов.
Можно
показать, что, если закон распределения
генеральной совокупности
подобран
правильно, то с ростом
случайную
величину
можно
считать распределенной по распределению
с
числом степеней свободы
;
–
числом параметров проверяемого закона
распределения, вычисленных
по выборке.
Следует обратить внимание на то, что
число степеней свободы – это число
независимых слагаемых в сумме
,
т. е. общее число слагаемых минус число
наложенных уравнений связи. В общем
случае по выборке оценивают
параметров.
Еще одно уравнение связи вполне очевидно:
сумма всех вероятностей
равна
1 (если первый и последний интервалы
полуоткрытые) или некоторому числу,
меньшему 1 (но известному). В случае
нормального распределения
,
так как по выборке оцениваются два
параметра распределения – математическое
ожидание и дисперсия. В случае распределения
Пуассона
,
так как математическое ожидание и
дисперсия его равны, по выборке
определяется один параметр.
Итак, критерий согласия c2 имеет вид
. *
Вычисленное
по формуле (*) значение сравнивается
с табличным при выбранном одностороннем
уровне значимости
.
Если
,
то гипотеза о виде распределения не
отвергается, в противном случае она
отвергается, и строится новая гипотеза
– предполагается другой закон.
Статистика c2 лишь
приближенно имеет распределение
(при
справедливой нулевой гипотезе), причем
для этого необходим не только большой
объем выборки
,
но и достаточно большое число интервалов
.
Строгого решения вопроса о числе
интервалов и необходимом объеме выборки
нет. На практике критерием (*) пользуются
и при довольно малых
(10–15)
и
(40–50).
При этом необходимо помнить, что в этом
случае критерий (*) обладает повышенной
вероятностью ошибки первого рода
(признать
неверной проверяемую нулевую гипотезу,
когда она верна). Поэтому в таких
ситуациях, когда выводы о законе
распределения по критериям Колмогорова
и Пирсона окажутся противоречащими
друг другу, предпочтение должно быть
отдано критерию Колмогорова.