
- •Содержание
- •Понятие о выборочном наблюдении
- •Понятие репрезентативности
- •Статистические ряды
- •Эмпирическая функция распределения
- •Графическое изображение рядов распределения
- •Выборочные характеристики статистического распределения
- •Начальные и центральные моменты вариационного ряда
- •Статистическое оценивание
- •Интервальная оценка математического ожидания нормального распределения Пусть признак х генеральной совокупности имеет нормальный закон распределения с параметрами ,
- •Проверка статистических гипотез
- •Проверка закона распределения генеральной совокупности
- •Задание для контрольной работы
- •Образец выполнения контрольной работы
- •Варианты контрольной работы
- •Библиографический список
Проверка статистических гипотез
Статистическая гипотеза – это любое предположение о виде или параметрах распределения в генеральной совокупности
Для получения обоснованных выводов о параметрах, видах распределения и других свойствах генеральной совокупности рассматривается два вида статистических гипотез и:
а) о законах распределения генеральной совокупности;
б) о параметрах известных распределений.
Проверяемую
гипотезу называют нулевой
(основной) и обозначают
.
Наряду с основной гипотезой рассматривают
конкурирующую (альтернативную) гипотезу
,
являющуюся логическим отрицанием
.
При проверке статистических гипотез могут быть допущены ошибки двух родов с вероятностями:
-
- вероятность отклонить верную гипотезу
(ошибка первого рода);
-
- вероятность принять неверную гипотезу
(ошибка второго рода).
Статистическая проверка гипотезы основывается на том принципе, что маловероятные события считаются невозможными, а события с большой вероятностью – достоверными. Этот принцип реализуется следующим образом.
Перед анализом
выборки задается уровень значимости
- вероятность отклонить верную гипотезу.
Обычно полагают
=0,05;
0,01; 0,001.
Проверка гипотезы осуществляется с помощью специально подобранной случайной величины К, которая называется статистическим критерием.
Критической
областью
называется совокупность значений
критерия, при которых нулевая гипотеза
отвергается. Критические области бывают
двусторонние и односторонние
(правосторонние и левосторонние).
Областью
принятия гипотезы
называется совокупность значений
критерия, прикоторых нулевая гипотеза
справедлива. Для проверки справедливости
нулевой гипотезы по данным выборок
вычисляют наблюдаемое
значение
критерия -
Критическими
точками -
называют точки, которые отделяют
критическую область от области принятия
гипотезы. Критические точки находят по
соответствующим таблицам.
Нулевая гипотеза
отвергается, если наблюдаемое значение
принадлежит критической области. Если
же наблюдаемое значение принадлежит
области принятия гипотезы, то нет
оснований отвергать
.
План проверки статистической гипотезы:
-
формулируется основная гипотеза
и конкурирующая
;
-
выбирается уровень значимости
;
-
выбирается критерий для проверки гипотезы и находится наблюдаемое значение
;
-
по соответствующей таблице находится критическое значение
;
-
делается вывод.
Проверка закона распределения генеральной совокупности
Для полной научно обоснованной количественной характеристики признака Х генеральной совокупности важно знать его закон распределения. Задача определения закона распределения может быть решена несколькими способами. Рассмотрим некоторые из них.
Применение гистограммы для определения закона распределения
П
роизведем
случайную выборку объема n.
Полученные данные сгруппируем, составим
ряд распределения. Далее построим
гистограмму полученного распределения.
Затем середины верхних оснований
прямоугольников гистограммы соединим
последовательно прямолинейными
отрезками. Полученный в результате
этого график называют линией
эмпирической плотности рас
Рисунок 7. Подбор по гистограмме закона распределения
пределения. По виду этой линии подбираем “похожую” линию, уравнение которой нам известно и которая ближе всех других линий подходит к построенной эмпирической линии. Эта “похожая” линия называется теоретической линией плотности распределения.
Применение метода моментов для определения закона распределения.
Коэффициент асимметрии А и эксцесс Е нормального распределения равны нулю.
Применение критериев согласия для определения нормального закона распределения.
Пусть имеется
эмпирическое распределение признака
Х, в котором
.
Это распределение можно рассматривать
как случайную выборку объема n
из некоторой генеральной совокупности.
Предположим, что на основе данного
эмпирического распределения мы установили
теоретическое распределение признака
Х в генеральной совокупности, составили
теоретическую функцию распределения
и вычислили теоретические частоты
,
,
... ,
соответствующих значений
,
,
... ,
признака Х.
Очевидно, что
теоретические частоты
могут не совпадать с соответствующими
эмпирическими частотами
.
Расхождения между ними зависят от
случайных обстоятельств, при которых
было получено эмпирическое распределение,
и от функции F(x),
с помощью которой были вычислены
теоретические частоты.
При сравнении теоретического и эмпирического распределения мерой их близости служат так называемые критерии согласия.
Критерий согласия – это правило, которое, опираясь на известный закон распределения определенного вида расхождений между теоретическими и эмпирическими частотами или между теоретической и эмпирической функциями распределения, дает возможность установить, когда это расхождение является несущественным, то есть случайным, а когда существенным, то есть неслучайным.
Существует несколько
критериев согласия: критерий Пирсона
(-
критерий), критерий Колмогорова, критерий
Смирного, критерий Романовского и др.
Рассмотрим критерии согласия Пирсона
и Колмогорова как наиболее простые и
удобные для вычислений.
Критерий
Колмогорова. В
этом критерии в качестве меры расхождения
между теоретическим и эмпирическим
распределениями рассматривается
максимальное значение абсолютной
величины разности между эмпирической
функцией распределения
и соответствующей теоретической функцией
распределения
,
называемое статистикой критерия Колмогорова.
Доказано,
что какова бы ни была функция распределения
F(x)
непрерывной случайной величины Х, при
неограниченном увеличении числа
наблюдений ()
вероятность неравенства
стремится к пределу
Задавая уровень
значимости ,
из соотношения
можно найти
соответствующее критическое значение
.
В таблице 3 приводятся критические
значения
критерия Колмогорова для некоторых .
-
Уровень
значимости
0,10
0,05
0,025
0,01
0,005
0,001
Критические
значения
1,22
1,36
1,48
1,63
1,73
1,95
Таблица 3. Критические
значения
Схема применения критерия Колмогорова следующая:
1. Строятся
эмпирическая функция распределения
и предполагаемая теоретическая функция
распределения F(x).
2. Определяется
мера расхождения между теоретическим
и эмпирическим распределением D
и
вычисляется
величина
.
3.
Если вычисленное значение
окажется
больше критического
,
определяемого по уровню значимости
,
то нулевая гипотеза
о том, что признак Х генеральной
совокупности имеет заданный закон
распределения, отвергается Если
,
то считают, что нет оснований отвергать
гипотезу
.
Критерий Колмогорова часто используется на практике благодаря своей простоте. Но его применение возможно лишь тогда, когда теоретическая функция распределения F(x) задана полностью, что на практике встречается не всегда. Следует иметь в виду также, что критерий Колмогорова применим только к случайным величинам, изменяющимся непрерывно.
Критерий
Пирсона. При
решении вопроса о согласовании между
эмпирическим и теоретическим распределением
английский биолог К. Пирсон рассматривал
расхождения между эмпирическими
частотами
,
полученными в результате наблюдения,
и соответствующими теоретическими
частотами
,
рассчитанными, исходя из предположения
о законе распределения.
Теоретические
частоты
можно рассчитать по формуле
,
где
-
теоретическая вероятность, вычисленная
в предположении, что генеральная
совокупность имеет нормальный закон
распределения, а n
– объем выборочной совокупности.
Для
интервального ряда теоретическая
вероятность
вычисляется по формуле
,
где Ф(t)
– функция Лапласа, а
и
-
оценки параметров предполагаемого
нормального распределения.
Для дискретного
ряда теоретическая вероятность
вычисляется по формуле
,
где
;
-
дифференциальная функция нормированного
нормального распределения,
-
шаг.
Поскольку
теоретические частоты
и
эмпирические частоты
могут
не совпадать, встает вопрос о том,
насколько существенны расхождения
между ними. В качестве меры расхождения
между
и соответствующими
Пирсон употребил величину
,
имеющую распределение
(хи-квадрат) с k=S-r-1
степенями свободы. S
– число частичных интервалов в случае
интервального ряда и число различных
значений в случае дискретного ряда, r
– число параметров проверяемого
распределения. Так как для нормального
распределения r=2,
число степеней свободы k
= S-3.
Схема применения критерия Пирсона сводится к следующему:
1. Находится
наблюдаемое значение
2. Для выбранного
уровня значимости
по таблице
-
распределения находится критическое
значение
,
где k
= S-3
3. Если
,
то гипотеза
о том, что признак Х имеет нормальный
закон распределения отвергается. Если
же
,
то нет оснований отвергать гипотезу
,
по выборочным данным признак Х генеральной
совокупности имеет нормальный закон
распределения.
Замечание. Для применения критерия Пирсона необходимо выполнение следующих условий:
1. Выборка должна состоять не менее, чем из 50 элементов
2. В каждом интервале должно быть не менее 5 наблюдений. Если в каком – нибудь интервале число наблюдений меньше 5, имеет смысл объединить соседние интервалы, чтобы в объединенных интервалах число значений было не менее 5. В этом случае при вычислении числа степеней свободы в качестве величины S берется соответственно уменьшенное число интервалов.