- •1. Выборка. Основные характеристики.
- •1. 1. Способы первичной обработки выборки
- •1. 2. Полигон частот. Выборочная функция распределения и гистограмма
- •1.3. Статистические оценки параметров
- •1. Доверительный интервал для оценки математического ожидания
- •2. Доверительный интервал для оценки математического ожидания
- •3. Доверительные интервалы для оценки среднего квадратического
- •4. Интервальное оценивание генеральной доли (вероятности события).
- •2. Элементы теории корреляции
- •2.1. Линейная корреляция
- •2.2. Определение параметров функциональной зависимости
- •3. Статистическая проверка гипотез
- •3.1. Основные понятия.
- •3.2. Критерий для проверки гипотезы
- •3.3. Сравнение двух вероятностей
- •3.4. Критерий для проверки гипотезы о математическом ожидании.
- •3.5. Сравнение двух средних генеральных совокупностей
- •3.6. Критерий для проверки гипотезы о сравнении двух дисперсий.
- •3.7. Приближенный метод проверки нормальности распределения,
- •3.8.Проверка гипотезы о генеральной доле
- •3.9. Проверка гипотезы о значимости выборочного
- •3.10. Критерий Пирсона для проверки гипотезы о виде закона распределения случайной величины. Критерий Колмогорова.
- •Критерий Пирсона.
- •3.11. Проверка гипотезы о равенстве нулю генерального
- •4. Применение в математической статистике
3.3. Сравнение двух вероятностей
биномиальных распределений
Пусть известны результаты двух серий независимых испытаний: в первой серии проведено п1 опытов, и событие А появилось т1 раз; во второй серии из п2 опытов событие А появилось т2 раз. Обозначим неизвестную вероятность появления события А в одном опыте первой серии через р1, а во второй серии – через р2. Требуется проверить при уровне значимости α нулевую гипотезу о равенстве этих вероятностей: Но: р1 = р2.
В качестве критерия выбирается нормированная нормально распределенная случайная величина
.
Наблюдаемое значение критерия вычисляется по формуле:
.
Построение критической области:
а) при конкурирующей гипотезе Н1: р1 ≠ р2 uкр определяется из равенства , и двусторонняя критическая область задается неравенством |U| > uкр.
б) при конкурирующей гипотезе Н1: р1 > р2 uкр для правосторонней критической области находится из условия , и вид критической области: U > uкр.
в) при конкурирующей гипотезе Но: р1 < р2 левосторонняя критическая область имеет вид U < – uкр, где uкр находится по формуле из пункта б).
Пример. В серии из 20 независимых испытаний событие А появилось 8 раз, в серии из 15 испытаний – 7 раз. При уровне значимости α = 0,05 проверяется нулевая гипотеза Но: р1 = р2 при конкурирующей гипотезе Но: р1 < р2.
Критическая область – левосторонняя, следовательно, икр = 1,645, и критическая область имеет вид U < - 1,645. Вычислим инабл = Uнабл > – uкр, следовательно, гипотеза принимается, и можно считать, что вероятность события А в обеих сериях испытаний одинакова.
◄▬▬■
3.4. Критерий для проверки гипотезы о математическом ожидании.
Пусть генеральная совокупность Х имеет нормальное распределение, и требуется проверить предположение о том, что ее математическое ожидание равно некоторому числу а0. Рассмотрим две возможности.
1) Известна дисперсия σ2 генеральной совокупности. Тогда по выборке объема п найдем выборочное среднее и проверим нулевую гипотезу Н0: М(Х) = а0. Учитывая, что выборочное среднее является несмещенной оценкой М(Х), то есть М() = М(Х), можно записать нулевую гипотезу так: М() = а0. Для ее проверки выберем критерий
. (3)
Это случайная величина, имеющая нормальное распределение, причем, если нулевая гипотеза справедлива, то М(U) = 0, σ(U) = 1.
Выберем критическую область в зависимости от вида конкурирующей гипотезы:
- если Н1: М() ≠ а0, то икр: , критическая область двусторонняя, , и, если |Uнабл| < uкр, то нулевая гипотеза принимается; если |Uнабл| > uкр, то нулевая гипотеза отвергается.
- если Н1: М() > а0, то икр: , критическая область правосторонняя, и, если Uнабл < uкр, то нулевая гипотеза принимается; если Uнабл > uкр, то нулевая гипотеза отвергается.
- если Н1: М() < а0, то икр: , критическая область левосторонняя, и, если Uнабл > - uкр, то нулевая гипотеза принимается; если Uнабл < - uкр, то нулевая гипотеза отвергается.
Итак, для проверки гипотезы о генеральном среднем, имеем
Гипотеза |
H0: a = a0 |
|
Предположение |
Генеральная совокупность нормальна; параметр известен |
Генеральная совокупность нормальна; параметр неизвестен |
Оценки по выборке |
||
Статистика K |
||
Распределение статистики K |
Стандартное нормальное N(0; 1) |
Распределение Стьюдента T(n – 1) |
Эти же статистики используются, если распределение генеральной совокупности неизвестно (при n > 30 используется статистика с нормальным распределением, для с распределением Стьюдента).
Пример. Техническая норма предусматривает в среднем 40с на выполнение определенной технологической операции на конвейере по производству часов. От работниц поступили жалобы, что они в действительности затрачивают на эту операцию больше времени. Для проверки жалобы проведены хронометрические измерения времени выполнения операции у 36 работниц, и получено среднее время выполнения этой операции с. Можно ли по имеющимся данным на уровне значимости отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если известно, что среднее квадратическое отклонение генеральной совокупности с?
Сформулируем основную и альтернативную гипотезы.
– неизвестное генеральное среднее равно заданному значению (время выполнения технологической операции соответствует норме).
– время выполнения технологической операции больше нормы.
По условию задачи , значит, воспользуемся статистикой . Ее наблюдаемое значение равно: .
Так как альтернативная гипотеза правосторонняя, то и критическая область тоже правосторонняя , по таблице функции Лапласа Ккр = 2,33.
Получили, что наблюдаемое значение , т.е. попадает в критическую область, следовательно, на данном уровне значимости основная гипотеза отвергается в пользу альтернативной.
Уровень значимости характеризует надежность нашего утверждения: более чем с 99% надежностью можно утверждать, что среднее время выполнения технологической операции превышает норму. Следовательно, жалобы работниц обоснованы.
Ответ. Можно утверждать, что среднее время выполнения технологической операции превышает норму. ◄
2) Дисперсия генеральной совокупности неизвестна. В этом случае выберем в качестве критерия случайную величину
, (4)
где S – исправленное среднее квадратическое отклонение. Такая случайная величина имеет распределение Стьюдента с k = n – 1 степенями свободы. Рассмотрим те же, что и в предыдущем случае, конкурирующие гипотезы и соответствующие им критические области. Предварительно вычислим наблюдаемое значение критерия:
. (5)
- если Н1: М() ≠ а0, то критическая точка tдвуст.кр. находится по таблице критических точек распределения Стьюдента по известным α и k = n – 1.
Если | Tнабл | < tдвуст.кр., то нулевая гипотеза принимается.
Если | Tнабл | > tдвуст.кр., то нулевая гипотеза отвергается.
- если Н1: М() > а0, то по соответствующей таблице находят tправост.кр.(α, k) – критическую точку правосторонней критической области. Нулевая гипотеза принимается, если Tнабл < tправост.кр..
- при конкурирующей гипотезе Н1: М() < а0 критическая область является левосторонней, и нулевая гипотеза принимается при условии Tнабл > - tправост.кр.. Если Tнабл < - tправост.кр.., нулевую гипотезу отвергают.
Итак для проверки гипотеза о генеральной дисперсии, имеем
Гипотезы |
||
Предположение |
Генеральная совокупность нормальна; параметр a известен |
Генеральная совокупность нормальна; параметр a неизвестен |
Оценки по выборке |
||
Статистика K |
||
Распределение статистики K |
«хи-квадрат» |
«хи-квадрат» |
Пример. Точность работы станка-автомата проверяется по дисперсии контролируемого размера деталей, которая не должна превышать . По выборке из 25 случайно отобранных деталей рассчитаны оценки генерального среднего и генеральной дисперсии, при этом . На уровне значимости 0,05 проверить, обеспечивает ли станок требуемую точность.
Решение. Сформулируем основную и альтернативную гипотезы:
– станок обеспечивает требуемую точность.
– точность не обеспечивается.
По условию задачи n = 25 < 30, = 0,05. Так как генеральное среднее неизвестно (оценивается по выборке), то будем использовать статистику K= из последней колонки. Ее наблюдаемое значение
Критическая область правосторонняя, ее границу Kкр определим по таблице распределения «хи-квадрат»: . , т.е. наблюдаемое значение попадает в критическую область. Значит, основную гипотезу нужно отвергнуть в пользу альтернативной.
Ответ. Станок не обеспечивает требуемую точность и требует наладки.◄