
- •Тема: Статистическая проверка гипотез
- •Понятие статистической гипотезы.
- •Гипотеза о значении математического ожидания нормально распределённой генеральной совокупности при известной дисперсии.
- •Гипотеза о значении математического ожидания нормально распределённой генеральной совокупности при неизвестной дисперсии.
- •Гипотеза о дисперсии нормально распределённой генеральной совокупности.
-
Гипотеза о значении математического ожидания нормально распределённой генеральной совокупности при неизвестной дисперсии.
Предположения те
же, что и в предыдущем пункте, но только
неизвестно. В этом случае в качестве
статистики используют случайную величину
,
(4.1)
которая, если верна
гипотеза
,
имеет
-распределение
Стьюдента с числом степеней свободы
,
где
– объём выборки.
Если альтернативная
гипотеза имеет вид
,
то используем левостороннюю критическую
область, которая удовлетворяет следующему
условию:
.
(4.2)
Если альтернативная
гипотеза имеет вид
,
то используем правостороннюю критическую
область:
.
(4.3)
И, наконец, при
альтернативной гипотезе
используем двустороннюю критическую
область:
(4.
4)
Перед вычислением
по формуле (4.1) значения статистики
нужно по выборке вычислить
и
.
Пример 4.1.
По выборке объёма
,
извлечённой из нормальной генеральной
совокупности, найдены выборочное среднее
и исправленное выборочное среднее
квадратическое отклонение
.
Требуется при уровне значимости
проверить нулевую гипотезу
при альтернативной гипотезе
.
Δ Найдём значение статистики по формуле (4.1)
.
По условию
альтернативная гипотеза имеет вид
,
поэтому критическая область –
двусторонняя.
По таблице
критических точек распределения
Стьюдента (см. таблицу 5), по уровню
значимости
и по числу степеней свободы
находим критическую точку
.
Поскольку значение
статистики
,
т.е. не попадает в критическую область,
то гипотезу
нет оснований отвергнуть. Другими
словами, выборочное среднее
незначительно отличается от гипотетического
генерального среднего
.
▲
-
Гипотеза о дисперсии нормально распределённой генеральной совокупности.
Предполагаем, что
генеральная совокупность имеет нормальное
распределение
,
где параметр
неизвестен. Требуется при уровне
значимости
проверить гипотезу
.
В качестве статистики используем
случайную величину
.
(5.1)
Если гипотеза
верна, то случайная величина
имеет
-распределение
Пирсона с числом степеней свободы
,
где
– объём выборки.
Критическая область
определяется в зависимости от
альтернативной гипотезы
по таблице
-распределения
(таблица 4).
Если альтернативная
гипотеза имеет вид
,
находим левостороннюю критическую
область исходя из условия
.
(5.2)
При альтернативной
гипотезе
находим правостороннюю критическую
область исходя из условия
.
(5.3)
При альтернативной
гипотезе
находим двустороннюю критическую
область согласно условию
.
(5.4)
Перед вычислением
по формуле (5.1) значения статистики
нужно вычислить по выборке
.
Замечание.
Если число степеней свободы
,
то критическую точку
можно найти из равенства Уилсона –
Гильферти:
,
(5.5)
где
находят, используя функцию Лапласа (см.
таблицу 3), из равенства (3.6).
Пример 5.1.
Из нормально распределённой генеральной
совокупности извлечена выборка объёма
и по ней найдена исправленная выборочная
дисперсия
.
Требуется при уровне значимости
проверить нулевую гипотезу
,
приняв в качестве альтернативной
гипотезы
.
Δ Найдём значение статистики по формуле (5.1):
.
По условию,
альтернативная гипотеза имеет вид
,
поэтому критическая область –
правосторонняя. По таблице 4, по уровню
значимости
и числу степеней свободы
находим критическую точку
.
Так как
,
т.е. не попадает в критическую область,
то гипотезу
нет оснований отвергнуть. Другими
словами, различие между исправленной
дисперсией
и гипотетической генеральной дисперсией
незначимо. ▲
Пример 5.2.
Партия изделий принимается, если
дисперсия контролируемого размера
значимо не превышает 0,2. Исправленная
выборочная дисперсия, найденная по
выборке объёма
,
оказалась равной
.
Можно ли принять партию при уровне
значимости
?
Δ Нулевая гипотеза
.
Альтернативная гипотеза
.
Найдём значение статистики по формуле (5.1):
.
Альтернативная
гипотеза имеет вид
,
следовательно, критическая область
правосторонняя. Поскольку в таблице 4
не содержится числа степеней свободы
,
найдём критическую точку приближённо
из равенства Уилсона – Гильферти (5.5).
Найдём предварительно
(учитывая, что по условию
)
из равенства (3.6)
.
По таблице функции
Лапласа (см. таблицу 3), используя линейную
интерполяцию, находим:
.
Подставив
,
в формулу Уилсона – Гильферти, получим
.
(Это приближение достаточно хорошее: в
более полных таблицах приведено значение
158,95).
Так как значение
статистики
,
т.е. попадает в критическую область,
нулевую гипотезу
отвергаем. Партию принять нельзя. ▲
-
Критерий согласия
(критерий Пирсона).
Критерий согласия – это критерий, с помощью которого проверяют гипотезу о том, что генеральная совокупность имеет распределение предполагаемого типа.
Имеется несколько
критериев согласия: хи-квадрат, Колмогорова
– Смирнова,
и др.
Критерий
является универсальным. Он применим
для проверки любого вида распределения.
Критерий
позволяет выполнить проверку гипотезы
о соответствии опытного закона
распределения предполагаемому не только
в случаях, когда последний известен
полностью, но и тогда, когда параметры
предполагаемого закона распределения
определяются на основании опытных
данных.
Пусть
– выборка объёма
наблюдений случайной величины
.
Проверяется гипотеза
утверждающая, что
имеет функцию распределения
.
Проверка гипотезы
при помощи критерия
осуществляется по следующей схеме.
1) По выборке
наблюдений находят оценки неизвестных
параметров предполагаемого закона
распределения случайной величины
.
2) Область возможных
значений случайной величины
разбивается на
интервалов
в случае, когда
– непрерывная с.в., или
групп, состоящих из отдельных значений,
для дискретной с.в.
.
3) Исходя из
предполагаемого закона распределения
с.в.
,
находят теоретическую вероятность
того, что значение
принадлежит интервалу
,
т.е.
,
,
при этом
,
,
где
– число элементов выборки, принадлежащих
интервалу
(эмпирическая частота попадания в
-й
интервал).
4) Вычисляют
выборочное значение статистики критерия
по формуле
.
(6.1)
Близость частот
к вероятности
свидетельствует в пользу основной
гипотезы
,
заметные различия отвергают гипотезу
.
5) Определяют число
степеней свободы распределения по
формуле
,
где
– число параметров предполагаемого
закона распределения, найденных опытным
путем.
6) Зная
число степеней свободы и уровень
значимости
критерия, по таблицам определяют
критическое значение
:
.
7) Гипотеза
согласуется с результатами наблюдений
на уровне значимости
,
если
.
Если же
,
то гипотеза
о виде функции распределения отклоняется,
т.е. используем только правостороннюю
критическую область.
Замечание.
Критерий
использует тот факт, что случайная
величина
,
,
имеет распределение, близкое к нормальному
.
Чтобы это утверждение было достаточно
точным, необходимо, чтобы для всех
интервалов выполнялось условие
,
т.е. в каждом интервале
должно быть не менее 5 значений величины
.
Если в некоторых интервалах условие не
выполняется, то их следует объединить
с соседними.
Пример 6.1. В результате испытания 200 элементов на длительность работы получено эмпирическое распределение, приведённое в таблице 6.1 (в первом столбце указаны интервалы времени в часах, во втором столбце – частоты, т.е. количество элементов, проработавших время в пределах соответствующего интервала).
Таблица 6.1
Границы
интервала
|
Частота
наблюдения
|
Границы
интервала
|
Частота
наблюдения
|
0 – 5 |
133 |
15 – 20 |
4 |
5 – 10 |
45 |
20 – 25 |
2 |
10 – 15 |
15 |
25 – 30 |
1 |
Требуется, при
уровне значимости
,
проверить гипотезу о том, что время
работы элементов распределено по
показательному закону.
Δ 1) – 2) Найдём среднее время работы всех элементов (в качестве среднего времени работы одного элемента примем середину интервала, которому принадлежит элемент):
.
Найдём оценку параметра предполагаемого показательного распределения:
.
Таким образом, функция плотности вероятности предполагаемого показательного распределения имеет вид
.
3) Найдём теоретические
вероятности
попадания случайной величины
в каждый из интервалов по формуле
.
Например, для первого интервала
.
Аналогично вычислим
вероятности попадания
в остальные интервалы:
;
;
;
;
.
Найдём теоретические частоты:
,
где
– вероятность попадания
в
-й
интервал.
Например, для первого интервала
.
Аналогично вычислим остальные теоретические частоты:
;
;
;
;
.
4) Сравним эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого составим расчётную таблицу 6.2, причём объединим малочисленные частоты (4+2+1=7) и соответствующие им теоретические частоты (6,30+2,32+0,84=9,46).
Таблица 6.2
|
|
|
|
|
|
1 |
133 |
126,42 |
6,58 |
43,2964 |
0,3425 |
2 |
45 |
46,52 |
–1,52 |
2,3104 |
0,0497 |
3 |
15 |
17,10 |
–2,10 |
4,4100 |
0,2579 |
4 |
7 |
9,46 |
–2,46 |
6,0516 |
0,6397 |
|
200 |
|
|
|
|
5) – 6) По таблице
критических точек распределения
(таблица 4), уровню значимости
и числу степеней свободы
(
– число интервалов,
– число параметров показательного
распределения) находим критическую
точку правосторонней критической
области
.
7) Так как
,
то гипотезу о распределении случайной
величины
по показательному закону нет оснований
отвергнуть. Другими словами, данные
наблюдений согласуются с этой гипотезой.
▲