
- •Тема 20 . Проверка статистических гипотез
- •1. Задачи статистической проверки гипотез
- •2. Статистическая гипотеза, статистический критерий
- •3. Проверка гипотезы об однородности двух или более
- •4. Проверка гипотез о законе распределения
- •5. Критерий согласия ( Критерия Пирсона)
- •6. Критерий Колмогорова
- •7. Критерий однородности Смирнова
- •8. Проверка гипотезы об однородности параметров распределений
- •8.1. Критерий Стьюдента (критерий)
- •8.2. Критерий Фишера (критерий)
- •Глава v1
- •Прикладные вероятностные теории
- •Тема 21. Основы теории информации
- •1. Энтропия как мера неопределённости
- •2. Характеристика (определение) количества информации
- •3. Основы теории измерений
- •4. Основы теории кодирования и передачи информации
- •4.1. Основные понятия, формирование экономичного кода алфавита
- •4.2. Определение характеристик канала передачи информации
- •5. Основы теории надежности
- •6. Определение количественных характеристик
8. Проверка гипотезы об однородности параметров распределений
8.1. Критерий Стьюдента (критерий)
Критерий Стьюдента (критерий)
предназначен для проверки гипотез (3) ,
т. е.
,
однородности математических ожиданий
в двух выборках нормально распределённой
случайной величины, имеющих одинаковую
(хотя и неизвестную) дисперсию
:
.
(11)
,
где
-
оценки математических ожиданий в
выборках объёмов
-
стандартное отклонение, вычисляемое
по формуле:
(12)
-
средняя дисперсия, которая вычисляется
по выборочным дисперсиям
и
по формуле:
.
В условиях справедливости гипотезы (3)
и при дополнительном условии однородности
дисперсий статистика
равенство(11) должна подчиняться
распределению Стьюдента с (
)
степенями свободы. Определим из таблицы
-
распределения критическое значение
для уровня значимости
,
и числа степеней свободы
.
Если окажется, что
вычисленное по формуле (11),то
гипотеза об однородности (3) отвергается.
Замечание.
Слишком большое значение статистики
может быть следствием как
неоднородности математических ожиданий
двух выборок, так и неоднородности
дисперсий. А это являться самостоятельной
задачей исследования.
Частным случаем такой задачи
является «задача о проверке гипотезы
относительно равенствах математического
ожидания нормально распределённой
случайной величины заданному значению».
Итак, имеем выборку
из нормальной генеральной совокупности
.
Рассмотрим различные варианты постановки
задач по проверке гипотез о равенстве
числового значения оценки математического
ожидания
заданной постоянной величине
.
Вариант 1.
при условии, что дисперсия генеральной
совокупности
известна.
Критическая статистика согласно формуле (11) имеет вид:
(13)
.
В условиях справедливости
гипотезы
статистика
подчиняется нормальному закону.
В качестве критического
значения
используется квантиль нормального
распределения
с уровнем значимости
если
при альтернативе
если
при альтернативе
если
при альтернативе
Здесь
- квантиль стандартного нормального
распределения с уровнем значимости
.
Вариант 2.
при условии, что дисперсия генеральной
совокупности
неизвестна. Критическая статистика
вычисляется по формуле
(14)
.
и распределена по закону
Стьюдента с
степенями свободы. Здесь
- выборочная оценка среднеквадратического
отклонения.
Правило принятия решения
- гипотеза
отвергается:
если
при альтернативе
если
при альтернативе
если
при альтернативе
Здесь
- 100 %- ная точка распределения Стьюдента
с
степенями свободы.
Пример 5 . В целях оценки воздействия окружающей среды на здоровье населения обследованы два административных района. Эти показатели указаны в таблице.
Первый район |
Второй район | ||
Населённый пункт |
Заболеваемость
|
Населённый пункт |
Заболеваемость
|
1 |
206 |
1 |
215 |
2 |
210 |
2 |
212 |
3 |
212 |
3 |
214 |
4 |
216 |
4 |
225 |
5 |
184 |
5 |
230 |
6 |
165 |
6 |
207 |
7 |
195 |
7 |
256 |
8 |
201 |
8 |
236 |
|
|
9 |
302 |
|
|
10 |
220 |
|
|
11 |
214 |
|
|
12 |
198 |
В первом районе с низким уровнем
техногенной нагрузки проверено восемь
крупных населённых пунктов, во втором
-двенадцатьнаселённых пунктов,
имеющем химические и металлургические
предприятия. По данным
обследования населённых пунктов
следует определить по уровню значимости
критерия
существенность различий этих районов
по уровню заболеваемости населения
злокачественными новообразованиями
(
-
количество заболеваний на 100 000 человек
населения).
Сформулируем статистическую гипотезу.
Факт влияния окружающей среды может
быть доказан отклонением гипотезы о
равенстве математических ожиданий двух
выборок
Решение.
Определим оценки математических ожиданий и дисперсий по обеим выборкам
По формуле (13) найдём среднюю дисперсию выборочных данных и СКО:
Рассчитываем наблюдаемое значение критерия Стьюдента (11):
При проверке
по таблице
- распределения определим критическое значение
Поскольку наблюдаемое значение критерия
превосходит критическое, то гипотезу
следует опровергнуть. Следовательно,
данные наблюдений действительно
подтверждают факт наличия влияния
окружающей среды на здоровья населения.
Пример 6. Для предприятий, торгующих продуктами питания, установлены показатели эффективности их деятельности: уровень рентабельности товарооборота равна 20 % , средняя оборачиваемость товарных запасов, составляет 12 дней. Более низкие показатели означают снижение эффективности конкурентоспособности предприятия. В целях оперативного контроля результатов коммерческой деятельности в одной из торговых фирм проведён анализ эффективности торговых операций за последние 10 месяцев и получены данные, указанные в таблице:
месяц |
Рентабельность, %
|
Продолжительность
товарооборота
|
1 |
14 |
19 |
2 |
12 |
15 |
3 |
16 |
19 |
4 |
14 |
1 |
5 |
15 |
24 |
6 |
18 |
12 |
7 |
22 |
10 |
8 |
20 |
15 |
9 |
13 |
18 |
10 |
9 |
20 |
Сформулируем статистическую гипотезу
относительно значения показателя
рентабельности. Эффективность коммерческой
деятельности будет удовлетворительной,
если уровень рентабельности будет
соответствовать нормативному показателю,
т.е. при справедливости гипотезы:
«
среднее арифметическое показателей
продолжительность товарооборота (
)
равна 20» , т.е.
.
Поскольку нарушение эффективности
коммерческой деятельности произойдёт
только в случае снижения показателя
рентабельности относительного
нормативного, примем в качестве
альтернативной гипотезы
Решение.
1. Определим среднее значение рентабельности по третьему столбцу:
2. По формуле (11) найдём значение критерия Стьюдента:
3. Найдём критическое значение критерия
по таблице
распределения
Стьюдента:
Наблюдаемое значение
,
(т.е.
),
следовательно, гипотеза
должна быть опровергнута, что
свидетельствует о нарушении эффективности
торговых операций в анализируемом
периоде.