 
        
        8028
.pdfМИНОБРНАУКИ РОССИИ Федеральное государственное бюджетное образовательное учреждение высшего образования
«Нижегородский государственный архитектурно-строительный университет»
Филатов Л.В.
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Учебно-методическое пособие
по подготовке к лекциям и практическим занятиям
для обучающихся по дисциплине «Математика» по направлению подготовки 08.03.01 Строительство
направленность (профиль) Автомобильные дороги, Производство и применение строительных материалов, изделий и конструкций, Водоснабжение и водоотведение, Теплогазоснабжение и вентиляция, Гидротехническое, геотехническое и энергетическое строительство, Организация инве- стиционно-строительной деятельности, Промышленное и гражданское строительство.
Нижний Новгород
2022
МИНОБРНАУКИ РОССИИ Федеральное государственное бюджетное образовательное учреждение высшего образования
«Нижегородский государственный архитектурно-строительный университет»
Филатов Л.В.
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Учебно-методическое пособие
по подготовке к лекциям и практическим занятиям
для обучающихся по дисциплине «Математика» по направлению подготовки 08.03.01 Строительство
направленность (профиль) Автомобильные дороги, Производство и применение строительных материалов, изделий и конструкций, Водоснабжение и водоотведение, Теплогазоснабжение и вентиляция, Гидротехническое, геотехническое и энергетическое строительство, Организация инве- стиционно-строительной деятельности, Промышленное и гражданское строительство.
Нижний Новгород ННГАСУ
2022
1
ББК: 22.172+22.172 УДК: 519.2 (076.5)
Филатов Л.В. Проверка статистических гипотез : учеб.- метод. пос. / Л.В. Филатов; Нижегородский государственный архитектурно - строительный университет. – Нижний Новгород: ННГАСУ, 2022. – 40 с. ил.– Текст: электронный
Рассматривается основные положения теории проверки статистических гипотез. Описываются алгоритмы построения критериев проверки гипотез о виде распределения случайных величин, о значении неизвестных параметров распределения, о значимости свойств выборочных совокупностей. Даются основные понятия и формулы, примеры решения задач, набор расчетных заданий и контрольных вопросов для самопроверки материала.
Пособие предназначено обучающимся в ННГАСУ для подготовки к лекционным и практи-
ческим занятиям по дисциплине «Математика» по направлению подготовки 08.03.01 Стро-
ительство направленность (профиль) Автомобильные дороги, Производство и применение строительных материалов, изделий и конструкций, Водоснабжение и водоотведение, Теплогазоснабжение и вентиляция, Гидротехническое, геотехническое и энергетическое строительство, Организация инвестиционно-строительной деятельности, Промышленное и гражданское строительство.
© Л.В. Филатов, 2022 © ННГАСУ, 2022.
2
1. Введение
Имея дело со случайными величинами в различных областях человеческой деятельности, часто приходится высказывать предположения о виде распределения случайной величины или о значениях ее параметров. Эти предположения,
называемые статистическими гипотезами, строятся с целью прогнозирования поведения случайной величины и принятия решений в условиях неопределенности.
Высказанная статистическая гипотеза должна быть проверена по результатам наблюдений (измерений) случайной величины, в результате чего гипотеза принима-
ется или отвергается с определенной степенью риска совершить ошибку.
Задачи проверки статистических гипотез, связанные с формулировкой и ана-
лизом критериев такой проверки, составляют предмет обширного раздела совре-
менной математической статистики и рассматриваются в настоящем методическом пособии.
2. Простые и сложные статистические гипотезы.
Статистическая гипотеза Н называется простой, если она однозначно опреде-
ляет закон распределения случайной величины Х, например, для непрерывных ве-
| личин в виде функции распределения Fх(x, ) | 
 | или функции плотности распределе- | ||||
| ния вероятности fх(x, ) c определенными значениями параметров . | При этом, ве- | |||||
| роятность попадания значений одномерной | случайной | величины | Х в интервал | |||
| [х1,х2] может быть вычислена по формулам: | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | x2 | 
 | 
 | 
 | d | 
 | 
| Р(х1<X< х2) = Fх(x2, ) - Fх(x1, ) = | 
 | f x (x, )dx ; | fх(x, ) = | 
 | Fх(x, ) | |
| 
 | 
 | |||||
| 
 | 
 | 
 | dx | |||
| 
 | x1 | 
 | 
 | |||
| 
 | 
 | 
 | 
 | 
 | 
 | |
Гипотеза является сложной, если в ней неизвестный закон распределения
предполагается принадлежащим к некоторому допустимому множеству распределе-
ний.
3
Пример простой статистической гипотезы Н1:
Длина ж/б перекрытия распределена по нормальному закону N(a, ) cо следу-
ющими параметрами: математическое ожидание а=600см, среднеквадратическое отклонение =0,75см.
Пример сложной статистической гипотезы Н2:
Толщина ж/б перекрытия распределена по нормальному закону N(a, ) cо сле-
дующими параметрами: математическое ожидание а=20см, среднеквадратическое отклонение <0,75см.
Ясно, что сложная гипотеза состоит из множества простых гипотез. Это мно-
жество (конечное или бесконечное) может быть описано изменением некоторого параметра h в определенных пределах. Так, в приведенном примере Н2={
Н1(а=20, h); 0<h<0,75}.
Статистическими гипотезами являются так же и некоторые макро утвержде-
ния, вытекающие из предположения о виде закона распределения случайной вели-
чины и имеющие определенное практическое значение. Так, например, утверждение
Н3 о том, что поступившая на предприятие большая партия продукции содержит недопустимый процент брака, основано на предполагаемом законе распределения количества брака в данной партии.
3. Проверка статистических гипотез.
Выдвинутая статистическая гипотеза Н должна быть проверена. Как и в лю-
бой другой науке, критерием ее проверки является опыт, т.е. наблюдение (измере-
ние) случайной величины. В математической статистике эти наблюдения представ-
ляются выборкой ХВ={xi, n} ={x1, x2, …… xn} объема n. Критерий проверки должен отвергать или принимать гипотезу по результатам наблюдения. В силу случайной природы наблюдаемых в выборке значений xi, в результате применения критерия возможны следующие четыре случайные события, их вероятности и совершаемые
при этом ошибки:
4
| 
 | Таблица 1 | 
 | |
| 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | Наличие | 
| Результат проверки гипотезы | Вероятность | 
 | 
 | 
| 
 | 
 | 
 | ошибки | 
| 
 | 
 | 
 | 
 | 
| Гипотеза Н отвергается, когда она верна | 
 | 
 | ошибка I-рода | 
| 
 | 
 | 
 | 
 | 
| Гипотеза Н принимается, когда она верна | 
 | 
 | нет ошибки | 
| 
 | 
 | 
 | 
 | 
| Гипотеза Н принимается, когда она не верна | 
 | 
 | ошибка II- | 
| 
 | 
 | 
 | рода | 
| 
 | 
 | 
 | 
 | 
| Гипотеза Н отвергается, когда она не верна | 
 | 
 | нет ошибки | 
| 
 | 
 | 
 | 
 | 
Из таблицы видно, что с вероятностью при проверке может быть совершена ошибка I-рода, когда отвергается верная гипотеза и с вероятностью ошибка II-
рода, когда принимается не верная гипотеза. Поэтому первым требованием к крите-
рию проверки является минимизация вероятности ошибок, однако здесь нужно от-
метить два существенных момента:
Во-первых, ошибки I и II рода могут иметь различную значимость с точки зрения их последствий. Так, например, для гипотезы Н ={Партия ж/б перекрытий аварийно опасна и не должна поставляться на стройки} ошибка I.рода приводит к поставке на стройку аварийно опасных изделий, что может повлечь человеческие жертвы. Ошибка же II рода здесь приводит к забраковыванию безопасной партии изделий, что влечет к экономическим потерям завода ЖБК. Ясно, что значимость ошибки I рода в приведенном примере выше, чем ошибки II рода, т.к. человеческие жертвы не сравнимы с любыми потерями и не допустимы. Принято считать, что ошибки I рода более значимы чем ошибки II рода, если это не так, то проверяемую гипотезу необходимо переформулировать соответствующим образом (например,
перейти к противоположной гипотезе).
Во-вторых, ошибки I и II рода находятся в некотором противоречии друг с другом, поскольку, если при построении критерия уменьшать вероятность одной из
5
них, то вероятность другой будет возрастать. Так, например, при использовании гипотетического критерия, отвергающего любую гипотезу, ошибки II рода совер-
шаться не будут ( =0, “ложь не пройдет”), но при этом всегда будем совершать ошибку I рода ( ” истина не установиться“).
Учитывая сказанное, при построении критерия проверки статистической ги-
потезы необходимо, сначала задаться допустимым уровнем риска совершить ошиб-
ку I рода, как наиболее значимую, а затем минимизировать ошибки II рода.
4. Построение критерия проверки гипотезы.
Пусть необходимо проверить простую гипотезу H0={X fх(x, )}, состоящую в предположении о виде функции плотности распределения случайной величины Х с
вполне определенными параметрами . Построим критерий, однозначно принима-
ющий или отвергающий проверяемую гипотезу по полученной в наблюдении за случайной величиной Х выборке ХВ={x1, x2, x3, …… xn} объема n. Помимо основной гипотезы H0 (“нулевой”) рассмотрим еще одну или несколько альтернативных гипо-
тез H1,H2,H3, …,Hm каждая из которых противоречит основной.
Критерий проверки гипотезы состоит из двух составляющих:
Во-первых в качестве критерия принимается некоторая случайная величина К,
с известными распределениями при условии справедливости основной и альтерна-
тивных гипотез fK(k Hj) j=0,1, ..m и значения которой можно вычислить по наблюдаемой выборке ХВ, т.е. kнабл= хi .
Во-вторых, строится решающее правило для критерия проверки, согласно ко-
торого гипотеза будет приниматься или отвергаться. Для этого, назовем критиче-
ской областью критерия те значения величины К, при которых гипотеза отвергает-
ся. Критическую область будем обозначать Ккр. Тогда решающее правило критерия проверки будет следующим:
| kнабл | Ккр | H0 отвергается (по наблюдаемой выборке), | 
| kнабл | Ккр | H0 принимается (нет оснований отвергать гипотезу) | 
6
Точки значения критерия К, где критическая область критерия проверки Ккр отделя-
ется от области принятия гипотезы Кпр, называются критическими точками крите-
рия kкр. Как построить критическую область критерия, или что равносильно, как найти критические точки критерия? Ниже рассмотрим ответ на этот вопрос.
Зададимся вероятностью ошибки I рода, как наиболее значимой. Исключить такую ошибку при проверке гипотезы невозможно ( ), но в вероятностных зада-
чах это не является трагедией. На практике обычно эту вероятность задают достаточно малой величиной 0,005 и называют уровнем значимости кри-
терия. Если из условия
| Р( k Ккр ) = | fK( k H0 ) dx = | 
| Kкр | 
 | 
можно определить критические точки kкр однозначно, то задача построения крити-
ческой области критерия решена. В противном случае, когда еще остается свобода выбора критических точек, рассмотрим влияние альтернативных гипотез. Посколь-
ку величина
fK( k Hj ) dx = 1 - j, j=1,..m
Kкр
есть вероятность правильного отбрасывания H0 при условии справедливости Hj, то ее называют мощностью критерия по отношению к альтернативной гипотезе Hj. По-
этому, при заданном уровне значимости , критическую область критерия нужно строить так, чтобы мощность критерия была максимальной, а именно:
(1 - j ) max , для наиболее мощного критерия (НМК) относительно гипо-
тезы Hj , максимизация проводится по параметрам сложной гипотезы Hj.
min (1 - j ) max, для равномерно наиболее мощного критерия (РНМК), в
случае наличия нескольких сложных гипотез.
Величина j есть вероятность принять неверную гипотезу H0 при условии справедливости альтернативной гипотезы Hj. На рисунке 1 приведена графическая интерпретация алгоритма построения критической области одномерного критерия.
7
 
Видим, что структура критической области зависит от наличия альтернативных ги-
потез и их расположения относительно основной гипотезы.
Рис. 1. Двухсторонняя критическая область критерия Ккр={ k>k2, k<k1} при наличии двух альтернативных гипотез Н1, Н2.
5. Примеры построения критериев проверки гипотез о значении параметров распределения нормальной случайной величины.
По данным выборки ХВ={хi, n} могут быть получены выборочное среднее Хср
и выборочный стандарт S:
| 
 | 1 | n | 
 | 1 | n | 
| Хср= | 
 | x j , | S = | 
 | ( X ср x j )2 . | 
| n | 
 | ||||
| 
 | j 1 | 
 | n 1 j 1 | ||
Эти величины являются случайными и по ним могут быть построены оценки мате-
матического ожидания а=М[X] и дисперсии D[X] наблюдаемой в выборке слу-
чайной величины Х. Так, точечные оценки:
а* =Хср; ( S2
8
 
являются несмещенными, состоятельными оценками характеристик наблюдаемой величины [1], однако об их точности и эффективности можно говорить лишь, ис-
следовав вероятностные свойства этих оценок.
Ясно, что точность оценки возрастает с увеличением объема выборки, но большие выборки часто неприемлемы на практике. Поэтому построение эффективных оце-
нок, обладающих требуемой точностью на малых выборках, является важнейшей задачей математической статистики.
Для проведения анализа вероятностных свойств оценок необходимо знать за-
кон распределения наблюдаемой величины Х, который в приложениях обычно не-
известен точно, но может быть предположен в виде гипотезы.
Пусть случайная величина Х распределена нормально по закону N(а, ) с не-
| известными параметрами а, | и наблюдается в выборке XB={xi, n} объема n. Нор- | |||||||
| мальный закон распределения N(а, ) задается | следующей функцией плотности | |||||||
| распределения вероятности: | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| fX(x)= | 
 | 1 | 
 | exp( | (х а)2 | ) ; | M[Х]=а, D[Х]= . | |
| 
 | 
 | 
 | 
 | 
 | ||||
| 
 | 
 | 
 | 2 | 
 | 
 | 2 2 | 
 | |
Ниже проверим ряд простых статистических гипотез об истинных значениях параметров нормальной случайной величины Х.
5.1. Проверим гипотезу о том, что истинная (гипотетическая) дисперсия слу-
чайной величины равна Проверяемая гипотеза Н0={ = }. В качестве критерия возьмем одномерную случайную величину К, имеющую распределение «хи-
квадрат» с n-1 степенями свободы:
| К=(n-1) S2/ , | fK( k H0 ) = 2(k,n-1), M[K]=(n-1), D[K]= 2(n-1). | 
Задаваясь уровнем значимости для проверяемой гипотезы Н0 будем строить критическую область Ккр в зависимости от вида единственной конкурирующей
(альтернативной) гипотезы H1 в следующих случаях:
Случай А: Н1={ > }. В этом случае при справедливости конкурирующей гипотезы ожидаем сдвиг наиболее вероятных значений критерия К в большую сто-
рону, поэтому критическая область критерия будет правосторонней.
9
