Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1155

.pdf
Скачиваний:
8
Добавлен:
07.01.2021
Размер:
921.42 Кб
Скачать

Величина 1 PД – доверительная вероятность. При этой дове-

рительной вероятности доверительный интервал для математического

ожидания m задается пределами

x

t

 

 

;

x

t

 

 

.

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

Величина

x

t

 

t S

x

представляет случайную ошибку на-

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

блюдения.

3.4. Проверка статистических гипотез

Статистической гипотезой H называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Гипотезы о параметрах генеральной совокупности называются параметрическими, о распределениях – непараметрическими.

Любая гипотеза формулируется до опыта и проверяется на основе последующего эксперимента. Основная гипотеза H0 обычно высказывается в форме, отрицающей наличие каких-либо видимых отличий, поэтому гипотеза H0 называется нулевой. Одновременно формулируется альтернативная гипотеза H1.

Проверка гипотезы осуществляется на основе выявления согласованности эмпирических (экспериментальных) данных с гипотетическими (теоретическими). Если расхождение между сравниваемыми величинами не выходит за пределы случайных ошибок, гипотезу принимают. При этом не делается никаких заключений о правильности самой гипотезы, речь идет лишь о согласованности сравниваемых данных. Нулевая гипотеза отвергается тогда, когда по выборке получается результат, который при истинности выдвинутой нулевой гипотезы маловероятен. Границей невозможного или маловероятного обычно считают 0,05, или 0,01, или 0,001 и называют уровнем значимости.

Процедура проверки гипотезы производится при помощи статистического критерия – правила, определяющего условия, при котором проверяемую нулевую гипотезу следует либо принять, либо отклонить. Критерий представляет собой случайную функцию результатов наблюдения с известным законом распределения (t-, F-, 2 - критерий). В соответствии с характером распределения одни значения

43

критерия являются более вероятными, другие – менее. Таким образом, область возможных значений делится на две части. Одна называется областью принятия гипотезы, другая (где гипотеза должна быть отвергнута) – критической областью. Чтобы проверить гипотезу, необходимо вычислить критерий и посмотреть, в какую область попадает вычисленное значение.

Проверка статистических гипотез складывается из следующих этапов:

формулируется в виде статистической гипотезы задача исследования;

выбирается статистическая характеристика гипотезы;

выбираются нулевая H0и альтернативная H1гипотезы на осно-

ве анализа возможных ошибочных решений и их последствий;

выбирается приемлемый уровень значимости ;

выбирается критерий проверки гипотезы H0;

вычисляется фактическое значение статистического критерия;

определяется критическое значение статистического критерия по соответствующей таблице;

проверяется нулевая гипотеза на основе сравнения фактического и критического значений критерия, в зависимости от результатов проверки гипотеза либо отклоняется, либо не отклоняется.

При проверке гипотез по одному из критериев возможны два ошибочных решения:

неправильное отклонение нулевой гипотезы – ошибка первого

рода;

неправильное принятие нулевой гипотезы – ошибка второго

рода.

Возможные решения приведены в табл. 3.1. Вероятность ошибки первого рода равна уровню значимости . Вероятность не совершить ошибку второго рода 1 называют мощностью критерия. Обычно

задают и пытаются сделать возможно малым.

 

 

 

Таблица 3.1

 

Возможные выводы при проверке гипотез

 

 

 

Решение по критерию

Фактически

 

 

H0 верна

H0 не верна

H0

отклоняется

Ошибка первого рода

Правильное решение

H0

не отклоняется

Правильное решение

Ошибка второго рода

44

3.4.1. Проверка гипотезы о законе распределения

Гипотезы о распределениях заключаются в том, что выдвигается предположение о том, что распределение в генеральной совокупности подчиняется какому-то определенному закону. При планировании эксперимента важно, чтобы наблюдаемые значения физических величин подчинялись нормальному закону распределения. Поэтому нулевая гипотеза H0: результаты наблюдений подчиняются нормальному

закону распределения; альтернативная H1: результаты наблюдений не подчиняются нормальному закону распределения.

В качестве статистических характеристик гипотезы о законе распределения принимаются оценки параметров распределения. Предположим, что при выполнении n наблюдений одной и той же величины постоянная систематическая погрешность полностью исключена. Тогда результат i-го наблюдения xi xист i находится с некоторой

абсолютной случайной погрешностью i xi xист.

При нормальном законе распределения случайной погрешностиi за истинную величину xист m1 принимают ее оптимальную оцен-

ку, равную оценке математического ожидания (3.15).

Затем вычисляют абсолютную погрешность каждого из n наблюдений

i

xi

x

.

(3.20)

Далее находят оценку СКО наблюдений S , характеризующую точность метода измерений:

 

1

n

2

 

S

 

i 1 i .

(3.21)

n 1

Если число наблюдений n 20, строится интервальный вариационный ряд. При его построении в первой графе отдельные значения признака указываются в интервалах «от – до», во второй графе – численность единиц, входящих в интервал. Величина интервала определяется по формуле

i R m,

(3.22)

где R –размах варьирования признака, R xmax xmin ; m – число групп, которое приближенно определяется по формуле Стерджесса

m 1 3,32lgn.

(3.23)

45

Полученную по этой формуле величину округляют до целого большего числа. Нижнюю границу первого интервала определяют, вычитая из xmin половину последнего разряда.

Оценка математического ожидания в этом случае определяется по формуле

m

xj f j*

x

 

j 1

 

,

(3.24)

m

 

 

 

f

j*

 

 

 

j

 

 

 

где xj – середина интервала; f j* – частота попадания результатов на-

блюдения xi в заданный интервал; j – номер интервала. Оценка СКО

 

m

 

 

 

 

 

 

xj

x

2 f j*

 

S

j 1

 

 

.

(3.25)

 

m

*

 

 

f j

 

 

 

 

j 1

 

 

 

Выбирается приемлемый уровень значимости, обычно 0,05. Проверка гипотезы состоит в том, чтобы на основании сравнения

эмпирических (фактических) частот с предполагаемыми (теоретическими) сделать вывод о соответствии эмпирического распределения гипотетическому. Для проверки близости теоретического и эмпирического распределений используются специальные показатели, называемые критериями согласия. Наиболее распространенным является критерий Пирсона 2 , вычисляемый по формуле

2

 

f

j* f j

2

 

 

 

 

 

,

(3.26)

 

f j

 

 

j

 

 

 

где f j* – эмпирические частоты в интервале; f j – теоретические час-

тоты в интервале.

Если все эмпирические частоты равны соответствующим теоретическим частотам, то 2 равно нулю. Очевидно, что чем больше от-

личаются эмпирические и теоретические частоты, тем 2 больше; если расхождение несущественно, то 2 должно быть малым.

Теоретическая частота в данной группе вычисляется как произведение объема совокупности (числа наблюдений) на вероятность попадания в данный интервал. Теоретические частоты нормального распределения определяются по формуле

46

f j

 

 

n i

 

exp t2j

2 ,

(3.27)

S

 

 

 

 

2

 

 

 

 

 

 

 

где tj – нормированное отклонение

tj

 

xj

x

.

(3.28)

 

 

 

 

S

 

Величина p t 2 1exp t2 /2 – табличное значение (прил. 1), поэтому формулу (3.27) можно переписать в виде

f

j

 

n i

pt

j

.

(3.29)

S

 

 

 

 

 

При расчете критерия Пирсона необходимо соблюдать условия:

число наблюдений должно быть достаточно велико n 50 ;

теоретические частоты в интервале должны быть больше 5. Если теоретические частоты в некоторых интервалах меньше 5, то соседние интервалы объединяют.

Критическое значение Т2 определяется по таблице распределения Пирсона (прил. 2) в соответствии с числом степеней свободыd.f. и уровнем значимости .

Число степеней свободы рассчитывается так: если эмпирический ряд распределения имеет k категорий (число интервалов с учетом объединения), то k эмпирических частот f1*, f2*, , fk* должны быть

k

связаны следующим соотношением: fj* n. Если параметры теоре-

j 1

тического распределения известны, то только (k 1) частот могут принимать произвольные значения, а последняя частота может быть найдена из указанного соотношения. Поэтому говорят, что система из k частот благодаря наличию одной связи теряет одну степень свободы и имеет только (k 1) степеней свободы. Кроме того, если при нахождении теоретических частот p параметров теоретического распределения неизвестны, то они должны быть найдены по данным эмпирического ряда. Это накладывает на эмпирические частоты еще p связей, благодаря чему система теряет еще p степеней свободы. Таким образом, число свободно варьируемых частот (а значит, и число степеней свободы) становится равным

d.f. k p 1 .

(3.30)

Если 2 T2, то гипотеза H0 о нормальном законе распределения эмпирических данных принимается.

47

3.4.2. Пример проверки гипотезы о нормальном законе распределения экспериментальных данных

В табл. 3.2 приведены данные о затратах времени на производство единицы продукции. Установить, можно ли с вероятностью PД 0,95 считать закон распределения экспериментальных данных

нормальным.

Таблица 3.2

Затраты времени на производство единицы продукции

Номер

 

 

 

Операционное время, мин

 

 

 

изделия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1-10

9

9

11

9

9

11

9

7

9

6

11-20

9

6

9

11

9

7

9

7

10

7

21-30

9

10

6

10

8

6

9

8

8

8

31-40

8

7

8

7

9

8

9

11

9

9

41-50

8

10

9

8

10

8

8

9

11

9

Основная гипотеза H0: результаты наблюдений подчиняются

нормальному закону распределения.

Определим числовые оценки параметров нормального распределения x, S . Обобщим данные в виде вариационного ряда (табл. 3.3).

Размах R xmax xmin 11 6 5 (мин).

Число интервалов m 1 3,32lgn 1 3,32lg50 6.

Величина интервала i R m 5

6 0,8

мин. Примем i 1 мин.

Среднее значение определяем по формуле (3.24):

x

8,6 мин.

Оценку СКО вычисляем по формуле (3.25): S 1,3 мин.

 

 

 

Ряд эмпирического распределения

 

 

Таблица 3.3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервал

5,5 –

6,5 –

 

7,5 –

8,5 –

 

9,5 –

 

10,5 –

группировки

6,5

7,5

 

8,5

9,5

 

10,5

 

11,5

Середина

6

7

 

8

9

 

10

 

11

интервала xj

 

 

 

Частота f j*

4

6

 

11

19

 

5

 

5

 

 

 

 

 

 

 

 

 

 

 

48

Определяем теоретические частоты распределения (табл. 3.4) по

формуле (3.29):

n i

 

50 1

 

38,5; t

j

 

xj

8,6

;

f

j

38,5 pt

j

; величи-

S

1,3

 

 

1,3

 

 

 

 

 

 

 

 

 

 

ну ptj определяем по прил. 1.

Таблица 3.4

Вспомогательная таблица для расчета теоретических частот нормального распределения

Интервал

 

5,5 –

6,5 –

7,5 –

8,5 –

9,5 –

10,5 –

группировки

6,5

7,5

8,5

9,5

10,5

11,5

Середина

 

6

7

8

9

10

11

интервала xj

Нормированное

-2,00

-1,23

-0,46

0,31

1,08

1,85

отклонение tj

p tj

 

0,0540

0,1874

0,3588

0,3802

0,2227

0,0721

Частота

теоре-

2,08

7,21

13,81

14,64

8,57

2,78

тическая

f j

Частота

эмпи-

4

6

11

19

5

5

рическая

f j*

 

 

 

 

 

 

 

 

Так как для использования критерия Пирсона теоретическая частота должна быть больше 5, объединяем первый и второй и пятый и шестой интервалы (табл. 3.5).

Вариационный ряд с учетом объединения интервалов

Таблица 3.5

 

 

 

 

 

 

 

 

 

 

 

Интервал группировки

 

5,5 – 7,5

7,5 – 8,5

 

 

8,5 – 9,5

 

9,5 – 11,5

Частота теоретическая

f j

9,29

13,81

 

14,64

 

11,35

Частота эмпирическая

f j*

10

11

 

19

 

10

 

 

 

 

 

 

 

 

 

 

 

Рассчитываем 2 -критерий: 2

4 f

j* f

j

2

 

 

 

 

 

 

2,08.

 

 

fj

 

 

 

 

 

 

j 1

 

 

 

 

 

Определяем число степеней свободы по формуле (3.30): k 4 – число интервалов, оставшихся после объединения; p 2, т.к. среднее значение и СКО найдены по данным эмпирического ряда; d.f. 4 1 2 1.

49

Табличное значение критерия для d.f. 1 и уровня значимости

0,05; Т2 3,841. 2 T2. Следовательно, гипотеза о нормальном законе распределения эмпирических данных принимается.

3.4.3.Проверка параметрических гипотез

Кпараметрическим относятся гипотезы о числовых характеристиках закона распределения.

Основные гипотезы о средних величинах следующие:

гипотеза о равенстве математического ожидания некоторому числу при известной дисперсии или при неизвестной дисперсии;

гипотеза о равенстве средних значений нормально распределенных совокупностей при известных дисперсиях, при неизвестных равных дисперсиях, при неизвестных неравных дисперсиях.

Первая задача чаще всего решается при неизвестной дисперсии. Испытуемая гипотеза H0: m1 a. Проверку гипотезы проводят с по-

мощью t-критерия. При большом числе наблюдений критическое значение критерия определяют по таблице интеграла вероятностей (прил. 3), при малом числе наблюдений n 20 – по таблице распределения Стьюдента (прил. 4) для заданного уровня значимости и числа степеней свободы d.f. n 1.

Фактическое значение критерия представляет отношение

 

 

 

t

x

a

,

 

 

(3.31)

 

 

 

 

где S

 

 

 

 

S

x

 

 

 

 

 

 

 

x

– возможная ошибка выборочного среднего.

 

При малой выборке

 

 

 

 

S

 

 

 

 

 

S

x

 

 

 

 

,

(3.32)

 

 

 

 

 

 

 

 

при большой выборке

 

 

 

 

n 1

 

 

 

 

S

 

 

 

 

 

 

 

S

x

 

 

 

.

(3.33)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

Выборочное СКО S определяется по формулам (3.21) или (3.25) в зависимости от объема выборки.

Если t tT , гипотеза H0 принимается.

Гипотеза о равенстве средних выдвигается, когда необходимо определить, существенно ли расхождение между двумя выборочными

50

средними. Для проверки этой гипотезы определяют среднюю (стандартную) случайную ошибку разности двух выборочных средних S . Для двух независимых выборок она определяется по формуле

S

 

S2

S2

,

(3.34)

 

1

 

2

 

n2

 

 

n1

 

 

где S12 и S22 – выборочные дисперсии соответственно в первой и второй выборках.

S2

 

x

x1 2 f

; S2

 

x

x

2 2 f

.

(3.35)

1

 

n1 1

2

 

n2 1

 

 

 

 

 

 

Фактическое значение критерия

t

 

 

x1

x

2

 

 

.

(3.36)

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

Критическое значение tT определяют по таблице распределения Стьюдента для заданного уровня значимости и числа степеней свободы d.f. n1 n2 2. Если t tT , нулевая гипотеза принимается. Следовательно, можно считать, что математические ожидания в двух подгруппах одинаковы, эти подгруппы можно объединить в одну группу и характеризовать последнюю общим средним.

При проверке параметрических гипотез можно также выявить наличие грубых погрешностей (промахов) в экспериментальных данных. Если в полученной группе результатов наблюдений одно или два существенно отличаются от остальных, а наличия ошибки в снятии показаний, описки и других промахов не обнаружено, то необходимо проверить, не являются ли они грубыми погрешностями, подлежащими исключению. Решение этой задачи выполняется общими методами проверки статистических гипотез в предположении нормального распределения результатов наблюдений. Проверяемая гипотеза состоит в утверждении, что результат i-го наблюдения xi не содержит грубой погрешности, т.е. является одним из значений измеряемой величины. Пользуясь определенными статистическими критериями, пытаются опровергнуть выдвинутую гипотезу. Если это удается, то результат наблюдения рассматривают как грубую погрешность и его исключают.

Критерий оценки анормальности результатов наблюдений при неизвестном СКО. При исключении по этому критерию грубых погрешностей из результатов наблюдений проводят следующие операции:

51

результаты группы из n наблюдений упорядочивают по возрастанию x1 x2 ... xn. Выделяют предполагаемые промахи, обычно ими могут оказаться результаты x1 и xn;

вычисляют оценки математического ожидания x и СКО S . Значения x и S вычисляют без учета экстремальных значений xi ;

для предполагаемых промахов проводят расчет коэффициен-

тов:

t

 

 

x1

x

; t

n

 

 

xn

x

 

,

(3.37)

 

 

 

1

 

 

S

 

 

 

S

 

 

 

задаются уровнем значимости критерия ошибки . Очевидно, этот уровень должен быть достаточно малым, чтобы вероятность ошибки была невелика. По заданным параметрам , n находят критическое значение tT из таблиц для распределения Стьюдента (n<20) (прил. 4) либо нормального распределения (n>20) (см. прил. 3);

выполняют сравнение коэффициентов, определенных по формулам (3.37), с критическими значениями. Если выполняются условия t1 tТ и tn tТ , то результаты x1 и xnотносят к промахам и исключают из результатов наблюдений. Процедуру проверки повторяют для x2, xn 1 и т.д., пока все промахи не будут исключены из выборки.

Критерий «трех сигм». Данный критерий применяется для результатов измерений, распределенных по нормальному закону, одним из граничных параметров служит оценка СКО измерений S . По этому критерию считается, что результат, полученный с вероятностью0,003, маловероятен, и его можно считать промахом, если xi x 3S . Данный критерий достаточно хорошо работает при числе измерений n 20...50.

Вопросы для самоподготовки

1.Что называют функцией и плотностью распределения случайной величины?

2.Дайте определение математического ожидания и дисперсии случайной величины.

3.Основные законы распределения случайной величины, применяемые при планировании эксперимента. Числовые характеристики этих законов.

52

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]