Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Анализ СД на ПК

.pdf
Скачиваний:
28
Добавлен:
22.02.2016
Размер:
1.18 Mб
Скачать

которая при n → ∞ независимо от вида предполагаемого распределения стремится к распределению χ2 с ν = k r 1 степенями свободы (здесь k – число разрядов разбиения, r – число параметров теоретического распределения, оцениваемых по выборке).

Легко заметить, что при незначительных отклонениях значений mi от npi значение критерия χ2 будет близким к нулю. И наоборот, большое значение критерия χ2 свидетельствует о существенном отклонении значений mi и npi.

а) mi

nhi

 

 

 

 

С1

С2

С3

Сk–1 Сk Сk+1

x

б)

mi

 

 

 

 

в)

mi

 

 

 

 

 

nhi

 

 

 

 

 

nhi

 

 

 

 

 

С1

С2

С2

Сk–1 Сk

Сk+1 x

 

С1

С2

С3

Сk–1 Сk

Сk+1 x

Рисунок 1 – Примеры гистограмм относительных частот

Необходимыми условиями применения критерия χ2 являются достаточно большой объем выборки (n 30) и отсутствие в теоретическом распределении разрядов с небольшим (npi < 5) числом наблюдений. Для обеспечения последнего условия интервалы, для которых npi < 5, необходимо объединить с соседними. На хвостах распределения допускается значение npi 1.

4 Алгоритм применения критерия χ2 для проверки гипотезы о виде закона распределения исследуемой случайной величины

1 Строится статистический закон распределения случайной величины.

2 Выбирается уровень значимости α.

3 Формулируется гипотеза о виде закона распределения исследуемой случайной величины.

4 Вычисляются теоретические вероятности pi попадания значений случайной величины Х в рассматриваемые разряды разбиения: pi = P(Ci X < Ci+1 ) = F(Ci+1 ) F(Ci ) , ( i = 1, 2,..., k ), где F(x) – гипотетическая функция распределения случайной величины X.

30

Замечание – Если изучается непрерывная случайная величина, то при вычислении значений pi необходимо изменить границы первого и последнего частичных

интервалов разбиения таким образом, чтобы учесть все возможные значения, которые может принять случайная величина предполагаемого класса. В зависимости от конкретного вида проверяемой гипотезы границы частичных интервалов необходимо изменить следующим образом:

Вид закона распределения

Первый интервал

Последний интервал

разбиения

разбиения

 

 

 

 

Равномерный

[aˆ; C2 )

[Ck ; bˆ)

 

 

 

Экспоненциальный

[0; C2 )

[Ck ; )

 

 

 

Нормальный

(−∞; C2 )

[Ck ; )

 

 

 

Для того чтобы

избежать ошибок при вычислении вероятностей

pi = P(Ci X < Ci+1 )

непрерывной случайной величины удобно воспользо-

ваться расчетными таблицами 3–5.

Таблица 3 – Вычисление вероятностей

pi равномерно распределенной случай-

ной величины

 

 

 

 

 

 

 

 

 

C

i

P

=

Ci+1 Ci

 

 

 

 

 

 

 

i

 

 

 

 

bˆ aˆ

 

 

 

 

 

 

 

 

ˆ

P1 =

 

C2 C1

 

 

 

 

 

 

C1 = a

 

bˆ aˆ

 

 

 

 

 

 

 

C

2

P

=

 

C3 C2

 

 

 

 

2

 

 

 

 

bˆ aˆ

 

 

 

 

 

 

 

C

3

P =

C4 C3

 

 

 

3

 

 

 

 

bˆ aˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ck+1 = bˆ

 

 

 

 

 

–––

 

 

 

Pi =1

 

 

 

i

 

 

 

 

 

31

Таблица 4 – Вычисление

вероятностей

 

pi

 

показательно

распределенной

 

 

 

 

 

 

случайной величины

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ci

 

 

 

 

 

 

 

 

 

 

 

 

 

Zi = e−λCi

 

 

 

 

Pi = Zi Zi+1

 

 

 

 

 

 

C = 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

P = Z

 

Z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Z1 = e

−λC1

 

 

 

 

1

2

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

P

= Z

 

Z

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

Z2 = e

−λC2

 

 

 

 

2

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

C

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

P = Z

 

Z

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

Z3 = e

−λC3

 

 

 

 

3

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ck+1 = ∞

 

 

 

 

 

 

 

 

 

Z

 

 

 

 

 

 

ˆ

 

 

 

 

 

–––

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k+1

= e−λ ∞ = 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pi

= 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

Таблица 5 – Вычисление

вероятностей

 

pi

 

случайной величины,

 

имеющей

 

 

 

 

 

 

нормальное распределение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ci

 

 

 

 

 

Zi

=

 

 

Ci mˆ

 

 

 

 

 

 

Ф(Zi )

Pi = Ф(Zi+1) Ф(Zi )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C = −∞

 

 

 

Z

1

=

 

C1 mˆ

 

= −∞

 

Ф(Z

1

) = Ф(−∞) = −0,5

P = Ф(Z

2

) Ф(Z

1

)

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

σˆ

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

2

 

 

 

 

 

 

 

Z

2

 

=

 

C2 mˆ

 

 

 

 

Ф(Z

2

) = ... *

P

= Ф(Z

3

) Ф(Z

2

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σˆ

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C

3

 

 

 

 

 

 

 

Z

1

 

=

C3 mˆ

 

 

 

 

 

Ф(Z

3

) = ...*

P

= Ф(Z

3

) Ф(Z

2

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σˆ

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ck+1 = +∞

Z

k+1

=

 

Ck+1 mˆ

= +∞

 

Ф(Zk+1 ) = Ф(+∞) = 0,5

 

 

 

–––

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pi = 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

* Ф(Z1) , Ф(Z2 ) , Ф(Z3) , …, Ф(Zk+1) вычисляются по таблице значений функции

 

 

 

 

 

 

 

 

 

1

x

 

t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Φ(x) =

 

e

2 dt (приложение Г).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5 Определяются значения теоретических частот npi (i = 1, 2,…, k). При необходимости для обеспечения условия npi 5 объединяются несколько соседних разрядов разбиения.

6 Вычисляется выборочное значение критерия χ2 по формуле (1).

32

7 По таблице критических точек распределения χ2 определяется критическое значение χα2 ,ν , соответствующее заданному уровню значимости α и

числу степеней свободы ν = k r– 1.

Если расчётное значение критерия попадает в критическую область, т. е. χˆ 2 > χα2 ,ν , то проверяемая гипотеза отвергается (при этом вероятность отклонения верной нулевой гипотезы равна α).

В случаях, когда наблюденное значение χˆ 2 не превышает критического

χˆ 2 ≤ χα2 ,ν , считают, что выдвинутая гипотеза не противоречит опытным

данным. Подчеркнем, что полученный результат свидетельствует лишь о приемлемом согласовании проверяемой гипотезы с имеющимися выборочными данными и в общем случае не является доказательством истинности этой гипотезы.

Пример 1 На основании выборочных данных, приведённых в примере 1 лабораторной работы № 1, подобрать закон распределения случайной величины X, характеризующей число отказов оборудования, произошедших в течение рабочей смены. Уровень значимости α принять равным 0,05.

Решение. После проведения первичной обработки полученных данных (см. пример 1 лабораторной работы № 1), опираясь на сведения о механизме формирования значений исследуемой случайной величины (поток отказов оборудования обычно обладает свойствами простейшего потока), учитывая вид построенной столбцовой диаграммы и значения оценок числовых харак-

теристик Mˆ [X ] = 2, Dˆ[X ] = 1,92 , то есть Mˆ [X ] Dˆ[X ], выдвигаем гипотезу

о том, что изучаемая случайная величина подчиняется закону распределения Пуассона:

 

 

 

ai

 

 

a

____

H

0

: P(X = i) =

 

 

e

 

, i = 1, ;

i !

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ai

 

 

a

____

H

a

: P(X = i)

 

 

e

 

, i = 1, .

i !

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для проверки этой гипотезы с помощью критерия χ2 выполним следующие действия.

Вычислим оценку параметра a распределения Пуассона: aˆ = Mˆ [X ] = 2 . Вычислим вероятности наблюденных значений изучаемой случайной

величины:

p = P(X = i) =

ai

ea (i = 0, 1, 2,…, 6, …);

 

i

i

!

 

 

 

33

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

6

a

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pi

 

= P(X > 6) = 1pi

= 1

 

ea

(i = 7);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=0

 

 

i=0

i!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(X = 0) =

 

20

 

e

2

= e

2

= 0,1353 ;

P(X = 1) =

 

21

e

2

= 2e

2

 

= 0,27067 ;

0!

 

 

 

 

 

1!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(X = 2) =

22

 

e

2

=

2e

2

= 0,27067

;

 

P(X = 3) =

23

 

e

2

=

4

e

2

= 0,1804 ;

 

2!

 

 

 

 

 

 

 

3!

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(X = 4) =

 

2

4

 

e

2

=

 

2

 

e

2

= 0,0902

;

P(X = 5) =

25

 

e

2

=

 

4

 

e

2

= 0,036 ;

 

4!

 

 

3

 

 

 

5!

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(X = 6) = 26 e2 = 4 e2 = 0,012 ; 6! 45

P(X > 6) = 1(0,1353+ 0,27067 + 0,27067 + 0,1804 + 0,0902 + 0,036 + 0,012 =

= 1 – 0,9948 = 0,0052. Заполним расчётную таблицу:

~

0

1

2

3

4

5

6

>6

x

mi

4

19

12

6

7

1

1

0

pi

0,1353

0,27067

0,27067

0,1804

0,0902

0,036

0,012

0,0052

npi

6,765

13,5335

13,5335

9,02

4,51

1,8

0,6

0,26

Учитывая, что теоретические частоты наблюденных значений, находящихся в трех последних столбцах таблицы, не превышают трех единиц, при вычислении значения критерия χ2 эти разряды объединим в один:

 

 

6

(mi

npi )

2

 

 

(4

6,765)

2

 

 

(19 13,5335)

2

 

(12 13,5335)

2

 

χˆ 2

=

 

=

 

+

 

+

 

+

 

 

i=1

np

i

 

 

 

 

 

6,765

 

 

 

 

13,5335

 

13,5335

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

(6 9,02)

2

+

 

(7 4,51)2

 

+

(2 2,66)2

= 6,062.

 

 

 

 

 

9,02

 

4,51

 

 

 

2,66

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По таблицам квантилей распределения χ2 определим критическое значе-

ние χα2

,ν , соответствующее α = 0,05, ν = k r – 1 = 6 – 1 – 1 = 4: χ02,05;4 = 9,488.

Поскольку

выборочное

 

значение

 

критерия

 

меньше критического

χˆ 2 ≤ χα2

,ν , можно сделать вывод о том, что гипотеза не противоречит экспе-

34

риментальным данным; поэтому нет оснований для отклонения проверяемой гипотезы.

Пример 2 На основании опытных данных, приведённых в примере 2 лабораторной работы № 1, подобрать закон распределения непрерывной случайной величины X, характеризующей время безотказной работы оборудования между двумя последовательными переналадками. Уровень значимости

αпринять равным 0,05.

Ре ш е н и е . Используя результаты первичной обработки выборочных данных (вид полученной гистограммы и значения оценок числовых характе-

ристик: Mˆ [X ] = 8,98174 ≈ σˆ[X ] = 8,34 ), а также учитывая сведения о физи-

ческом смысле полученных значений, выдвигаем гипотезу о том, что случайная величина X распределена по экспоненциальному закону:

H0 : f (x) = λe−λx , λ > 0, x 0,

Ha : f (x) ≠ λe−λx , λ > 0, x 0 .

Проверим согласование сформулированной гипотезы H0 с эксперимен-

тальными данными с помощью критерия χ2.

Вычислим оценку параметра экспоненциального закона распределения:

ˆ

1

 

1

 

λ =

 

=

 

0,1113 .

ˆ

8,98174

 

M[X ]

 

 

При вычислении вероятностей pi = P(Ci X < Ci+1) изменим границы первого и последнего интервалов разбиения в соответствии с замечанием, приведенным на странице 34.

Ci

Zi = e

0,1113 Ci

Pi = Zi Zi+1

 

0

 

1

0,2828

 

 

 

2,987

0,7172

0,3124

 

 

 

8,127

0,4047

0,1763

 

 

 

13,267

0,2284

0,0995

 

 

 

18,407

0,1289

0,0562

 

 

 

23,547

0,0727

0,0317

 

 

 

28,687

0,0410

0,0179

 

 

 

33,827

0,0232

0,0232

 

 

 

 

 

0

–––

 

 

 

Pi = 1

 

 

 

i

35

Определим значения теоретических частот и занесём их в расчётную таблицу:

[Ci; Ci+1)

[0; 2,987)

[2,987;

[8,127;

[13,267;

[18,407;

[23,547;

[28,687;

[33,827; ∞)

8,127)

13,267)

18,407)

23,547)

28,687)

33,827)

 

 

 

 

 

 

 

 

 

mi

14

16

9

4

3

2

1

1

pi

0,2828

0,3124

0,1763

0,0995

0,0562

0,0317

0,0179

0,0232

 

 

 

 

 

 

 

 

 

npi

14,140

15,620

8,815

4,975

2,810

1,585

0,895

1,160

Поскольку значения npi, соответствующие четырем последним интервалам разбиения, не превышают пяти единиц, объединим эти интервалы в один и для вычисления значения критерия χ2 составим следующую расчётную таблицу:

[Ci; Ci+1)

 

[0; 2,987)

[2,987; 8,127)

 

[8,127; 13,267)

[13,267; 18,407 )

 

[18,407; ∞)

mi

 

14

16

 

 

 

9

 

 

 

4

 

 

 

7

 

pi

 

0,2828

0,3124

 

 

0,1763

 

0,0995

 

 

0,1290

npi

 

14,140

15,620

 

 

8,815

 

 

4,975

 

 

6,450

Вычислим значение критерия χ2:

 

 

 

 

 

 

 

 

χ2

=

(14 14,140)2

+

(16 15,620)2

 

+

(9 8,815)2

+

(4 4,975)2

+

 

 

14,140

 

 

 

15,620

 

 

 

8,815

 

 

4,975

 

 

 

 

 

+

(7 6,450)2

= 0,252.

 

 

 

 

 

 

 

 

 

 

6,450

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Критическое значение критерия, соответствующее значениям α = 0,05 и ν = k r 1= 5 11= 3, определим с помощью приложения В:

χα2 ,ν = χ02,05;3 = 7,82 .

Поскольку χ2 < χα2 ,ν , можно сделать вывод о том, что проверяемая ги-

потеза об экспоненциальном законе распределения изучаемой случайной величины Х не противоречит экспериментальным данным и нет основания для отклонения нулевой гипотезы.

ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ

1 Получить выборку значений исследуемой случайной величины X с указанным значением уровня значимости α и записать её на диск (см. приложение А, п. 2).

36

2 Произвести первичную обработку полученных статистических данных. 3 Выдвинуть гипотезу о виде закона распределения изучаемой случай-

ной величины.

4 Проверить согласование сформулированной гипотезы с имеющимися выборочными данными (ручной расчёт):

вычислить оценки параметров предполагаемого закона распределе-

ния;

если рассматривается дискретная случайная величина, то вычислить

вероятности всех возможных значений случайной величины

= ( = ~ ) . Если рассматривается непрерывная случайная величина, то pi P X xi

вычислить вероятности попадания значений случайной величины в i-й интервал pi = P(Ci X < Ci+1) , i = 1, 2, …, k;

определить значения теоретических частот npi, i = 1, 2, …, k;

вычислить выборочное значение критерия χ2;

сравнить выборочное значение критерия с критическим значением

χα2 ,ν и сделать вывод.

5 Проверить согласование выдвинутой гипотезы с имеющимися экспериментальными данными с помощью ППП:

вычислить выборочное значение критерия χ2 (приложение А, п. 9);

построить совместное графическое изображение статистического и предполагаемого теоретического распределений изучаемой случайной величины (см. приложение А, п. 9).

6 Сделать вывод о законе распределения вероятностей изучаемой случайной величины.

КОНТРОЛЬНЫЕ ВОПРОСЫ

1 Что такое непараметрическая гипотеза?

2 Что такое нулевая, альтернативная гипотезы?

3 Из каких соображений выдвигается гипотеза о виде закона распределения случайной величины?

4 Что такое статистический критерий?

5 Какие ошибки могут быть совершены при статистической проверке гипотез? 6 Что такое уровень значимости статистического критерия?

7 Что называется статистическим критерием значимости?

8 По какой формуле вычисляется критерий χ2?

9 Сформулируйте алгоритм применения критерия Пирсона.

10Как найти критическое значение критерия χ2 (α, ν) ?

11Как вычислить число степеней свободы ν ?

37

Лабораторная работа № 4

СТАТИСТИЧЕСКАЯ ПРОВЕРКА ПАРАМЕТРИЧЕСКИХ ГИПОТЕЗ

Цель работы: изучить основные понятия теории статистической проверки гипотез и проверки параметрических гипотез.

Задание: по заданным выборкам провести статистическую проверку:

гипотез о равенстве математического ожидания некоторому фиксированному значению;

гипотезы о равенстве математических ожиданий двух генеральных совокупностей.

ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ

1 Основные понятия

На практике часто решаются задачи сравнения технологических процессов по различным параметрам: производительности, экономичности, точности достижения определенной технической характеристики и т. д. На языке математической статистики такие задачи формулируются как задачи сравнения или статистической проверки гипотез относительно параметров распределения. Рассмотрим, например, случайную величину X – время пребывания вагона на сортировочной станции. Пусть с. в. X имеет функцию распределения F(x, θ), где θ – параметр распределения. Предположим, что с целью уменьшения времени простоя вагонов на станции введены усовершенствования в технологический процесс обработки составов. Если мы возьмем одну выборку наблюденных значений с. в. X, полученную до внесения изменений в технологический процесс, а другую – после изменений, и вычислим

ˆ

ˆ

параметра θ распределения F(x, θ), то они,

две точечные оценки θ1

и θ2

очевидно, не будут равны между собой. Спрашивается, связано ли это с изменениями, внесенными в технологический процесс, либо разница в значениях оценок обусловлена случайными факторами?

Статистическая гипотеза называется непараметрической, если в ней сформулировано предположение о виде закона распределения исследуемой случайной величины.

Статистическая гипотеза называется параметрической, если в ней сформулированы предположения относительно значений параметров распределения.

Суждения относительно истинности (ложности) статистических гипотез формулируются на основании выборки объема n. Наряду с выдвинутой гипотезой будем рассматривать одну или несколько альтернативных (конкурирующих) гипотез.

38

Нулевой гипотезой называют выдвинутую гипотезу и обозначают H0 .

Обычно нулевые гипотезы утверждают, что различия между сравниваемыми величинами (параметрами или функциями распределения) отсутствуют, а наблюдаемые отклонения обусловлены случайными колебаниями выборки.

Альтернативной называется гипотеза, конкурирующая с нулевой гипотезой в том смысле, что если отвергается нулевая гипотеза, то принимается альтернативная. Ее обозначают Ha .

Пусть для решения задачи сравнения из нормальной N(a, σ) генеральной совокупности извлечена выборка {x1, x2 ,..., xn} объема n . Приведем примеры нулевых и альтернативных параметрических гипотез (таблица 1).

Таблица 1 – Примеры нулевых и альтернативных параметрических гипотез

Нулевые

 

Альтернативные

 

 

 

 

H0 :

a = a0

Ha :

a a0 , или a < a0 , или a > a0

 

 

 

 

H0 :

σ = σ0

Ha :

σ ≠ σ0 , или σ < σ0 , или σ > σ0

 

 

 

 

Статистическим критерием называется случайная величина R , с помощью которой принимается решение о принятии либо отклонении нулевой гипотезы. Для проверки статистических гипотез по критериям значимости необходимо знать условный закон распределения построенной случайной величины в предположении выполнения нулевой гипотезы.

При проверке статистических гипотез по выборочным данным всегда существует возможность принятия ложного решения. Это объясняется тем, что объем выборки конечен, и поэтому нельзя точно определить ни вид функции распределения, ни значения параметров.

Ошибкой первого рода называется ошибка отклонения верной нулевой гипотезы H0 .

Уровнем значимости α статистического критерия называется вероятность совершения ошибки первого рода.

Ошибкой второго рода называется принятие ложной нулевой гипотезы H0. Вероятность совершения ошибки второго рода принято обозначать буквой β.

Мощностью M статистического критерия R называется вероятность несовершения ошибки второго рода, т. е. M = 1 – β.

Будем рассматривать только один вид статистических критериев – статистические критерии значимости. Это значит, что будет заранее фиксироваться вероятность совершения ошибки первого рода (уровень значимости α). На фиксированном уровне значимости мы можем принять только одно из двух решений: «отклонить проверяемую нулевую гипотезу» или «результаты выборки не дают основания для отклонения нулевой гипотезы».

39