Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Обработка данных / [Romanov_V.N.,_Komarov_V.V.]_Teoriya_izmereny._Ana(BookFi.org).pdf
Скачиваний:
66
Добавлен:
13.02.2016
Размер:
1.53 Mб
Скачать

могут выходить за допустимые пределы для какого-то одного закона распределения, либо оценки разных показателей могут соответствовать разным теоретическим законам распределения. Поэтому приходится выдвигать несколько гипотез и проводить сравнение с несколькими теоретическими распределениями. При использовании ЭВМ это может быть сделано достаточно быстро. Рассмотрим обе группы методов более подробно.

2.6.1. Аналитические методы

Кним относятся:

метод основанный на определении характеристик формы распределения: коэффициента асимметрии и коэффициента эксцесса;

метод основанный на определении коэффициента формы распределения;

метод основанный на определении энтропийного коэффициента и контрэксцесса.

Прежде чем использовать эти методы следует проверить наличие в

выборке грубых ошибок (выбросов) и исключить их. Ясно, что признание того или иного измерения выбросом зависит от вида распределения. Для распределений, близких к нормальному, для исключения промахов используется правило “трех сигм” при доверительной вероятности P=0,9973. В случае, когда вид распределения заранее не известен, из выборки исключаются такие значения xi, для которых выполняются

неравенства x i

< x r

 

или

x i > x r+ ; x r+, x r

границы выбросов,

определяемые выражениями:

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

x rm

 

 

 

A

 

 

 

 

 

 

(2.137)

= x n m S n 1 +

2

 

1

 

 

 

 

 

 

 

 

n

 

 

 

 

 

где x n

– выборочное среднее; Sn – выборочное СКО; n – выборочный

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

S

4

 

 

 

 

 

 

 

 

 

 

контрэксцесс:

 

2

; μ

 

– выборочный четвертый центральный

=

n

 

 

 

 

n

 

 

μ4n

 

4n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

n

момент

эмпирического

распределения:

μ4n =

∑(x i x n )4 ; A

 

 

 

 

 

 

 

 

 

 

 

 

 

n i=1

коэффициент, значение которого выбирается в зависимости от доверительной вероятности в диапазоне от 0,85 до 1,30 (рекомендуется выбирать максимальное значение A, соответствующее вероятности

P=0,9973).

2.6.1.1. Определение выборочного коэффициента асимметрии γ an и коэффициента эксцесса γ эn

γ an =

 

μ 3n

,

 

 

 

(2.138)

 

 

 

 

 

 

где μ 3n

 

S n3

 

 

 

 

– выборочный третий центральный

момент эмпирического

 

 

 

 

 

 

 

1

n

 

распределения: μ 3n =

∑(x i x n )3 .

 

 

 

 

 

μ 4n

 

 

 

n i=1

 

γ n =

 

3

,

 

 

(2.139)

 

 

 

 

 

 

 

S n4

 

 

 

 

2.6.1.2. Определение коэффициента формы распределение α

Коэффициент формы определяется из уравнения:

 

 

 

 

 

1

 

 

 

 

5

 

 

 

 

 

α Γ 1

+

 

 

 

 

 

 

Γ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эn =

 

 

α

 

α

,

 

 

 

(2.140)

 

Γ

2

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α

 

 

 

 

 

= μ4n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Эn – выборочный эксцесс: Э

n

Sn4

; Γ(x ) – гамма-функция от x,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

определяемая по таблицам [23].

Уравнение (2.140) решается приближенно численными методами. Ниже в табл. 8 приведены значения α для различных значений эксцесса, полученные из (2.140).

Таблица 8

Значения α по (2.140)

α

0,5

0,55

0,73

0,77

0,83

0,9

1,0

1,5

2

6

Эп

25

20

10

9

8

7

6

4

3

2

2.6.1.3. Определение энтропийного коэффициента

K n =

эn

;

эn =

d n

,

 

 

1

 

m

 

S n

 

 

nj lg nj

 

 

 

n

 

2 10 j =1

(2.141)

где d – ширина интервала группирования данных; m – число интервалов группирования; nj – число значений в каждом интервале (см. ниже).

Полученные выборочные значения величин γ an , γ эn , αn, Kn и n

сравниваются с допустимыми значениями этих же величин для различных теоретических распределений (см. табл. 9) и по их согласованию делается предварительное заключение о законе распределения. Для грубого отбора бывает достаточно использовать два значения γ an и γ эn , однако такой

подход требует осторожности, особенно при n<200.

При сравнении следует иметь в виду, что из-за ошибок в данных может наблюдаться расхождение выборочных значений критериев и допустимых. Рекомендуется принять, что расхождение незначимо, если выполняется следующее соотношение:

Z n Z дon (2K3)SZ ,

где Zn, Zдоп – выборочное и допустимое значение величины Z соответственно; SZ – выборочное СКО величины Z.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6(n 1)

 

1

 

В частности, для γ an : S

 

 

 

2

;

γ an

=

 

 

 

 

 

 

 

 

 

+ 3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n +1)(n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

24n(n 2)(n 3)

 

 

 

 

 

 

для γ эn : Sγ

 

 

2

;

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n + 3)(n + 5)

 

 

 

 

эn

 

(n +1)2

 

 

 

 

 

для αn: Sαn

= α n

 

 

Sγ

эn

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

γ эn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для n: S n

=

1

n

 

Sγ ýn

 

;

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

γ ýn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

1

 

 

 

 

 

 

 

 

 

для Kn: S K n

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

= K n

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

1

 

 

 

 

 

 

 

 

 

 

 

Полученное предварительное заключение о виде закона распределения рассматривается как гипотеза (их может быть и несколько). Чтобы принять окончательное решение с определенной статистической достоверностью необходимо гипотезу проверить по одному из критериев согласия (см. ниже).

Таблица 9

Допустимые значения показателей формы для различных распределений [13,20]

Распределение

 

Допустимые значения показателей

 

γ a

γ э

α

 

 

K

Нормальное

0

0

2

0,56

2,07

Треугольное

0

–0,6

5

0,65

2,02

Трапецеидальн

0

0…–1,2

2…10

0,58…0,74

1,7…2,07

ое

 

 

 

0,75

 

Равномерное

0

–1,2

10

1,73

Симметричное

 

 

 

 

 

экспоненциаль

 

 

 

 

 

ное

0

0,75…22

0,5…1,5

0,2…0,52

1,35…2,02

островершинно

 

 

 

 

 

е

 

 

 

 

 

При использовании аналитических методов наибольшую трудность представляет необходимость определения выборочных значений параметров распределения, принятого в качестве гипотезы, при которых достигается наибольшее соответствие между теоретическим и эмпирическим распределениями. Эта задача решается методом моментов. Он заключается в том, что для произвольного распределения значения параметров определяются приравниванием теоретических значений моментов их выборочным оценкам:

 

 

 

 

 

1

n

 

α1(первый момент)= xp(x) dx =

x i ;

 

 

 

−∞

 

 

 

 

 

n i=1

 

1

 

 

n

 

 

α2(второй момент)=

x2 p(x)dx =

 

xi2

;

 

n

 

 

−∞

 

 

i=1

 

 

 

1

 

 

n

 

 

α3(третий момент)=

x3 p(x)dx =

 

xi3

и т. д.

n

 

−∞

 

i=1

 

 

Число уравнений берется равным числу определяемых параметров. Полученная система уравнений решается, и находятся неизвестные значения параметров распределения. Например, если эмпирическое распределение мы хотим описать функцией нормального распределения, то необходимо определить два параметра m и σ. В этом случае в качестве оценок для m и σ выбираем соответственно выборочные значения среднего и СКО. Аналогично определяют параметры распределения и в других случаях. Рассмотрим пример. Пусть в качестве гипотезы выбрано прямоугольное (равномерное) распределение. Оно содержит два неизвестных параметра m и a (m – центр распределения; a – полуинтервал). Составляем систему двух уравнений: