Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистическая обработка экспериментальных данных

.pdf
Скачиваний:
0
Добавлен:
29.11.2025
Размер:
3.31 Mб
Скачать

 

 

 

,

D[X ]= s2

. В результате мы получим

следует брать M [X ]= X

n

 

 

 

n

 

систему двух уравнений с двумя неизвестными для оценки параметров a и σ по результатам выборки, откуда находим:

 

 

 

 

 

 

 

 

 

 

 

 

a = ln

 

X

n2

, σ2 = ln

 

sn2

+1

(естественно, если мы имеем кон-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

 

2

 

 

 

X n

+ sn

 

 

X n

 

 

кретную реализацию выборки, то получим конкретную оценку этих параметров aвыб и σвыб ).

Логнормальное распределение возникает при изучении моделей дробления частиц, моделей роста и т.д. А.Н. Колмогоров показал, что логарифмически нормальному закону подчинены размеры частиц при дроблении.

3.3. УСЕЧЕННЫЕ НОРМАЛЬНЫЕ РАСПРЕДЕЛЕНИЯ

Случайная величина Х непрерывного типа имеет усеченное сле-

ва нормальное распределение с параметрами a \, σ > 0 и

τ (0,1) , если ее плотность вероятностей имеет вид

0, x < x

f (x) = σ(11−τ) 0ϕ(xσa), x x0 ,

 

x0

x

0

a

 

где значение

определяется из соотношения τ = Φ

 

 

 

 

σ

 

 

 

 

 

принципе, можно задавать значение x0 , а параметр τ находить из

указанного соотношения, здесь и далее в этом пункте мы используем обозначения: ϕ(x) – малая функция Лапласа, Φ(x) – большая

функция Лапласа). Параметр τ называется степенью усечения.

 

 

Рис. 3.5. График плотности усеченного

Рис. 3.6. График интегральной

слева нормального распределения

функции распределения

60

Функция распределения имеет вид

0, x < x0

 

 

 

F(x) = Φ(

xa

)−τ

.

σ

 

 

, x x0

 

1−τ

 

Графики этих функций приведены на Рис. 3.5 и 3.6.

Известно, что математическое ожидание и дисперсия усеченного

слева

нормального

распределения вычисляются

по формулам

M [X

]=a2 f (x0 ) ,

D[X ]2 f (x0 )(x0 M [X ])2

(здесь f(x) –

плотность распределения). Согласно методу моментов (см. п.п. 1.4.2

– 1.4.4) в качестве оценок этих параметров следует брать M [X ]= X n , D[X ]= sn2 . Считая заданной степень усечения τ, мы получимсистему трех уравнений с тремя неизвестными для оценки параметров a, σ и x0 порезультатам выборки (ниже обозначено γ = Φ1(τ) )

X

n

= a

ϕ(γ)

 

 

 

 

 

 

 

 

(

1ϕ(γτ)

 

(

 

 

 

 

2

 

2

 

 

ϕ(γ)

 

n

 

 

+

1 − τ

 

γ −

1

− τ))

.

s

= σ 1

 

 

 

 

x0 = a +σ γ

Ясно, что из второго уравнения мы легко находим оценку для па-

раметра σ, затем из первого – оценку для параметра a, после этого вычисляем x0 . Значение γ можно найти, используя таблицу при-

ложения 2.

Случайная величина Х непрерывного типа имеет усеченное

справа нормальное распределение с параметрами

a \, σ > 0 и

τ (0,1),

если

 

ее

 

плотность вероятностей

имеет

вид:

0, x > x

 

 

 

 

 

 

f (x) = 1

ϕ(x0a), x x0

, где значение x0 определяется из

соот-

 

στ

 

σ

 

 

 

 

 

 

 

 

 

 

x

0

a

 

 

x0 , а степень

ношения τ = Φ

 

 

 

(можно задавать значение

 

σ

 

 

 

 

 

 

 

 

усечения τ находить из указанного соотношения). Функция рас-

1, x > x

пределения имеет вид: F(x) = 1τΦ(xσ0a), x x0 . Ниже приведены

61

графики плотности и функции распределения усеченного справа нормального распределения.

 

 

Рис. 3.7. График плотности усеченного

Рис. 3.8. График интегральной

справа нормального распределения

функции распределения

Известно, что математическое ожидание и дисперсия усеченного справа нормального распределения вычисляются по формулам:

M [X ]= a −σ2 f (x0 ) , D[X ]2 f (x0 )(M [X ]x0 )2 (здесь f(x) –

плотность распределения). Аналогично, как и для усеченного слева нормального распределения (считая заданной степень усечения

τ), мы получим систему трех уравнений с тремя неизвестными для оценки параметров a, σ и x0 по результатам выборки

X n = a −σ ϕ(τγ)

sn2 = σ2 (1 ϕ(τγ) (γ + ϕ(τγ))),xo = a +σ γ

где значение γ = Φ1(τ) можно найти из таблиц.

3.4. РАСПРЕДЕЛЕНИЕ ПУАССОНА

Случайная величина Х дискретного типа имеет распределение Пуассона с параметрам λ > 0 , если она принимает целые значе-

ния 0, 1, 2, 3, ... с вероятностями P(X = k) = λk e−λ

, k = 0,1, 2, 3, ...

k!

 

напомним, что по определению 0!= 1). Известно, что ее математическое ожидание и дисперсия равны параметру распределения:

62

λ = M [X ]= D[X ]. Поэтому, согласно методу моментов (см. п. 1.4.2), в качестве оценки этого параметра следует брать λ = X n (т.е. для конкретной реализации выборки λ ≈ X nвыб ).

Рис. 3.9. Значения вероятностей P(X = k) для различных значений λ

При λ >9 распределение Пуассона может быть аппроксимировано нормальным распределением со средним λ и дисперсией λ

(известно, что при λ → ∞ случайная величина X λλ , где X – пу-

ассоновская случайная величина с параметром λ, имеет в пределе стандартное нормальное распределение N(0,1)). Т.о., при доста-

точно больших λ можно использовать приближенную формулу

P(X = k) 1λ ϕ(k λλ),

где ϕ(x) – малая функция Лапласа.

Распределение Пуассона играет важную роль в ряде вопросов физики, теории связи, теории надежности, теории массового обслуживания и т.д., словом, всюду, где идет речь о распределении числа X(t) некоторых случайных событий (радиоактивных распадов, телефонных вызовов, отказов оборудования, несчастных случаев и т.п.), происходящих в течение фиксированного интервала времени t

P( X (t) = k )= (λ t)k e−λt . k!

Здесь параметр λ играет роль среднего числа (плотности) событий в единицу времени.

63

3.5. РАВНОМЕРНОЕ РАСПРЕДЕЛЕНИЕ

Случайная величина Х непрерывного типа имеет равномерное распределение на отрезке [a, b], a < b, если ее плотность вероятности задается формулой

1

, x [a,b]

 

 

 

.

 

f (x) = b a

 

0, x [a,b]

 

 

 

 

Функция распределения этой случайной величины равна

0, x < a

F(x) = bx aa , x [a,b].

1, x > b

 

 

 

 

Рис. 3.10. График плотности

Рис. 3.11. График интегральной

 

равномерного распределения

функции распределения

Математическое ожидание и дисперсия равномерно распределенной на отрезке [a, b] случайной величины Х вычисляются по формулам

M [X ]= a +b , D[X ]= (b a)2 .

2

12

Далее, согласно методу моментов (см. п.п. 1.4.2–1.4.4) в качестве оценок этих параметров следует брать: M [X ]= X n , D[X ]= sn2 . В

итоге мы имеем систему двух уравнений с двумя неизвестными для оценки границ отрезка по результатам выборки, откуда нахо-

дим: b = X n + 3 sn , a = X n 3 sn (естественно, если мы имеем

конкретную реализацию выборки, то получим конкретную оценку

границ aвыб и bвыб ).

ЗАМЕЧАНИЕ. Метод наибольшего правдоподобия дает сле-

64

дующие оценки границ отрезка: a = min{X1, X 2, ..., X n}, b = max{X1, X 2, ..., X n}, т.е. a и b –соответственно, минимальный и максимальный элементы выборки {X1, X 2, ..., X n} .

Равномерное распределение возникает при распространении идеи «равномерности» на непрерывный случай. Равномерное распределение имеют случайные величины, характеризующие ошибки измерений при помощи инструмента с круглыми делениями, когда значение округляется до ближайшего целого. Например, равномерное распределение имеют ошибки указания времени часами со скачущей стрелкой.

3.6. ПОКАЗАТЕЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Случайная величина Х непрерывного типа, принимающая только положительные значения, имеет показательное (или экспонен-

циальное) распределение с параметром λ > 0 , если ее плотность задается формулой

={0, x < 0

f (x) λ e−λx, x 0 .

Функция распределения этой случайной величины равна

={0, x < 0

F(x) 1e−λx, x 0 .

 

 

 

 

Рис. 3.12. График плотности

Рис. 3.13. График интегральной

показательного распределения

функции распределения

Математическое ожидание и дисперсия этой случайной величины равны, соответственно,

M [X ]= λ1 , D[X ]= λ12 .

65

Поэтому, согласно методу моментов (см. п. 1.4.2), в качестве оценки параметра λ следует братьλ = X1 (для конкретной реализации

n

выборки λ ≈

 

 

1

).

 

 

 

X

n выб

 

 

 

 

 

 

Укажем две области применения статистических методов, в которых показательное распределение играет базовую роль.

К первой из них относятся задачи типа «времени жизни». Понимать этот термин следует достаточно широко. В медикобиологических исследованиях под ним может подразумеваться продолжительность жизни больных при клинических исследованиях, в технике – продолжительность безотказной работы устройств, в психологии – время, затраченное испытуемым на выполнение тестовых задач и т.д.

Второй областью активного использования показательного распределения являются задачи массового обслуживания. Здесь речь может идти об интервалах времени между вызовами «скорой помощи», телефонными звонками или обращениями клиентов и т.д. Длина интервала времени между появлениями последовательных событий имеет показательное распределение.

Показательное распределение среди всех других выделяется, как иногда говорят, отсутствием «памяти», т.е. отсутствием последействия. Это означает, что для изделия, прослужившего время t, вероятность прослужить дополнительное время s совпадает с вероятностью прослужить то же время s для нового (только начавшего работу) изделия. То есть, как бы исключается износ и старение. Поэтому в статистических моделях срока службы, если мы хотим учесть старение, приходится привлекать различного рода обобщения показательного распределения.

3.7. РАСПРЕДЕЛЕНИЕ ЛАПЛАСА

Случайная величина Х непрерывного типа имеет распреде-

ление Лапласа с параметрами

a \ и

σ > 0 , если ее плотность

задается формулой

 

 

 

 

 

 

 

 

 

f (x) =

 

1

e

 

xa

 

 

2

.

 

 

 

 

 

σ

 

σ

2

 

 

 

 

 

 

 

 

Ее функция распределения равна

66

1 e

σ

, x a

 

(xa) 2

 

F(x) = 2

1 e

(xa) 2

.

1

σ

, x a

 

2

 

 

 

 

 

 

Рис. 3.14. График плотности

Рис. 3.15. График интегральной

распределения Лапласа

функции распределения

Математическое ожидание случайной величины Х, имеющей распределение Лапласа, и ее дисперсия вычисляются по форму-

лам: M [X ]= a , D[X ]2 . Поэтому, согласно методу моментов (см. п.п. 1.4.2 – 1.4.4), в качестве оценок этих параметров следует брать: a = X n , σ2 = sn2 (естественно, если мы имеем конкретную

реализацию выборки, то должны положить параметры a и σ2 равными выборочным значениям статистик X n выб и sn2 выб ).

Распределение Лапласа было впервые введено П.Лапласом и часто называется “первым законом распределения” в отличие от “второго закона распределения Лапласа”, как иногда называют нормальное распределение. Распределение Лапласа называют также двусторонним показательным распределением.

3.8. РАСПРЕДЕЛЕНИЕ ВЕЙБУЛЛА

Случайная величина Х непрерывного типа имеет распределение

Вейбулла с параметрами a \,

b > 0 и n `,

если ее плотность

имеет вид

 

 

 

 

 

 

0, x < a

 

 

 

 

 

 

 

 

 

 

xa

n

 

f (x) =

n 1

(

) , x a

.

n (

xa

)

e

 

b

 

 

 

 

 

b b

 

 

 

 

 

 

Функция распределения этой случайной величины равна

67

0, x < a

 

 

 

 

 

 

 

 

.

F(x) =

e(

xa

)

n

1

b

 

, x a

 

 

 

 

 

 

Ниже приведены графики этих функций (случай n = 2).

Заметим, что в частном случае при n = 1, а = 0 распределение Вейбулла совпадает с уже известным нам показательным распределением.

 

 

 

Рис. 3.16. График плотности

Рис. 3.17. График интегральной

распределения Вейбулла

функции распределения

Математическое ожидание и дисперсия данной случайной величины Х вычисляются по формулам:

M [X ]= a +b Γ(1+1n), D[X ]= b2 (Γ(1 + n2)−Γ2 (1+ n2)),

где Γ(x) – гамма-функция, которая для x > 0 определяется равен-

ством Γ(x) = t x1 et dt . Ниже приведена таблица ее значений, не-

o

обходимых для работы.

n

1

2

3

4

5

6

7

8

9

10

Γ(1+1n)

1

0,8862

0,8930

0,9064

0,9182

0,9277

0,9395

0,9417

0,9470

0,9514

Γ(1+n2)

2

1

0,9028

0,8862

0,8873

0,8930

0,8997

0,9064

0,9126

0,9182

Согласно методу моментов (см. п.п. 1.4.2 – 1.4.4) для оценки параметров распределения (при заданном n) мы имеем систему

68

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

уравнений

X k

= a +b Γ(1+n)

 

n))

, откуда получаем:

 

k

( (

 

n)

 

(

 

 

 

 

 

 

 

 

s2

= b2 Γ 1+

2

 

−Γ2

1+

1

 

 

 

 

 

 

 

 

sk2

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b =

Γ(1+n2)−Γ2 (1+1n)

, a = X k b Γ(1+n).

 

Заметим,

что при одних и тех же значениях выборочного

среднего X k и выборочной исправленной дисперсии sk2 , с ростом

значения параметра n увеличивается скошенность влево графиков плотности (если параметры a и b найдены по формулам, указанным выше).

Рис. 3.18. Плотности распределения Вейбулла для различных n

Впервые данное распределение было использовано В.Вейбуллом для аппроксимации экспериментальных данных о прочности стали на разрыв при усталостных испытаниях. Оно широко используется для описания закономерностей отказов шарикоподшипников, вакуумных приборов, элементов электроники, при исследовании на прочность различных строительных и дорожных материалов.

3.9. РАСПРЕДЕЛЕНИЕ ПАРЕТО

Случайная величина Х непрерывного типа имеет распределение Парето с параметрами α > 2 и x0 > 0 , если ее плотность задается

формулой

0, x < x

 

 

f (x) = α xα

 

0

.

 

 

0

, x x0

 

x

α+1

 

 

 

 

 

 

Функция распределения этой случайной величины равна

69