Скачиваний:
22
Добавлен:
20.05.2014
Размер:
142.44 Кб
Скачать

Лекция 2

Нормальное распределение и распределения, связанные с нормальным.

Нормальное распределение N(a, σ2).

Случайная величина X имеет нормальное распределение N(a, σ2) с параметрами a, σ, если ее плотность распределения равна

f(u) =

1

 

e

(u−a)2

 

 

2

 

 

2πσ

 

Функцию распределения этой случайной величины будем в дальнейшем обозна- чать

Φa,σ(x) = P (X < x).

Функцию распределения случайной величины, имеющей стандартное нормальное распределение (a = 0, σ = 1) будем обозначать Φ(u).1 Легко показать, что

 

a,σ

 

 

σ

Φ

 

(u) = Φ

 

u − a

.

 

 

 

Для нормального распределения

 

 

 

 

EX = mo = me = a, DX = σ2, A = 0, E = 0.

1. Логнормальное распределение.

Случайная величина X имеет логнормальное распределение LogNorm(a, σ), с параметрами a, σ, если P (X > 0) = 1 и случайная величина Y = ln X имеет нормальное распределение с параметрами a, σ.

Важнейшее свойство логнормального распределения: произведение независимых логнормально распределенных случайных величин также имеет логнормальное распределение. Имеет место аналог центральной предельной теоремы: распределение произведения n независимых случайных величин с положительными значениями при некоторых общих условиях стремится при n → ∞ к ло-

гнормальному распределению.

Найдем плотность лoгнормального распределения. Для этого сначала полу- чим функцию распределения случайной величины, имеющей логнормальное рас-

пределение. Для любого u

 

 

F

 

(u) = P (X < u) =

0, u ≤ 0

.

 

X

 

(P (ln X < ln u) = Φa,σ(ln u), u > 0.

 

Напомним , что в этой формуле Φa,σ(u) - функция распределения нормального закона с параметрами a, σ.

Чтобы найти плотность распределения случайной величины X, нужно теперь лишь только взять производную от ее функции распределения. При всех u ≤ 0 плотность распределения случайной величины X равна нулю, а при u > 0

00

fX (u) = FX (ln u) = (Φa,σ(ln u)) =

1

1

 

e

(ln u−a)2

1

1

 

e

(ln u−a)2

=

 

 

2

 

 

=

 

 

2

.

 

u

2πσ

 

2πσu

Вычислим теперь математическое ожидание и дисперсию логнормального распределения. По определению, случайная величина X имеет логнормальное распределение, если случайная величина Y = ln X имеет нормальное распределение с параметрами a, σ. Поэтому X = eY , где Y нормально распределена с

параметрами a, σ. Для этого вычислим характеристическую функцию случайной величины, имеющей логнормальное распределение.

Характеристическая функция случайной величины Y, имеющей нормальное распределение N(a, σ2) равна φ(t) = EeitY = eiat−σ22t2 . Найдем математическое

ожидание случайной величины X.

EX = EeY

Это математическое ожидание равно значению характеристической функции слу- чайной величины Y в точке t = −i. и

EX = EeY = EeitY |t=−i = φ(−i) = ea+ σ22 .

Вычислим дисперсию случайной величины .

DX = EX2 − (EX)2.

Математическое ожидание уже подсчитано. Найдем

EX2 = Ee2Y = EeitY |t=−2i = φ(−2i) = e2a+2σ2 .

И окончательно,

DX = e2a+σ2 (eσ2 − 1).

Для вычисления медианы нужно решить следующее уравнение

1

P (X < me) = 2 .

1 P (X < me) = P (ln X < ln me) = 2 .

Это означает, что ln me - медиана случайной величины Y = ln X, которая имеет нормальное распределение с параметрами a, σ. Но мы знаем, что медиана нормального распределение с параметрами a, σ равна a, то есть

ln me = a, me = ea.

Логнормальное распределение является унимодальным распределением с положительной асимметрией.

Логнормальное распределение служит одним из простейших примеров распределения, которое не определяется однозначно всеми своими моментами.

2

Замечание. Иногда логнормальное распределение определяется следующим образом. Случайная величина X имеет логнормальное распределение c парамет-

рами a, σ, если P (X > 0) = 1 и случайная величина Y = ln X имеет нормальное распределение с параметрами ln a, σ2. В этом случае

EX = aeσ22 , DX = a2eσ2 (eσ2 − 1).

При таком определении логнормального распределения me = a.

2. Распределение хи-квадрат с n степенями свободы χ2(n).

Пусть случайные величины X1, ..., Xn независимы и имеют одно и то же стандартное нормальное распределение N(0, 1). Тогда случайная величина

χ2(n) = X12 + ... + Xn2

имеет хи-квадрат распределение с n степенями свободы. Из определения сразу следует, что EX = n, DX = 2n.

Плотность распределения этой случайной величины выглядит следующим образом:

fχ2(n)(u) =

(0, u 0

n

 

u

.

 

2n/2 (n/2) u 2

−1e

2

, u > 0

 

1

 

 

 

 

Из вида плотности следует, что распределение хи-квадрат с n степенями сво-

боды является гамма-распределением с параметрами n2 , 12 ( ( n2 , 12 )). Ïðè n = 2 хи-квадрат распределение совпадает с экспоненциальным распределением с па-

раметром λ = 1/2.

Аппроксимация распределения хи-квадрат при больших степенях свободы.

Как известно, случайная величина

n

X

χ2(n) = Xj2,

j=1

ãäå Xj, j = 1, ..., n - независимые случайные величины, каждая из которых имеет стандартное нормальное распределение. Так как EXj2 = 1, то из закона больших чисел следует, что

1

 

n

p

 

 

Xj

Xj2 → 1.

n

=1

 

 

 

Последовательность случайных величин X2, j = 1, ... - поcледовательность неза-

 

 

 

 

 

 

j

 

 

= 1, DX2

= 2.

висимых одинаково распределенных случайных величин и EX2

 

 

 

 

 

 

 

 

 

 

j

j

 

По теореме Леви

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

χ2(n) − n

=

 

j=1 Xj2 − n

d

X

 

 

 

 

 

P

 

 

 

 

 

 

2n

2n

 

 

 

при этом случайная величина X имеет стандартное нормальное распределение. То есть при больших n распределение случайной величины

χ2(n) − n

2n

3

может быть аппроксимировано стандартным нормальным распределением. Поэтому при больших n распределение χ2(n) может быть аппроксимировано рас-

пределением случайной величины

2nX + n.

При больших n возможна еще одна аппроксимация распределения хи-квадрат, так называемая аппроксимация Фишера. Покажем, что

 

 

 

 

 

d

p2

 

 

 

(n) − 2n → N(0, 1).

Зта запись означает, что распределение случайной величины 2(n) − 2n ïðè

больших

n

может быть аппроксимировано стандартным нормальным распреде-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

лением. Действительно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

2(n) − 2n

=

χ2(n) − n

2

 

 

 

2(n)

2n

.

 

 

 

 

 

 

 

 

 

 

 

 

p

 

p2(n) + 2n

 

2n

pχ2(n)/n + 1

!

Первый сомножитель в последнем равенстве сходится по распределению к стандартному нормальному закону. Второй множитель по вероятности при n →

∞ стремится к 1. Отсюда и следует, что

p2(n) 2n d X,

− →

где X имеет стандартное нормальное распределение.

В некоторых случаях используют в качестве аппроксимации распределения хи-квадрат следующий факт, очевидно следующий из предыдущего

p2(n) 2n 1 d X.

− − →

Пример. Как вычислить P (χ2(70) < 85)? Обозначим, как и раньше, через X случайную величину, имеющую стандартное нормальное распределение.

Первый способ

√ √

P (χ2(70) < 85) ≈ P ( 140X + 70 < 85) = Φ(15/ 140) = Φ(1.27) = 0.898.

Второй способ состоит в использовании аппроксимации Фишера

p √ √ √

P (χ2(70) < 85) = P ( 2χ2(70) − 140 < 170 − 140) ≈

≈ Φ( 170 − 140) = Φ(1.21) = 0.887.

Еще один способ

p √ √ √

P (χ2(70) < 85) = P ( 2χ2(70) − 139 < 170 − 139) ≈

≈ Φ( 170 − 139) = Φ(1.25) = 0.894.

4

3. Распределение Стьюдента (Госсет).

Пусть имеются две случайные независимые величины, одна из которых X имеет стандартное нормальное распределение N(0, 1), а вторая χ2(n) - хи-квадрат распределение с n степенями свободы. Тогда говорят, что случайная величина

X

t(n) = q

χ2(n)

n

имеет распределение Стьюдента с n степенями свободы. Это распределение имеет плотность

ft(n)(u) =

1 ( n+1 )

 

1 +

u2

 

n+12

πn

( n2 )

n

 

 

 

2

 

 

 

 

.

 

 

 

 

 

 

 

Ïðè n = 1

1 ft(1)(u) = π(1 + u2) .

Распределение с такой плотностью называется распределением Коши.

У распределения Коши не существует математического ожидания и дисперсии.

Для распределения Стьюдента

me = mo = 0.

У распределения Стьюдента математическое ожидание существует и равно нулю при n > 1, а дисперсия сущеcтвует при n > 2 и равна

n Dt(n) = n − 2 .

Аппроксимация распределения Стьюдента при больших степенях свободы.

Случайная величина t(n) имеет распределение Стьюдента, с n степенями свободы, если

t(n) =

 

X

,

p

 

χ2(n)/n

где случайные величины X, χ2(n) - независимы и X имеет стандартное нормальное распределение, а χ2(n) распределениа по закону хи-квадрат с n степенями свободы. Так как при больших n

χ2(n) p

n → 1,

то из свойств сходимости по распределению следует, что

d

t(n) → X.

5

Это означает, что при больших n распределение Стьюдента с n степенями свободы можно приближенно считать стандартным нормальным распределением.

4. Распределение Фишера

(Fisher) Роналд Эйлмер (17.2.1890, Лондон, - 29.7.1962, Аделаида, Австралия), английский статистик и генетик, один из основателей математической статистики и математической популяционной генетики. Член Лондонского королевского общества (1929). Окончил колледж в Кембридже (1912). Основные труды по теории статистики и генетической теории эволюции. Вв¼л понятие достаточной статистики, построил теорию точечных и интервальных статистических оценок, разработал методику планирования экспериментов и вн¼с существенный вклад в создание современной теории статистической проверки гипотез. Вв¼л основные понятия генетики количественных признаков, исследовал стохастические процессы в популяциях, предложил ряд моделей действия естественного отбора, первый рассмотрел случай сверхдоминирования по приспособленности, предложил теорию эволюции доминантности. Сформулировал т. н. фундаментальную теорему естественного отбора, носящую его имя.

(Fisher)

Пусть χ2(m), χ2(n) две независимые случайные величины, с распределени-

ем хи-квадрат с m и n степенями свободы соответственно. Случайная величина F (m, n) имеет распределение Фишера, если

F (m, n) =

 

1

χ2(m)

=

2(m)

.

m

 

 

 

 

 

 

n1 χ2(n)

2(n)

Р. Фишер в 1924 году вывел плотность распределения этой случайной величины

fm,n(u) =

 

( 2 ) (

2

)

 

(nu+m) m2

.

 

( m2+n )mm/2nn/2

 

um/2−1

u > 0

 

 

n

m

 

 

+n ,

 

0,

u ≤ 0.

 

 

 

 

 

При n > 2 распределение Фишера это унимодальное распределение с положи-

(m−2)n

тельной асимметрией с модой в точке mo = m(n+2) . Математическое ожидание F (m, n) существует лишь при n > 2 и равно

n EFm,n = n − 2 .

Дисперсия распределения Фишера существует при n > 4 и равна

2n2(m + n − 2) DX = m(n − 2)2(n − 4) .

Аппроксимация распределения Фишера при больших степенях свободы.

Ïðè n → ∞

F (1, n) d χ2(1).

6

Соседние файлы в папке Лекции Мат.стат. (2007-2008)