Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

YzhR47Vwqa

.pdf
Скачиваний:
29
Добавлен:
13.02.2021
Размер:
459.47 Кб
Скачать

Функция φ(t) = 0.5 cos 3t + 0.5 cos 2t представляет собой выпуклую комбинацию косинусов и, следовательно, также является характеристической функцией случайной величины. Это дискретная случайная величина, которая с вероятностями 14 принимает значения 2, –2, 3, –3.

в) Как известно, функция φ(t) = exp(iat − σ2t22) является характеристической функцией гауссовской случайной величины, имеющей математиче-

ское ожидание a и дисперсию σ2 . В рассматриваемом случае a = 2 и σ2 = 4 . Задача 7. Случайные величины X и Y независимы и имеют гауссовские

плотности с параметрами ( a

= 1, σ2

= 4 )

и ( a

= −1, σ2

= 1)

соответственно.

1

1

 

2

2

 

 

Найти совместную плотность случайного вектора (X + Y, X

Y). Являются ли

его компоненты независимыми?

Решение. Все линейные комбинации компонент гауссовского случайного вектора также являются гауссовскими и полностью определяются своими моментами первого и второго порядков. Независимость гауссовских случайных величин равносильна их некоррелированности, поэтому для ответа на последний вопрос надо лишь сравнить ковариацию или коэффициент корреляции с нулем.

Первый способ. В двумерном случае можно воспользоваться формулой для плотности:

f X ,Y (x, y) =

 

1

 

 

 

exp

 

 

1

 

 

×

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

2 )

 

 

2

 

 

 

 

 

2πσ1σ2 1 − ρ

 

 

 

 

 

 

 

− ρ

 

 

 

 

 

 

 

 

 

 

 

 

2 1

 

 

 

( x a

)2

 

( x a )( y a

2

)

+

( y a

)2

×

1

− 2ρ

1

 

 

 

 

 

 

2

 

 

.

 

2

 

 

 

σ1σ2

 

 

 

 

 

 

2

 

 

 

 

σ1

 

 

 

 

 

 

 

 

σ2

 

 

 

Для нового случайного вектора (U, V) = (X + Y, X

 

Y) имеем

EU = E( X + Y ) = EX + EY = a1 + a2 = 1 + (−1) = 0, EV = E( X Y ) = EX EY = a1 a2 = 1 − (−1) = 2;

из независимости X и Y:

DU = DX + DY = 4 + 1 = 5, DV = DX + D(−Y ) = DX + DY = 1 + 4 = 5;

из линейности ковариации по обоим аргументам:

cov(U ,V ) = cov( X + Y , X Y ) = cov( X , X ) + cov(Y , X ) − cov( X ,Y ) − cov(Y ,Y ) = = DX DY = 1 − 4 = −3;

11

коэффициент корреляции вычисляется по формуле

ρ =

 

cov(U ,V )

 

=

 

−3

 

= −3 = -0.6.

 

 

 

 

 

 

 

 

 

 

 

 

DU DV

5 5

5

Для самопроверки: дисперсии всегда неотрицательны, а для невырожденных случайных величин положительны; коэффициент корреляции всегда не превосходит по модулю 1.

Теперь можно ответить на вопрос о независимости: поскольку коэффициент корреляции отличен от нуля, компоненты случайного вектора являются зависимыми. Выпишем плотность случайного вектора (U, V):

f

(x, y) =

 

1

 

 

exp

 

-

1

 

´

 

 

 

 

 

 

 

 

(

2 )

 

 

 

 

2

U ,V

 

 

 

 

 

 

 

 

 

 

 

 

2 × 1 - (-0.6)

 

 

 

 

2π 5

5 1 - (-0.6)

 

 

 

 

 

 

 

x2

x ( y - 2)

 

( y - 2)2

 

 

 

 

 

 

 

 

 

 

 

 

- 2 × (-0.6)

 

 

 

 

 

+

=

´

5 5

 

 

 

5

 

 

 

5

 

 

1

 

 

1

 

 

=

 

exp

-

 

×(x2

+1.2x( y - 2) + ( y - 2)2 ) .

6.4

 

 

 

 

 

Второй способ. Все вычисления, приведенные ранее, можно записать в матричной форме. Такая запись более компактна и, вместе с тем, более универсальна. Случайный вектор (X, Y) имеет вектор математических ожиданий

(1, –1) и ковариационную матрицу

 

 

 

 

 

 

 

 

 

 

σ2

 

ρσ σ

 

1

0

 

 

 

 

R =

1

 

1 2

=

 

 

.

 

 

 

 

ρσ1σ2

2

 

0 4

 

 

 

 

 

 

σ2

 

 

 

Новый случайный вектор (U, V) связан с (X, Y) соотношением (U, V) =

1

1

матрица преобразования. По линейности матема-

= (X, Y)C, где C =

1

-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

тических ожиданий (EU, EV) = (EX, EY)C = (1, -1) ×

 

 

= (0, 2).

 

 

 

 

 

 

 

 

1

-1

Ковариационная матрица нового вектора вычисляется по формуле

 

1

 

1 T 1

0 1

1

=

5

-3

CT RC =

 

 

×

×

 

 

-3

.

 

1

-1

0

4 1

-1

 

 

5

Плотность невырожденного случайного вектора с вектором математических ожиданий (a1, a2 ) и ковариационной матрицей R выражается формулой

f

X ,Y

(x, y) =

 

1

 

exp -

1

( x - a , y - a

) R

−1 ( x - a , y - a

)T

 

 

 

 

 

 

det R

 

2

1

2

 

1

2

 

 

 

 

 

 

 

 

 

 

 

.

12

Таблица 1.1

Для нового вектора имеем

 

(x, y) =

1

 

 

 

-

1

( x, y - 2)(CT RC )

-1

( x, y - 2)T

 

f

 

 

exp

 

.

 

 

 

 

 

U ,V

 

2π det C det R

 

 

2

 

 

 

 

 

 

 

 

 

 

Легко проверить, что это выражение совпадает с выражением, полученным первым способом.

Задача 8. Распределение дискретного случайного вектора (X, Y) задано табл. 1.1. Найти: а) распределения случайных величин X и Y; б) их математические ожидания, дисперсии, ковариацию и коэффициент корреляции; в) условное распределение X при условии Y = 0.

Решение. а) Табл. 1.2 и 1.3 распределений

случайных величин X и Y соответственно полу-

Y

 

 

 

X

 

 

 

0

1

2

чаются суммированием вероятностей по столб-

 

 

–1

0.07

0.11

0.02

цам и строкам. Например, P( X = 2) = 0.02 + 0.1 +

0

0.15

0.05

0.1

+ 0.2 = 0.32 и P(Y = 0) = 0.15 + 0.05 + 0.1 = 0.3;

1

 

0.1

0.2

0.2

 

 

 

 

Таблица 1.2

б) EX = 0 × 0.32 +1× 0.36 + 2 × 0.32 =1,

 

 

 

 

 

 

 

 

 

 

 

аi

 

0

 

1

 

2

EY = (-1) × 0.2 + 0 × 0.3 +1× 0.5 = 0.3;

 

 

 

P ( X - ai )

0.32

 

0.36

 

0.32

EX 2 = 02 × 0.32 +12 × 0.36 + 22 × 0.32 =1.64,

 

 

 

 

Таблица 1.3

EY 2 = (-1)2 × 0.2 + 02 × 0.3 +12 × 0.5 = 0.7;

bi

 

–1

 

0

 

1

P ( X - bi )

0.2

 

0.3

 

0.5

DX = EX 2 - (EX )2 =1.64 -12 = 0.64, DY = EY 2 - (EY )2 = 0.7 - 0.32 = 0.61.

Замечания: 1. Можно заметить, что случайная величина X симметрична относительно точки 1, поэтому ее математическое ожидание можно было угадать без вычислений: это центр симметрии. 2. Для вычисления дисперсии можно воспользоваться и другой формулой:

DX = E( X - EX )2 = 0.32 ×(0 -1)2 + 0.36 ×(1-1)2 + 0.32(2 -1)2 = 0.64.

Ковариацию вычислим по формуле

cov( X ,Y ) = P ( X = ai ,Y = b j )aib j - EX × EY.

i, j

Опустив слагаемые, равные нулю, получим:

cov( X ,Y ) = 0.11×1× (-1) + 0.02 × 2 × (-1) + 0.2 ×1×1 + 0.2 × 2 ×1 - 0.7 ×1 = -0.25.

Коэффициент корреляции ρ =

cov( X ,Y )

 

=

 

−0.25

» -0.4.

 

 

 

 

 

 

 

0.64 × 0.61

 

 

DX × DY

 

13

Таблица 1.4

ai

0

1

2

P ( X = ai

 

Y = 0)

1/2

1/6

1/3

 

 

 

 

 

 

 

Например, P ( X = 0 Y = 0) =

зультаты запишем в табл. 1.4.

в) По определению условной вероятности

P ( X = Xi

 

Y = 0) =

 

P ( X = Xi , Y = 0)

 

 

 

 

 

 

.

 

 

 

 

P ( X = 0, Y = 0)

 

0.15

P(Y = 0)

=

= 0.5. Полученные ре-

 

 

P(Y = 0)

0.3

 

 

 

Раздел 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

2.1. Предмет математической статистики

Математическая статистика – наука, разрабатывающая методы регистрации, описания и анализа данных наблюдений и экспериментов с целью получения вероятностно-статистических моделей случайных явлений.

Основными задачами математической статистики являются следующие:

1.Определение вероятности события по относительной частоте.

2.Нахождение приближенного закона распределения случайной величины по данным экспериментов.

3.Проверка статистических гипотез о свойствах случайного явления.

4.Определение эмпирической (регрессионной) зависимости между переменными, описывающими случайное явление, на основе экспериментальных данных.

При решении указанных задач схема исследования обычно такова:

1.Сначала путем наблюдений и экспериментов собирают и регистрируют статистические данные.

2.Затем эти данные упорядочивают, представляют в компактной наглядной или функциональной форме.

3.Далее получают достаточно обоснованные выводы о свойствах исследуемого случайного явления.

2.2. Генеральная совокупность. Выборка. Выбор

Рассмотрим абстрактный эксперимент Е. Результатом его проведения является значение x случайной величины X. Множество возможных значений изучаемой случайной величины X с приписанным этому множеству законом распределения X: G(x) называют генеральной совокупностью. Числа, составляющие генеральную совокупность, называют ее элементами. Закон G(x) распределения случайной величины X называют генеральным законом распределе-

ния, а числовые характеристики X генеральными числовыми характеристи-

14

ками. Так как генеральная совокупность велика, то перебрать все ее элементы невозможно. Поэтому для изучения генеральной совокупности из нее делают выборку, по свойствам которой судят о свойствах генеральной совокупности. Выборкой называют множество измеренных значений x1, x2, ..., xn случайной

величины X. Выборку записывают в виде n-мерной точки ( x1, x2, ..., xn ). Числа,

составляющие выборку, называют ее элементами; их количество n объемом выборки. Процесс составления выборки называют выбором.

Будем рассматривать простой случайный выбор. Таким выбором называют выбор, удовлетворяющий следующим условиям:

1.Выбор является случайным.

2.Каждый элемент генеральной совокупности может быть выбран.

3.Каждый элемент выбирается независимо от остальных.

4.Все элементы выборки получаются в равных условиях.

Реальный выбор лишь приближенно можно считать простым случайным. К выборкам, как и к выбору, предъявляется ряд требований. Важнейшим является требование репрезентативности (представительности). Это требование означает, что выборка должна хорошо представлять всю генеральную совокупность. Требование однородности выборки означает, что условия проведения экспериментов для получения выборки не должны меняться. Выборка должна быть получена из одной генеральной совокупности, а не из нескольких. В ней должны отсутствовать выбросы. Неоднородная выборка не может дать правильного прогноза. Малые и большие выборки отличаются методами обработки. Для обработки большой выборки привлекаются асимптотические методы, основанные на центральной предельной теореме. В статистической практике принято считать выборку с объемом n > 30 большой.

2.3. Вариационные и статистические ряды. Выборочная функция распределения

Вариационным рядом называют последовательность всех элементов выборки, расположенных в неубывающем порядке. Одинаковые элементы повторяются: x(1) , x(2) , ..., x(n). Элементы вариационного ряда называют поряд-

ковыми статистиками. Минимальный и максимальный элементы называют

экстремальными элементами вариационного ряда: xmin = x(1) , xmax = x(n).

Статистическим рядом называют последовательность различных элементов xi вариационного ряда с указанными частотами mi повторениями

элементов (m1 + m2 + ... + ml = n).

15

Из вариационного ряда составим ряд распределения выборки – измеренные значения случайной величины xi i = (1, 2, ..., l ) , расположенные в порядке

их возрастания и соответствующие им относительные частоты pi* = mi n.

l

Сумма всех относительных частот равна единице: pi* = 1.

i=1

Графическое изображение ряда распределения (или статистического ря-

да) выборки – полигон относительных частот (или частот), для построе-

ния которого по оси абсцисс откладывают значения xi , по оси ординат – соответствующие им относительные частоты pi* (или частоты mi ), а полученные точки соединяют отрезками (рис. 2.1). Полигон относительных частот дает хорошее представление о распределении частот в выборке.

Эмпирической функцией распределения Fn*(x) называют относительную частоту события X < x в данной выборке: Fn*(x) = vn ( X < x). При достаточном

объеме выборки n эмпирическая функция распределения Fn*(x) дает представление о теоретической функции распределения F (x) случайной величины X.

Для построения графика Fn*(x) удобно исходный вариационный ряд дополнить двумя графами – графой накопленных частот Ni = m1 + m2 + ... + mi и графой накопленных относительных частот Ni n (табл. 2.1). Последняя из накопленных частот равна объему выборки Nl = n. Последняя из накопленных относительных частот равна единицеNl n = 1. Это служит проверкой правильности составления табл. 2.1.

 

 

 

Таблица 2.1

 

 

 

 

 

xi

mi

Ni = m1 + ... + mi

Ni

n

x1

m1

m1

N1

n

x2

m2

N2 = m1 + m2

N2

n

 

xl

ml

n

1

Графы выборочных значений xi и соответствующих им накопленных относительных частот Ni n и служат для построения графика эмпирической

функции распределения Fn*(x), которая выражается следующим образом:

16

 

 

 

0,

x x1;

 

 

 

N

n,

x < x x ;

 

 

 

1

 

1

2

 

Fn*

…………….............

 

(x) =

 

n,

xi < x xi+1;

(2.1)

 

Ni

 

 

 

……………………

 

 

 

 

 

x > x .

 

 

 

 

 

1,

 

 

 

 

 

 

 

 

 

 

l

 

 

Функция Fn*(x) представляет собой разрывную ступенчатую функцию (рис. 2.2). График этой функции – кумулята.

Если объем выборки значителен и случайная величина X по своей природе непрерывная, то составляют так называемый сгруппированный вариаци- онный ряд. Для этого весь интервал, в котором заключены измеренные значения случайной величины X, разбивают на ряд частичных интервалов xi...xi+1 ( i = 1, 2, ..., l ). Для каждого из них подсчитывают частоты mi (число попаданий случайной величины X в данный интервал).

Для наглядной характеристики распределения выборки строят гисто- грамму выборки. Для построения гистограммы по оси абсцисс (рис. 2.3) откладывают граничные значения интервалов xi...xi+1; ширина интервала hi = xi+1 xi. Затем на каждом интервале как на основании строят прямоугольник высотой, равной плотности относительной частоты на данном интервале: pi* hi , где pi* = mi n – относительная частота.

Гистограмма оценивает кривую плотности распределения случайной величины (пунктир на рис. 2.3). Площадь каждого частичного прямоугольника

равна соответствующей относительной частоте: Si = pi*. Вся площадь, огра-

l l

ниченная гистограммой выборки, равна единице: S = Si = pi* = 1. График

i=1 i=1

17

эмпирической функции распределения Fn*(x) строят приближенно по крайним точкам интервалов, полагая

F*

(x) = 0, x £ x ;

 

 

n

 

 

 

 

 

1

 

 

*

(x 2 ) = N1 n;

 

 

Fn

 

 

 

(2.2)

F*

 

 

) = N

 

 

 

(x

i+1

i

n;

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F*

(x) =1,

x ³ x .

 

 

n

 

 

 

 

 

l +1

 

 

Полученные точки соединяют ломаной линией (рис. 2.4). Для построения графиков, вариационных рядов, эмпирической функции распределения и дальнейших числовых точечных и интервальных характеристик можно воспользоваться ресурсами Excel или R-пакетом.

2.4.Выборочные числовые характеристики

Вслучае вариационного ряда (см. табл. 2.1) выборочный начальный момент k-го порядка вычисляется по формуле

mk*[X ] = 1

l

 

xik mi.

(2.3)

ni=1

Вчастности, если в (2.3) полагать k = 1, получим выборочный начальный момент первого порядка, называемый выборочным средним

 

 

= m*[X ] =

1

 

l

 

 

 

 

 

 

 

 

x m .

 

 

 

(2.4)

 

x

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

i

i

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

Выборочный центральный момент k-го порядка вычисляется по формуле

 

 

 

1

l

 

 

 

 

 

 

 

 

 

µ* [X ] =

( x

-

 

)k m .

(2.5)

x

 

k

 

 

i

 

 

 

 

 

i

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

Если в (2.5) полагать k = 2,

получим выборочную дисперсию (второй

центральный выборочный момент)

 

 

 

 

 

 

 

 

 

 

 

 

 

D*[X ] = D* = µ* [X ] =

1

 

l

( x

 

 

)2m .

 

-

 

(2.6)

x

 

 

 

X

2

 

 

 

n i=1

i

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

При практическом вычислении выборочной дисперсии удобно пользоваться следующей формулой:

18

 

 

1

l

 

 

D*X

=

xi2mi

 

2.

(2.7)

x

 

 

 

n i=1

 

 

Положительное значение квадратного корня из выборочной дисперсии

дает выборочное среднеквадратическое отклонение:

 

 

 

 

 

 

 

 

σ*X = D*X .

 

(2.8)

В случае сгруппированного вариационного ряда для нахождения выбо-

рочных моментов его заменяют вариационным рядом, в котором частота i-го

интервала mi соответствует

середине i-го

интервала:

xi ср = ( xi + xi+1) 2,

i = 1, 2, ..., l. В частности, (2.4) и (2.6) перепишутся в виде

 

 

 

 

 

 

 

 

1

 

l

 

 

 

 

 

 

 

 

 

=

 

xi срmi ;

 

(2.9)

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

1

l

 

 

 

 

 

 

 

1

l

 

 

D*X =

( xi ср

 

)2 mi =

xi2срmi

 

2.

(2.10)

x

x

 

 

 

n i=1

 

 

 

 

 

 

 

n i=1

 

 

Для уменьшения ошибок, вносимых группировкой, применяют так называемые поправки Шеппарда. Если все интервалы имеют ширину h = hi = const, то основные выборочные моменты с учетом поправок Шеппарда находят по формулам:

 

Ш =

 

;

 

 

 

 

 

x

x

 

 

 

 

 

 

 

 

 

 

2

 

(2.11)

D*

= D*

h

 

 

.

 

 

 

 

 

X Ш

 

X

12

 

 

 

 

 

 

 

 

При выполнении условия h < 0.5σ*X поправками Шеппарда можно пре-

небречь, так как при этом σ*X − σ*X Ш < 0.01σ*X .

2.5. Статистические оценки параметров теоретического распределения

Одной из задач математической статистики является оценивание неизвестных параметров теоретического распределения (случайной величины X) на основании выборки. Приближенное значение параметра θ теоретического распределения, полученное из выборки, называется статистической оцен-

кой параметра θ (или статистикой). Точечной называют статистическую оценку ɶθ, которая определяется одним числом (одной случайной величиной). Для данной конкретной выборки ɶθ = ɶθ( x1, x2, ..., xn ) – число, но от выборки к выборке оно меняется, так что в общем случае ɶθ = ɶθ( X1, X 2, ..., X n ) – слу-

19

чайная величина, где X1, X 2, ..., X n – результаты 1-го, 2-го, ..., n -го измерений случайной величины X. В литературе по математической статистике принято случайную величину ɶθ( X1, X 2, ..., X n ) и ее численное значение для данной выборки ɶθ( x1, x2 , ..., xn ) обозначать одним и тем же символом ɶθ.

Найти точечную статистическую оценку параметра θ теоретического распределения – это значит найти случайную величину ɶθ( X1, X 2, ..., X n ), являющуюся функцией случайных величин X1, X 2 , ..., X n , которая для каждой выборки ( x1, x2 , ..., xn ) дает приближенное значение ɶθ( x1, x2 , ..., xn ) оцениваемого параметра θ. К точечным статистическим оценкам обычно предъявляют следующие требования:

1)состоятельность (сходимость по вероятности при n → ∞ к оцениваемому параметру);

2)несмещенность (равенство математического ожидания оценки оцениваемому параметру);

3)эффективность (наименьшая возможная дисперсия оценки при данном объеме выборки) или асимптотическая эффективность (наименьшая возможная дисперсия при n → ∞ ).

Можно показать, что в качестве точечной статистической оценки Eɶ математического ожидания E теоретического распределения следует взять вы-

борочное среднее

 

,

т. е. Eɶ =

 

.

Эта оценка является состоятельной, несме-

x

x

щенной, а для нормального закона –

также и эффективной.

 

Если в качестве точечной статистической оценки дисперсии D теорети-

ческого распределения взять выборочную дисперсию D*X ,

то можно дока-

*

 

 

 

 

n −1

*

 

 

 

 

 

 

 

зать, что E DX ( X1,

X 2, ..., X n )

=

 

 

 

D ¹ D, т. е. оценка DX является сме-

 

 

 

 

 

 

 

 

 

n

 

щенной оценкой дисперсии D. Чтобы ликвидировать этот недостаток, рас-

сматривают исправленную выборочную дисперсию

 

 

 

 

 

 

 

ɶ

=

n *

 

 

 

 

 

 

 

 

 

DX ,

(2.12)

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

n -1

 

которая является состоятельной несмещенной, а для нормального закона асимптотически эффективной оценкой дисперсии.

В случае обработки сгруппированного вариационного ряда выборочная дисперсия с учетом поправки Шеппарда (2.11) уже является несмещенной оценкой дисперсии (можно доказать), т. е. в этом случае

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]