Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие по ТВ и МС

.pdf
Скачиваний:
59
Добавлен:
08.03.2016
Размер:
3.21 Mб
Скачать

где ξ стандартная нормальная случайная величина, независимая от χ2. Плотность распределения Стьюдента равна

 

n + 1

 

 

 

 

 

 

 

 

Γ

 

 

 

 

 

 

 

x2

n+1

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

f (x) =

 

 

 

 

 

 

 

 

+

 

 

 

 

 

n

 

 

 

1

n

.

 

 

 

 

 

 

 

 

 

 

Γ

 

 

 

 

πn

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При n → ∞ плотность распределения Стьюдента сходится к плотности стандартной нормальной случайной величины.

На рис. 4.4 приведены кривые плотности распределения Стьюдента (кривая 1) и стандартного нормального распределения (кривая 2), а также показаны двухсторонние критические границы этих распределений.

Рис. 4.4.

Двусторонние критические границы распределения Стьюдента ± tα шире соответствующих двусторонних критических границ стандартного нормального распределения ± uα . В статистических таблицах приводятся правые критические границы tα (n) для разных значений степеней свободы:

P(t > tα ) =α.

Пример 4.7. (Распределение Фишера). Fраспределением Фишера с (m,n)

степенями свободы называется распределение случайной величины, равной Fотношению

F(m, n) = χ2 (m) / m , χ2 (n) / n

являющемуся положительной случайной величиной. В статистических таблицах приводятся правосторонние критические границы Fα данного распределения для разных значений степеней свободы.

71

4.6. Многомерное нормальное распределение

Важнейшим примером совместного распределения нескольких случайных величин является многомерное нормальное распределение. Оно играет важную роль в теории вероятностей и часто возникает в различных приложениях.

Определение 4.5. Говорят, что набор случайных величин ξ = (ξ1 ,K,ξn )

имеет многомерное нормальное (или гауссовское) распределение, если найдутся вещественный вектор a = (a1,K,an ), невырожденная вещественная n ×n

матрица C = (cij ) и набор независимых стандартных нормальных случайных величин η1 ,K,ηn такие, что

ξ1 = a1 + c11η1 +K+ c1nηn ,

K

(4.7)

ξn = an + cn1η1 +K+ cnnηn .

Соотношения (4.7) записываются более компактно, если воспользоваться матричной формой: ξ = a + Cη .

Предложение 4.7. Справедливы следующие утверждения.

Случайная величина ξi

имеет нормальное распределения N (ai ,σi2 ) , где

 

n

 

 

 

 

 

 

1.

σi2 = cij2 .

 

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

n

 

 

 

 

 

 

2.

Cov(ξi ,ξk ) = cij ckj .

 

 

 

 

 

 

j=1

 

 

 

 

 

 

 

Рассмотрим

n ×n

матрицу

B = CCT ,

где

CT матрица,

транспонированная

к

C.

Легко видеть,

что такая

матрица симметрична

(bij = bji ) и является невырожденной в силу невырожденности матрицы C. Более того, из предложения 4.7 следует, что bij = Cov(ξi ,ξ j ) . #

Упражнение 4.6. Доказать, что матрица B является строго положительной в следующем смысле: для любого ненулевого вещественного вектора

(z1 ,K, zn ) 0

n

n

∑∑bij zi z j > 0 .

i=1

j=1

Матрицу B = (bij ) называют матрицей ковариаций, а вектор a = (a1,K,an ) вектором средних многомерного нормального распределения. Оказывается, что

72

этих двух характеристик достаточно для того, чтобы полностью описать многомерное нормальное распределение. А именно, имеет место следующее утверждение.

Предложение 4.8. Плотность многомерного нормального распределения записывается в виде следующей формулы:

 

1

 

 

 

 

 

 

 

1

(B

1

 

 

 

pξ1Kξn (x1,K, xn ) =

 

 

 

 

 

 

 

exp

 

 

(x a),(x a))

,

 

(2π)n / 2

 

B

 

1/ 2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где x = (x1,K, xn ),

a = (a1,K,an )

вектор средних,

B = (bij ) матрица

ковариаций, B1 обратная ей матрица, B = det B , ( , ) обычное евклидово скалярное произведение в Rn :

n

(u,v) = ui vi , u = (u1,K,un ), v = (v1,K,vn ).

i=1

Замечание 4.6. На рис 4.5 приведены примеры двумерных нормальных плотностей.

a = (5,5;5) ,

 

4

0

 

a = (5,5;6) ,

 

4

4

 

B =

 

 

 

B =

 

 

 

 

 

0

4

 

 

 

4

8

 

 

 

 

 

 

 

Рис. 4.1.

Замечание 4.7. Если n = 1, то функция, выписанная в предложении 4.8, принимает вид обычной нормальной плотности.

Доказательство. Воспользуемся формулой вероятности попадания в область (следствие 4.1) и сделаем замену переменных в интеграле:

pξ (x)dx = P{ξ D}= P{a + Cη D}= P{η C1 (D a)}=

D

73

= pη ( y)dy = [замена

y = C1 (x a)]= pη (C1 (x a))

 

C1

 

dx .

 

 

C1 ( Da)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

 

 

Поскольку

это

 

 

верно

 

 

для

любой области D Rn , то равны и

подынтегральные функции

 

 

 

 

 

 

 

 

 

 

 

 

 

pξ (x) = pη (C1 (x a))

 

C1

 

.

 

 

 

 

(4.8)

 

 

 

 

 

 

Так как η1 ,K,ηn

 

независимые

N (0,1)

случайные величины, то по

следствию 4.3 их совместная плотность записывается очень просто:

n

1

 

yi2

 

 

1

 

 

1

 

 

 

 

 

 

 

pη ( y) =

 

e

 

2 =

 

 

 

 

 

exp

 

( y, y)

.

2π

 

(2π)

n / 2

2

i=1

 

 

 

 

 

 

 

 

 

 

Пользуясь известными фактами из курса линейной алгебры, преобразуем квадратичную форму

(C1 (x a),C1 (x a))= ((CCT )1 (x a),(x a)),

и заметим, что det B = det C det(CT ) = (det C)2 , следовательно, C1 = B 1/ 2 . Подставляя это в (4.8), получаем утверждение предложения.

Из вида многомерной нормальной плотности видно, что она определяется лишь параметрами a и B. Поэтому этот закон распределения часто обозначают

N (a, B) .

Замечание 4.8. Утверждение предложения 4.8 можно считать эквивалентным определением многомерного нормального распределения. Если плотность имеет указанный вид с некоторой невырожденной положительной матрицей B, то существуют такие a, C и η, что справедливо представление (4.7).

Предложение 4.9. Предположим, что вектор ξ = (ξ1 ,K,ξn ) имеет многомерное нормальное распределение. Тогда любой набор его компонент ξ′ = (ξi1 ,K,ξik ) имеет (kмерное) нормальное распределение. #

Замечание 4.9. Иногда матрица C, участвующая в соотношениях (4.7), имеет ранг меньший n. В этом случае говорят, что ξ = (ξ1 ,K,ξn ) имеет

вырожденное многомерное нормальное распределение. У такого распределения плотность не существует.

74

Глава 5. Предельные законы теории вероятностей

Под законом больших чисел в широком смысле понимается общий принцип, согласно которому, по формулировке А.Н. Колмогорова, совокупное действие большого числа случайных факторов приводит, при некоторых весьма общих условиях, к результату, почти не зависящему от случая. Иными словами, при большом числе случайных величин их средний результат перестает быть случайным и может быть предсказан с большой степенью определенности.

Под законом больших чисел в узком смысле понимается ряд математических теорем, в каждой из которых для тех или иных условий устанавливается факт приближения средних характеристик большого числа испытаний к некоторым определенным постоянным.

Без преувеличения можно сказать, что закон больших чисел является одним из наиболее важных утверждений теории вероятностей.

Вэтой главе рассмотрим классические теоремы, имеющие универсальный характер – закон больших чисел и центральную предельную теорему, которые имеют исключительное значение для математической статистики.

5.1.Закон больших чисел

В§ 2.13 был рассмотрен закон больших чисел для случая дискретных случайных величин. Примечательно то, что он без изменений переносится на общий случай случайных величин.

Предложение 5.1. (Закон Больших Чисел в форме Чебышева). Пусть

ξ1,K,ξn ,K последовательность независимых случайных величин и выполнено условие i N D[ξi ] C . Тогда ε > 0

 

 

 

ξ

 

+K+ξ

 

 

 

M[ξ

1

] +K+ M[ξ

n

]

 

 

 

 

 

 

 

 

 

 

 

lim P

 

 

1

 

 

 

n

 

 

 

 

 

 

 

 

 

> ε

= 0 . #

 

 

 

n

 

 

 

 

 

 

 

 

 

 

n

 

 

 

n→∞

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следствие 5.1. Пусть ξ1,K,ξn ,K последовательность независимых

одинаково

 

 

распределенных

 

случайных

 

величин с конечной дисперсией:

D[ξi ] < ∞. Обозначим M[ξi ] = a . Тогда ε > 0

 

 

 

 

 

ξ

 

+K+ξ

 

 

a

 

> ε

 

= 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim P

 

 

 

1

n

 

n

 

 

 

 

 

 

 

 

n→∞

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ξ

 

 

+K+ξ

P

 

 

 

 

 

 

или, более кратко,

 

 

 

 

 

 

 

 

 

 

 

1

 

n

 

n

a .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n→∞

 

 

 

 

 

 

75

В действительности, это утверждение верно в более общей ситуации, а именно, предположение о существовании дисперсии не является необходимым. Имеет место так называемый закон больших чисел в форме Хинчина.

Предложение 5.2. (Теорема Хинчина). Пусть ξ1,K,ξn ,K

последовательность независимых одинаково распределенных случайных величин, у которых существует математическое ожидание: M[ξi ] = a . Тогда

ξ

+K+ξ

P

1

n

n a . #

 

n→∞

5.2. Центральная предельная теорема

Интегральная предельная теорема Муавра-Лапласа, которая обсуждалась в § 2.11, интересна тем, что она является частным случаем общей и универсальной центральной предельной теоремы. Основополагающий вклад в разработку этой тематики внесли выдающиеся отечественные математики: П.Л. Чебышев, А.А. Марков и А.М. Ляпунов.

Приведем вариант центральной предельной теоремы (ЦПТ) для независимых одинаково распределенных слагаемых.

Предложение 5.3. (Центральная Предельная Теорема). Пусть ξ1,K,ξn ,K

последовательность независимых одинаково распределенных случайных величин с конечной дисперсией. Обозначим M[ξi ] = a и D[ξi ] =σ 2 > 0 . Тогда

x R

 

ξ

 

+K

+ξ

 

 

na

 

lim P

1

 

 

 

 

n

 

 

x = Φ(x) ,

n→∞

 

 

 

σ

n

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

где Φ(x) =

 

1

x e

y

dy

 

 

2

функция распределения стандартного нормального

 

 

 

2π

 

 

 

 

 

закона. #

 

 

 

 

 

 

 

 

 

 

 

Замечание

 

5.1.

 

Обозначим Sn = ξ1 +K+ξn . Тогда M[Sn ] = na ,

D[Sn ] = nσ 2 . Следовательно, утверждение ЦПТ может быть записано в виде

 

 

 

M[S

 

]

 

 

 

S

n

n

 

= Φ(x) .

lim P

D[S

 

]

 

x

n→∞

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

Как уже отмечалось выше, интегральную теорему Муавра-Лапласа для схемы Бернулли можно считать следствием ЦПТ.

76

Замечание 5.2. Существуют обобщения центральной предельной теоремы на случай независимых разнораспределенных слагаемых. При этом на

отдельные слагаемые ξi накладываются условия, обеспечивающие их «пренебрежимо малый» вклад в сумму Sn с ростом n. Наиболее известными условиями такого рода являются условия Ляпунова и Линдеберга.

Центральная предельная теорема имеет огромное значение для применений теории вероятностей в естествознании и технике. Ее действие проявляется там, где наблюдаемый процесс подвержен влиянию большого числа независимых случайных факторов, каждый из которых лишь ничтожно мало изменяет течение процесса. Наблюдатель, следящий за состоянием процесса в целом, наблюдает лишь суммарное действие этих факторов. Эта схема поясняет также исключительное место, которое нормальное распределение занимает среди других вероятностных распределений.

Центральная предельная теорема дает возможность аппроксимировать распределение сумм независимых случайных величин нормальным распределением, чем часто пользуются на практике. В связи с этим, очень важным является вопрос о том, насколько быстро допредельное выражение в центральной предельной теореме приближается к Φ(x) . Приведем формулировку теоремы Бэрри-Эссеена о скорости сходимости в ЦПТ.

Предложение 5.4. (Теорема БэрриЭссеена). Предположим, что выполнены условия ЦПТ для независимых одинаково распределенных

случайных величин,

 

и, кроме того, существует M [

 

ξ1

 

3 ] . Тогда справедлива

 

 

 

оценка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M[S

 

 

 

 

 

3

]

 

 

 

 

 

S

 

 

]

 

 

 

 

 

 

 

sup

n

n

− Φ(x)

CM[ξ1

 

 

 

 

P

D[S

 

]

 

x

 

σ 3 n ,

 

 

x

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где C − некоторое число между 1/

 

 

и 0,8 , не зависящее от распределения

 

2π

ξ1 . #

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

77

Раздел 2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

Математическая статистика – раздел математики, посвященный анализу данных. Это самостоятельная область знаний, которая в значительной степени опирается на понятия теории вероятностей. C формальной точки зрения математическая статистика является такой же формально-логической системой, как анализ, алгебра и теория вероятностей.

В математической статистике можно выделить два основных направления: описательную статистику и индуктивную статистику (статистический вывод). Описательная статистика занимается накоплением, систематизацией и представлением экспериментальных данных в удобной форме. Индуктивная статистика на основе этих данных позволяет сделать определенные выводы относительно объектов, о которых собраны данные, или оценить их параметры.

Область применения математической статистики чрезвычайно обширна, и в ней можно выделить несколько направлений, основные из которых следующие:

-теория выборок, посвященная методам формирования выборок из генеральной совокупности экспериментальных данных, объем которых настолько велик, что не позволяет проанализировать ее целиком;

-теория оценок, определяющая методы и способы оценки неизвестных параметров распределений совокупности или решения задачи предсказания, исходя из располагаемых экспериментальных данных;

-проверка статистических гипотез (тесты), используемая, если нужно решить, какое из предположений о распределении анализируемых данных более правдоподобно;

-корреляционно-регрессионный анализ, задачами которого являются выявление зависимостей и подбор математических формул, наилучшим образом описывающих экспериментальные данные;

-дисперсионный анализ, позволяющий оценить разброс экспериментальных данных и сопоставить его с конкретной ситуацией, к которой относятся данные.

Задачи, решаемые математической статистикой, являются, в некотором смысле, обратными задачам теории вероятностей. Вероятностные задачи, как правило, устроены следующим образом: распределения случайных величин считаются изначально известными, основываясь на знании этих распределений, требуется найти вероятности различных событий, математические ожидания, дисперсии, моменты распределений и т.п. В статистических задачах само распределение считается неизвестным, и целью исследования является получение более или менее достоверной информации об этом распределении на основе данных, собранных в результате наблюдений (экспериментов).

78

Сравнительная характеристика областей применения теории вероятностей и математической статистики представлена в следующей таблице:

Сравнительная характеристика областей применения теории вероятностей и математической статистики

Теория вероятностей

 

Математическая статистика

1. Модель, описывающая

1.

Модель, описывающая исследуемое явление, априори

изучаемое явление или объект,

неизвестна.

известна заранее. Есть сведения

2.

Для определения модели можно проводить пробные

обо всей генеральной

испытания (сформировать выборку из генеральной

совокупности, описывающей

совокупности).

исследуемое явление.

3.

Иногда модель может быть задана априори с

2. Используемый математический

точностью до неизвестных параметров.

аппарат не зависит от предметной

4.

Значения неизвестных параметров модели могут быть

области.

приближенно получены по выборке из генеральной

3. Выводы о поведении

совокупности.

исследуемого объекта или явления

5.

Выводы о поведении объекта или явления делаются

делаются по всей генеральной

по выборке ограниченного объема и распространяются

совокупности.

на всю генеральную совокупность.

Отметим, что статистические методы реализованы в различных статистических пакетах прикладных программ, например STATISTICA, SPSS, STATGRAPHICS и др. Задачей данного раздела является освоение основных понятий и методов математической статистики.

Главы этого раздела:

7. Вариационные ряды и их характеристики

8. Основы выборочного метода

9. Точечные и интервальные оценки параметров распределений

10. Проверка гипотез

79

Глава 6. Вариационные ряды и их характеристики

6.1. Вариационные ряды и их графическое изображение

Различные значения признака (случайной величины ξ) называются вариантами, обозначим как x. Для того чтобы рассмотреть и проанализировать исходные данные, их необходимо каким-то образом представить. Основные формы представления выборки из генеральной совокупности следующие.

Представление выборки в несгруппированном виде X = (x1 ,K, xn ) . Представление выборки в упорядоченном виде x(1) x(2) ≤ K≤ x(n) . В этом

случае x(i) i-й член вариационного ряда (или i-я порядковая статистика).

Следует помнить, что члены вариационного ряда, в отличие от элементов исходной выборки, уже не являются взаимно независимыми (по причине их предварительной упорядоченности).

Представление выборки в группированном виде. Здесь область задания случайной величины ξ разбивается на L интервалов группировки. При этом

известны только количество элементов выборки ni , i =1, L , попавших в i-й интервал, и последовательность границ интервалов разбиения. Область задания случайной величины ξ, как правило, ограничена минимумом и максимумом выборки. Согласно формуле Старджесса рекомендуемое число L интервалов

L = 1 + [3,322 lg n],

 

 

(6.1)

а величина интервала равна h =

xmax xmin

xmax xmin разность между

 

, где

1 + [3,322 lg n]

наибольшим и наименьшим значениями признака.

Иногда интервалы группировки могут быть неравными. Это определяется условиями проведения эксперимента и природой исследуемого явления. Данный вопрос рассматривается в курсе «Статистика».

Числа, показывающие, сколько раз встречаются варианты из данного интервала, называются частотами ni , i =1, L , а отношения wi = ni / n, i =1, L

относительными частотами (или частостями). Частоты и частости называют весами.

Следует помнить, что от несгруппированной выборки всегда можно перейти к группированной, но не наоборот. Переход к группированной форме сопряжен с потерей информации об исследуемом явлении.

Определение 6.1. Вариационным рядом называется ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами.

Вариационный ряд может быть дискретным или непрерывным.

80