Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

семестр 1 / Пособие_по_терверу_Чекалкин.PDF

.pdf
Скачиваний:
0
Добавлен:
13.05.2026
Размер:
1.95 Mб
Скачать

На практике центральная предельная теорема чаще всего используется при вычислении вероятности в задаче о повторении независимых испытаний. Пусть, таким образом, произведено n независимых испытаний с вероятностью успеха в каждом, равной p . Рассмотрим систему случайных величин: ξ1, ξ2 ,...,ξn ,..., где ξi

- число успехов в i - ом опыте, получим, что:

n

ξi ηn

1

- случайная величина, равная числу успехов в n опытах. При n 1 ηn - приближенно «нормальна», согласно центральной

предельной теореме: m

p; D

 

 

 

p 1 p .

 

 

 

 

 

ξi

 

 

 

 

ξi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P η

k

 

 

 

 

1

 

 

 

 

 

 

k np 2

 

 

 

 

 

 

 

 

 

 

 

e

2npq

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

npq 2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

при n 1, а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P k1 k k2

 

k

2

 

np

 

 

k

np

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

Φ

 

 

npq

 

Φ

npq

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

 

1

 

x

 

t 2

Φ x

 

 

 

 

 

 

e

2

dt .

 

 

 

2π

 

 

0

 

 

 

Приведенные формулы для вычисления вероятности ( ηn k

и

k1 ηn k2 )

называется

соответственно

локальной

и

интегральной теоремой Луавра-Лапласа. Заметим, что при p 0 эти формулы весьма неточны - в этом случае приближенное значение следует искать, используя теорему Пуассона ( n 1, p 0 ). При использовании локальной теоремы Муавра-Лапласа следует воспользоваться затабулированной функцией

φ x

 

1

 

 

x2

 

 

 

 

 

 

 

e 2 .

 

 

 

2π

 

 

 

 

 

 

81

Пример 1. Игральная кость бросается 800 раз. Случайная величина ξ равна числу очков, кратных 3. Найти вероятность того, что ξ 267 .

Решение:

p 13 , q 23 , n 800, k 267 .

Находим, согласно локальной теореме Лапласа:

 

 

 

np

800

266;

npq

1600

 

 

 

 

 

 

 

40

.

 

 

 

 

 

 

,

 

 

npq

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

9

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P ξ k

 

1

 

 

 

267 266

 

 

3

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

φ

 

 

 

 

 

 

 

 

 

 

φ

 

 

 

 

.

 

 

 

 

 

 

40

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

40

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По таблицам

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

φ

 

 

φ 0,075 0,4. P ξ k 0,075 0,4 0,03.

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 2. При условиях примера 1 найти P 260 ξ 274 .

Решение: Согласно интегральной теореме имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P 260 ξ 274

 

 

 

274 266

 

 

 

 

 

260 266

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

40

 

 

Φ

 

 

Φ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Φ 0,6 Φ 0,45 Φ 0,6 Φ 0,45

0,2257 0,1736 0,4.

Как было показано в теореме Бернулли частота успеха в n испытаниях: pn* стремится по вероятности к истинной вероятности успеха p в каждом опыте. С помощью интегральной теоремы Муавра-Лапласа можно оценить вероятность отклонения частоты от вероятности, а именно найдем:

P pn* p ε ,

очевидно, что pn* - приближенно нормальна, так как

82

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pn*

ξi .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Используем свойства нормального распределения, получим:

 

P

p* p

 

ε P p ε p* p

ε

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

P p ε

 

k ε

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

np np nε

np np nε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P np nε k np ε Ф

 

 

 

 

npq

 

 

Ф

 

 

npq

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2Ф

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pq

 

 

 

 

 

 

 

 

 

 

 

Заметим: при вычислениях этой вероятности можно использовать

 

 

1

 

 

x

 

t 2

 

 

 

 

 

 

 

 

 

 

 

 

 

функцию Φ* x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e

2 dt , тогда:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2π

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

ε Φ

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

 

 

n

 

 

 

 

n

 

 

 

 

 

 

 

 

p

*

 

 

 

 

Φ

*

ε

 

 

pn

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

pq

 

 

 

 

pq

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и эта формула не упрощается, следует искать значения Φ* x и

для положительных и для

соответствующих отрицательных

значений аргумента.

 

 

 

 

 

 

 

 

Обозначим:

 

 

 

 

 

 

 

 

P

 

*

p

 

 

 

 

~

 

 

 

 

 

pn

 

ε p .

С помощью формулы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

n

 

 

 

ε

 

 

 

p

 

 

 

 

 

 

 

 

 

pq

можно решить следующие вопросы:

~

при заданных ε, n, p .

1. Найти p

2. Найти ε

~

при заданных n, p, p .

3. Найти n

~

при заданных ε, p, p .

Пример 3. Произведено 800 независимых испытаний,

предполагается, что вероятность успеха в каждом равна 23 p ,

83

найти вероятность того, что абсолютное отклонение частоты успеха от его вероятности не превышает 0,01.

Решение: Имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

*

 

3

 

 

 

 

800

9

 

 

 

 

 

 

 

 

 

 

 

p

P

p

 

 

 

 

 

0,01

0,01

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2Φ 0,6 2 0,2257 0,454 .

 

 

 

 

Пример 4. Найти число испытаний, которое позволяет с

~

вероятностью p 0,96 получить, что абсолютное отклонение

частоты от предполагаемой вероятности p 23 не превышает

0,03. Решение:

 

ε 0,03,

p

2

; q

1

 

~

0,96 .

 

 

 

 

 

 

 

 

 

 

, p

 

n -?

 

 

3

3

Имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

9n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

0,09

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

2Φ 0,03

2

 

0,96 ,

Φ

 

2

 

0,48 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем аргумент функции Φ x , соответствующий значению

Φ x 0,48 по таблицам Φ x . Получим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,09

 

n

 

 

2,06

n

2,3, n 1158

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

- число необходимых испытаний. На практике при исследовании поведения случайных величин (ошибок), являющихся результатом воздействия большого числа случайных независимых факторов, например, при прохождении сигналов через атмосферу, условия центральной предельной теоремы не соблюдаются, тем не менее результирующую случайную величину можно считать асимптотически нормальной, согласно теореме Ляпунова; приведем ее без доказательства.

Теорема Ляпунова

Пусть ξ1, ξ2 ,...,ξn - независимые случайные величины, а

84

mξi mi , Dξi M ξi mξi 2

и

Cξi M ξi mξi 3 .

Обозначим:

 

n

 

 

n

 

 

 

 

 

n

 

An mi , Bn2

Dξi , Kn Cξi

 

i 1

 

 

i 1

 

 

 

 

 

i 1

 

при условии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim

Bn

 

0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n Kn

 

 

 

 

 

 

 

 

случайная величина

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

ηn ξi

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

- асимптотически нормальна с параметрами An

и Bn , то есть:

 

 

ηn An

 

 

 

 

1

 

x

 

t 2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

lim

P

 

x

 

 

 

 

e

 

 

dt .

Bn

 

 

 

 

 

 

 

 

n

 

 

 

 

 

2π

 

 

 

n

Существует еще ряд условий на Bn и Kn , позволяющих ξi

1

считать асимптотически нормальной (см. [5],[6]). При n 1 получаем приближенное значение:

 

 

 

 

 

 

 

 

 

 

 

k2

An

k1

An

P k1

ηn k2

Φ

 

 

 

 

Φ

 

 

.

 

Bn

 

 

 

 

 

 

 

 

 

Bn

ЛЕКЦИЯ 14 ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ.

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ, ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ. ГРУППИРОВАННАЯ ВЫБОРКА И ГИСТОГРАММА

Пусть x1, x2 ,...,xn - все возможные различные наблюдаемые в опыте значения случайной величины . Множество xi

85

называется генеральной совокупностью объема n . Так как каждое наблюдаемое значение можно рассматривать как случайную величину, то полагаем:

mxi m ; Dxi D ; f xi x f x .

Определение. Пусть задана генеральная совокупность xi , объема n . Эмпирической функцией распределения Fn* x

называется отношение: F * x

k

, где k

- число элементов

 

 

 

 

n

n

 

 

 

 

 

 

 

 

генеральной совокупности, меньших x . Очевидно, что F * x

 

 

 

 

 

 

n

удовлетворяет свойствам:

 

 

 

1.

F * x - неубывающая

 

 

 

 

n

 

 

 

 

 

2.

lim

F * x 1

 

 

 

 

x

 

n

 

 

 

 

 

 

 

 

 

 

lim

 

F * x 0

 

 

 

 

x

n

 

 

 

 

 

 

 

 

3.

F * x - непрерывна слева. Для

иллюстрации свойства

 

n

 

 

 

 

 

рассмотрим пример 1.

Пусть - случайная величина, равная количеству баллов, полученных на экзамене по теории вероятности каждым из десяти студентов. Пусть генеральная совокупность имеет вид:

2,3,2,4,5,3,2,5,4,3; n 10 .

Найти Fn* x . Имеем (см. рис. 27):

86

0, x 2

 

3

 

 

 

,2

x 3

 

10

 

6

 

 

Fn* x

 

,3

x 4

 

10

 

 

 

8

,4

x 5

 

 

 

10

 

 

1, x 5

Теорема Гливенко

Эмпирическая функция распределения сходится по вероятности к теоретической функции распределения равномерно

по x при n :

 

 

 

 

 

 

 

 

 

 

 

F* x F x

 

 

1.

 

 

 

 

 

 

P lim sup

 

 

0

 

 

n x

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F x - теоретическая функция распределена.

 

 

 

Группированная выборка. Гистограмма

 

При n 1, интервал y1, yr 1

, где y1

min xi ,

yr 1

max xi .

 

 

 

 

 

 

i

 

 

i

 

87

 

 

 

 

 

 

 

Разделим на r одинаковых интервалов, таблица (см. рис. 28) представляет собой группировку элементов генеральной совокупности по интервалам yi , yi 1 , где mi - число элементов

генеральной совокупности yi , yi 1

интервалы

y1, y2

y2 , y3

 

yi , yi 1

 

yr , yr 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

m1

 

m2

 

 

mi

 

 

mr

pn*

 

m1

 

 

m2

 

 

 

mi

 

 

 

mr

 

 

n

 

n

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 28

Случай, когда xi лежит на границе интервала не рассматривается.

p*

mi

P y y

;

 

i

n

i

i 1

 

 

 

 

 

По группированной выборке, представленной таблицей (рис. 28) построим ступенчатую фигуру (см. рис. 29), состоящую из прямоугольников с основанием yi , yi 1 и высотой hi .

88

Высота hi выбирается так, чтобы площадь прямоугольника была

бы равна pi* . Эта ступенчатая фигура называется гистограммой.

По гистограмме можно получить представление о виде распределения (плотности). Действительно:

P yi yi 1

yi 1

 

 

 

 

 

 

 

f x dx f xi yi 1 yi - по теореме о

 

 

 

 

 

~

 

 

 

 

yi

 

 

 

 

 

 

 

среднем.

 

 

 

 

 

 

 

 

C другой стороны:

 

 

 

 

 

 

 

 

 

 

p* P y y

 

mi

,

 

 

 

 

 

 

 

i

i

i 1

 

n

 

 

 

 

 

 

 

и

 

 

hi yi 1 yi f

xi yi 1 yi

Si pi

 

 

*

 

 

 

~

 

 

~ hi yi 1 yi hi f xi ,

чем больше r , полнее гистограмма дает представление о виде распределения. Гистограммы, представленные на рис. 30 (а),

30(в), 30 (с) представляют, очевидно, нормальное, показательное

иравномерное распределения.

Проверка этого будет сделана в дальнейшем.

Как известно, каждая плотность распределения зависит от одного или нескольких параметров. Установить эти параметры или получить их оценку, располагая эмпирическими значениями

возможно с

 

помощью следующих соображений:

Рассмотрим

* x , x

2

,...,x

n

действительную функцию элемента генеральной

n 1

 

 

 

совокупности

- она называется точечной

оценкой

соответствующего параметра , если удовлетворяет условию:

89

1. Оценка должна быть состоятельной:

p

n*

n

2. Оценка должна быть несмещенной:

M n*

3. Оценка должна быть эффективной:

D n* min D k x1,.., xn

k

Точечная оценка математического ожидания

Пусть x1, x2 ,...,xn - элементы генеральной совокупности с

p*

1

(без повторов по классической схеме). В качестве оценки

 

i

n

 

 

 

 

 

 

 

M рассмотрим:

 

 

 

 

 

1

n

 

 

mn*

xi .

 

 

n

 

 

 

1

Проверим выполнение условий 1-3.

1. mn* - состоятельная оценка, так как mn* - среднее арифметическое случайных величин xi по теореме Чебышева(1) имеем:

p

mn* m .

n

2. mn* - несмещенная, так как:

 

1

n

 

 

1

n

1

n

1

 

M mn* M

xi

 

M xi

m

nm m

 

 

 

 

n i 1

 

 

n i 1

n i 1

n

3.Эффективность оценки будет оказана позже для конкретных случаев распределений.

Точечная оценка дисперсии

90