Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория вероятностей и элементы математической статистики

.pdf
Скачиваний:
0
Добавлен:
29.11.2025
Размер:
2.97 Mб
Скачать

Свойства нормальной случайной величины:

 

 

 

 

 

 

 

 

1)

p(x) 0, x ( , ) , график функции расположен выше оси Ох.

2)

Ось Ох служит асимптотой графика функции p(x) , т.к. Lim p(x) 0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

3)

Функция p(x) имеет один максимум при x a , равный p(a)

 

 

 

.

 

 

 

2

4) График функции p(x) симметричен относительно прямой x a .

5)

Точки M (a ,

 

1

 

e 1/2 ), M

 

(a ,

 

1

 

e 1/2 ) являются точками пере-

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

гиба графика функции p(x) .

 

 

 

 

 

 

 

 

 

 

 

 

 

Вероятность попадания случайной величины

X ~ N(a, ) на заданный уча-

сток (a, b):

b

P(a X b) p(x)dx .

a

Случайная величина X ~ N(a, ) принимает свое значения в промежутке (a 3 ,a 3 ) с вероятностью 0,9973.

Вероятность отклонения нормально распределенной случайной величины от ее математического ожидания по абсолютной величине определяется по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

P(

X a

 

) 2

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

Вероятность отклонения относительной частоты

от вероятности

n

 

 

 

 

 

 

 

 

наступления события р в серии из n независимых испытаний выражается формулой:

 

 

 

 

 

 

 

 

 

 

 

 

n

 

P(

p

 

 

 

 

 

 

 

) 2

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

pq

Примеры

1. Суточное потребление электроэнергии исправной печью является случайной величиной, распределенной по нормальному закону со средним 1000 кВт и среднеквадратичным отклонением 50. Если суточное потребление превысит 1100 кВт, то по инструкции печь отключают и ремонтируют. Найти вероятность ремонта печи.

Решение. Случайная величина X есть суточное потребление электроэнергии печью. M(X) = 1000, X 50. Найдем вероятность попадания случайной величины X в интервал (0; 1100). Для этого воспользуемся формулой:

51

 

a

 

a

P( X ) Ф

 

 

Ф

 

.

 

 

 

 

P

 

0 X 1100

 

 

1100 0

 

 

0 1000

 

2Ф 2 2 0,4772 0,9544 .

 

 

 

 

Ф

 

 

Ф

 

 

 

 

 

 

 

50

 

 

50

 

 

Тогда вероятность ремонта печи равна 1-0,9544 = 0,0456.

2. Рост мальчиков возрастной группы 15 лет есть нормально распределённая случайная величина X с параметрами α = 161 см и σ = 4 см.

Какую долю костюмов для мальчиков, имеющих рост от 152 до 158 см, нужно предусмотреть в объёме производства для данной возрастной группы.

Решение.

M(X) = 161, X 4. Найдем вероятность попадания случайной величины X в интервал (152; 158). Для этого воспользуемся формулой:

 

 

a

 

a

 

 

P( X ) Ф

 

 

Ф

.

 

 

 

 

 

 

 

 

 

 

158 161

 

152 161

 

0,214.

P 152 X 158 Ф

 

 

Ф

 

 

 

4

 

 

 

4

 

 

3. Текущая оценка ценной бумаги представляет собой нормально распределенную случайную величину со средним значением 100 у. е. и дисперсией 9. Найти вероятность того, что цена актива (ценной бумаги) будет находиться в пределах от

91 до 109 у. е.

Решение. Так как a 100, D 3 , тогда

 

9

 

 

 

 

P(91 X 109) P | X 100| 9 2

 

 

 

2 (3)

0,9973.

 

 

 

3

 

 

 

Задачи для самостоятельного решения

 

1.Пусть случайная величина Х подчиняется нормальному закону распределе-

ния

вероятностей

 

с

параметрами

a 0, 2.

Определить

1) P( 2 X 3), 2) P(

 

X

 

0,1).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.Известно, что

 

случайная величина Х ~ N 3,2 . Найти P( 3 X 5).

 

3.Нормальное распределение случайной величины Х задана плотностью рас-

пределения вероятностей

 

p x

1

 

e x2 . Найти вероятность попадания в интер-

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

вал (1,3).

4. Ошибка взвешивания – случайная величина, распределенная по нормальному закону с математическим ожиданием, равным 0, и среднеквадратическим отклонением, равным 2 грамма. Найти вероятность того, что взвешивание проведено с ошибкой, не превышающей по модулю 4 грамма.

52

5. Уровень воды в реке – случайная величина со средним значением 2,5 м

и стандартным

отклонением 0,2 м.

Оценить вероятность того, что в наудачу

выбранный день уровень воды окажется в пределах от 2м 20см до 2м 80см.

 

 

 

Ответы

 

 

 

 

 

 

 

 

 

 

1

2

 

3

4

5

 

0,775; 0,04

0,84

 

0,157

0,954

0,866

 

2.21 Неравенство Чебышева

Необходимо рассмотреть условия, при выполнении которых совокупное действие очень многих случайных причин приводит к результату, почти не зависящему от случая, так как позволяет предвидеть ход явлений. Эти условия и указываются в теоремах, носящих общее название закона больших чисел. К ним относятся теоремы Чебышева и Бернулли. Теорема Чебышева является наиболее общим законом больших чисел, теорема Бернулли – простейшим.

Теорема (Неравенство Чебышева). Вероятность того, что отклонение случайной величины Х от ее математического ожидания по абсолютной величине

меньше положительного числа , не меньше чем 1 D(X ) :2

P( X MX ) 1 D(X ) .2

Теорема Чебышева. Если последовательность попарно независимых случайных величин X1, X2,..., Xn,... имеет конечное математическое ожидание и диспер-

сии этих величин равномерно ограничены (не превышают постоянного числа С), то среднее арифметическое случайной величины сходится по вероятности к среднему арифметическому их математического ожидания, т.е. если – любое положительное число, то

 

1

n

1

n

 

LimP(

Xi

M(Xi )

) 1.

n

n i 1

n i 1

 

 

 

В этом случае среднее арифметическое достаточно большого числа независимых случайных величин (дисперсии которых равномерно ограничены) утрачивает характер случайной величины.

Если проводится серия измерений какой-либо физической величины, причем:

1)результат каждого измерения не зависит от результатов остальных (измерения попарно независимы);

2)измерения производятся без систематических ошибок, (имеют одно и то же математическое ожидание);

3)обеспечена определенная точность измерений, (дисперсии их ограничены) то при достаточно большом числе измерений их среднее арифметическое ока-

жется сколь угодно близким к истинному значению измеряемой величины.

53

Теорема Бернулли. Если в каждом из независимых опытов вероятность появления события А постоянна, то при достаточно большом числе испытаний вероятность того, что модуль отклонения относительной частоты появлений А в n опытах от p будет сколь угодно малым, как угодно близка к 1.

Закон больших чисел не исследует вид предельного закона распределения суммы случайных величин. Этот вопрос рассмотрен в группе теорем, называемых центральной предельной теоремой. Они утверждают, что закон распределения суммы случайных величин, каждая из которых может иметь различные распределения, приближается к нормальному при достаточно большом числе слагаемых. Этим объясняется важность нормального закона для практических приложений.

Центральная предельная теорема. Если X1, X2,..., Xn – независимые слу-

чайные величины с одинаковым законом распределения, математическим ожиданием a и дисперсией 2 , то при неограниченном увеличении n закон распределе-

n

ния суммы Yn Xk неограниченно приближается к нормальному.

 

 

 

 

k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Примеры

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X MX

 

 

2для случайной величины Х:

1.

Найти вероятность того, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Х

 

 

 

-2

 

-1

 

0

 

1

 

 

2

 

Р

 

 

 

0,1

 

0,2

 

0,4

 

0,2

 

 

0,1

 

Решение. По неравенству Чебышева: P(

 

X MX

 

2) 1

D(X )

. Найдем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

математическое ожидание случайной величины Х.

 

 

MX =0,2-0,2+0,2+0,2 = 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

DX = 0,4+0,2+0,2+0,4 = 1,2,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P(

 

X MX

 

2) 1 1,2

0,7 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

Найти вероятность того, что 1,5 X MX

1,5для случайной величины Х:

 

 

 

 

 

 

 

 

 

 

Х

 

-2

 

-1

 

0

 

1

 

 

2

 

Р

 

1/7

 

1/7

 

3/7

 

1/7

 

 

1/7

 

Решение.

Математическое ожидание случайной величины принимает значение:

MX =0,

Дисперсия равна

DX = 10/7,

P( X MX 1,5) 1 10 / 7 0,63. 2,25

54

Задачи для самостоятельного решения

1. Найти вероятность того, что

 

X MX

 

 

1,7для случайной величины Х:

 

 

 

 

 

 

 

 

 

 

 

 

 

Х

-1

-0,5

 

0

1

2

 

Р

0,2

0,1

 

0,3

0,2

0,2

 

 

 

X MX

 

1,2для случайной величины Х:

2. Найти вероятность того, что

 

 

 

 

 

 

 

 

 

Х

0

1

 

2

3

4

 

Р

0,1

0,2

 

0,1

0,1

0,5

 

3. Найти

вероятность того, что 2 X MX 2

для случайной величины Х:

Х

-2

1

 

3

7

10

 

Р

0,2

0,1

 

0,1

0,1

0,5

 

4. Найти

вероятность того, что 5 X MX 5

для случайной величины Х

:

Х

0

1

 

2

7

17

 

Р

0,1

0,1

 

0,05

0,05

0,7

 

5. Найти

вероятность того, что 1,9 X MX

1,9для случайной величины

Х:

 

 

 

 

 

 

 

 

 

 

 

 

Х

5

6

 

7

8

9

 

Р

0,15

0,05

 

0,1

0,1

0,6

 

55

3. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ РАЗДЕЛА «ЭЛЕМЕНТЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ»

3.1 Статистический материал и его обработка

Результаты наблюдений массовых явлений, случайных величин составляют статистические данные или статистический материал. Выборкой объёма n называется совокупность n случайно отобранных объектов. Множество всех объектов, из которых производится выборка, называется генеральной совокупностью (ГС).

Выборочный метод состоит в том, что на основании изучения некоторого количественного признака у некоторой части статистической совокупности (выборки), полученной в результате статистического отбора, можно сделать вывод о характере распределения этого признака по всей статистической совокупности (генеральной совокупности).

Результаты наблюдений выборки объёма записываются, в частности, в виде статистической совокупности:

 

1

2

 

 

 

номера наблюдений, измерений

 

 

 

 

 

 

значение наблюдаемой величины

 

 

1

2

 

 

 

 

 

При больших значениях

и различных значениях статистическую сово-

 

 

 

 

 

 

 

купность подвергают специальным видам статистической обработки.

Расположим значения xi , которые назовём вариантами, в порядке возраста-

ния и обозначим = min ; = max . Величина = − называется размахом статистической совокупности. Среди значений могут быть одинаковые. Пусть значение 1 наблюдалось 1 раз, 2 2 раз, …, наблюдалось раз. Тогда общий объём выборки равен = ∑=1 . Число , показывающее, сколько раз встречается варианта (значение) , называется частотой , а число =

относительной частотой варианты .

Последовательность , записанная в порядке возрастания с указанием частот и (или) относительных частот, называется вариационным рядом. Статистическим

рядом называется последовательность пар ( , ). Обычно статистический ряд за-

 

 

 

 

 

 

 

 

 

 

 

писывается в виде следующей таблицы:

 

 

 

 

 

Варианта

 

 

 

 

 

 

Сумма

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

Частота

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

1

 

 

 

 

 

 

 

Относительная

 

 

 

 

 

 

 

 

частота

 

 

1

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Геометрическим изображением вариационного ряда является эмпирический полигон распределения, являющийся аналогом плотности распределения случайной величины – ломаная с вершинами ( , ) – см. рисунок 1.

56

Вариационный ряд обозрим при небольших значениях ( ≤ 20). В противном случае его (или первоначальную статистическую совокупность) подвергают интервальной обработке.

Все варианты принадлежат отрезку [ , ]. Пусть некоторое (не больше 20) натуральное число. Отрезок [ , ] разобьём на k равных частей длины = .

Обозначим эти промежутки следующим образом: [ 0, 1[; [ 1, 2[; … , [ −1, ]. Через обозначим число вариант, попавших в интервал [ −1, [, при этом бу-

дем считать, что каждый промежуток содержит свой левый конец, но лишь по-

следний промежуток содержит и свой правый конец. Пусть = (числа и

можно также отнести к середине ai* интервала ( −1, )). Полученные данные

занесём в таблицу, называемую интервальной обработкой ряда, или статистической совокупности.

 

Интервал

 

[

,

[

 

[ ,

2

[

 

[

−1

,

]

Сумма

 

 

 

0

1

 

1

 

 

 

 

 

 

 

 

 

 

Середины

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

Частоты

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

Относительные

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

частоты

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Количество интервалов можно рассчитать по формуле Стерджеса = 1 +

3,332 ∙ либо с помощью таблицы:

 

 

 

 

 

 

 

 

 

 

 

 

 

Объём выборки

 

25-40

 

40-60

 

 

60-100

 

 

100-200

 

> 200

Число интервалов

 

5-6

 

 

6-8

 

 

7-10

 

 

8-12

 

 

10-15

Геометрическим изображением интервальной обработки служит гистограмма (см. рисунок 1). Гистограммой частот называется множество прямоугольников с

основаниями ( −1, ) и высотами . Площадь гистограммы равна объёму выбор-

ки .

Нормированная гистограмма (гистограмма относительных частот) пред-

ставляет собой ступенчатую фигуру из прямоугольников с основаниями равными интервалам значений признака ( −1, ) и высотами, равными плотности частоты . Если соединить прямолинейными отрезками середины верхних оснований пря-

моугольников, получим полигон распределения. Суммарная площадь всех прямоугольников гистограммы равна 1:

 

 

 

 

 

 

1

 

 

 

 

∙ = ∑

 

=

 

∑ =

 

= 1

 

 

 

 

 

=1

 

 

 

 

 

 

=1

=1

 

57

max ):

Рисунок 1

Эмпирической функцией распределения (функцией распределения выборки)

называется функция ( ), определяющая для каждого значения относительную частоту события < (см. рисунок 2):

 

 

( ) =

 

,

(1)

 

 

 

где

– число вариант

, меньших чем ,

 

 

 

– объем выборки.

 

 

 

 

 

 

 

 

Рисунок 2

Функция ( ) обладает следующими свойствами (здесь = min ; =

1) ( ) [0; 1]; 2) ( ) = 0 при < , ( ) = 1 при > ; 3) ( )

монотонно неубывающая, непрерывная слева функция.

Функция ( ) является статистическим аналогом функции распределения( ) генеральной совокупности. Функцию распределения ( ) в математической статистике называют теоретической функцией распределения. Различие между теоретической и эмпирической функциями распределения состоит в том, что ( ) определяет вероятность события < , а ( ) – относительную частоту этого события.

58

Т. е. эмпирическая функция распределения служит для оценки вида теоретической функции распределения случайного признака, полигон и гистограмма – для оценки вида теоретической кривой распределения.

3.2 Числовые характеристики законов распределения эмпирических величин

Одна из задач математической статистики состоит в установлении закона распределения случайной величины Х (генеральной совокупности) и оценке параметров этого закона.

Вид закона выбирается из каких-либо теоретических или практических соображений, а параметры следует вычислять, исходя из параметров этого закона.

Важнейшим этапом обработки статистических данных является вычисление оценок числовых характеристик исследуемой случайной величины.

Полученные оценки позволяют в числовой форме описать характерные черты статистического распределения и являются базой для построения математической модели изучаемого случайного явления.

Любая величина ̃, определяемая как функция выборочных значений ̃ =( 1, 2, … ), называется выборочной статистикой или просто статистикой.

Статистика ̃, используемая в качестве приближённого значения неизвестного параметра , называется статистической оценкой параметра .

Существует два вида оценок параметров: точечные и интервальные.

Точечной называется статистическая оценка, которая определяется одним числом.

К точечным статистическим оценкам предъявляется ряд требований.

Если ̃ – статистическая оценка параметра , то она должна удовлетворять следующим условиям:

1)быть несмещенной, что означает, что ( ̃) = .

2)быть состоятельной, т.е. предел по вероятности при → +∞ последовательности таких оценок должен быть равен искомому параметру, т.е. вероятность

того, что | − ̃| > > 0 , стремится к нулю при → +∞.

3) быть эффективной, т.е. дисперсия ( ̃) – наименьшая или быть

асимптотически эффективной, что означает, что lim ( ̃) = 0.

→∞

Число > 0 называется точностью оценки, если имеет место равенство | − ̃| < . Если это неравенство имеет место с некоторой вероятностью , то число называется надёжностью оценки или уровнем надёжности. Наиболее употребительными уровнями надёжности являются = 0,95; = 0,99; = 0,999.

Выборочной средней ̅называют среднее арифметическое значение случайной

величины Χ по выборочной совокупности объёма :

 

̅=

1

.

(2)

 

 

 

=1

 

 

 

 

 

 

59

Выборочная средняя служит несмещённой оценкой математического ожида-

ния признака Χ или генеральной совокупности.

Кроме выборочной средней в статистическом анализе применяются структурные средние: медиана и мода.

Модой называют варианту, которая имеет наибольшую частоту. Если рас-

пределение интервальное, то определяется модальный интервал [ ,

[, которо-

 

 

 

 

 

 

 

 

 

 

 

+1

 

му соответствует наибольшая частота , мода вычисляется по формуле:

 

 

 

 

 

 

−1

 

 

 

 

 

 

 

= + ∙

 

,

 

 

(3)

 

 

 

 

 

 

 

 

 

 

 

 

 

( −−1)+( −+1)

 

 

 

 

 

 

 

 

 

 

 

 

где – величина модального интервала;

и

 

– частоты предмодального и по-

 

 

 

 

 

 

+1

 

 

 

 

слемодального интервала.

 

 

 

 

 

 

 

 

 

Медианой называют варианту, которая делит вариационный ряд на две ча-

сти, равные по числу вариант. Если = 2 + 1, то =

, а если = 2, то

+

 

 

 

 

 

 

 

+1

 

 

 

+1

 

 

 

 

 

 

 

 

 

 

=

 

. При вычислении медианы интервального ряда распределения ис-

 

 

2

 

 

 

 

 

 

 

 

 

 

 

пользуется формула:

 

 

 

 

 

 

 

 

 

 

 

 

= + ∙

0,5 −−1

,

 

 

 

(4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где −1 - накопленная частота интервала, предшествующего медианному, включая

интервал, предшествующий медианному; – начальное значение интервала, который содержит медиану. Номер медианного интервала определяется из неравенства

=1 2 < ∑ =1+1 . В случае выполнения равенства номер медианного интер-

вала равен , в противном случае – + 1.

Средние величины не отражают изменчивости (вариации) значений признака. Чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения ̅вводят свободную характеристи-

ку – выборочную дисперсию.

Выборочной дисперсией называют среднее арифметическое квадратов от-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

клонения наблюдаемых значений признака от их среднего значения ̅:

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

2

 

 

1

 

 

 

2

 

2

 

 

 

 

=

 

 

 

(

− ̅) ∙ =

 

=1

 

 

− ̅.

(5)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочным средним квадратическим отклонением (стандартом) называют

квадратный корень из выборочной дисперсии:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

√ .

 

 

 

 

 

 

 

 

(6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочная дисперсия является смещённой оценкой генеральной дисперсии,

так как ( ) =

 

 

. В качестве несмещенной оценки генеральной дисперсии

−1

 

Г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

служит «исправленная» выборочная дисперсия:

 

 

 

 

 

 

 

 

 

 

 

 

 

2

=

 

 

 

 

=

1

 

( − ̅)2 .

 

(7)

 

 

 

 

−1

−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

При достаточно больших

 

выборочная и исправленная дисперсии мало от-

личаются, поэтому на практике исправленной дисперсией пользуются, если < 50.

60