
- •2 Функция распределения
- •3 Плотность распределения
- •4 Числовые характеристики случайной величины
- •5 Законы распределения дискретной случайной величины
- •6 Законы распределения непрерывной случайной величины
- •7 Обработка результатов измерений, доверительный интервал
- •8 Корреляционный анализ
- •9 Регрессионный анализ
ОСНОВНЫ ТЕОРИИ ВЕРОЯТНОСТЕЙ, АНАЛИЗ ДАННЫХ И МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ
1 Общие понятия
Многие процессы и события, с которыми мы сталкиваемся в повседневной жизни, являются случайными. Количество студентов, пришедших на занятие, или же время, затрачиваемое на дорогу от дома до работы – всё это случайные величины, которые каждый раз принимают то или иное, заранее неизвестное, значение. Они зависят от определенного числа факторов и, на первый взгляд, непредсказуемы. Однако теория вероятностей говорит об обратном: любые случайные события подчиняются вполне конкретным законам. Об этом и пойдёт речь в данном разделе.
Случайная величина – это величина, которая в результате опыта может принять то или иное значение, при этом заранее неизвестно, какое именно. Время осмотра состава бригадой ПТОВ, количество вагонов в подаче на погрузочно-выгрузочные пути, время на расформирование состава – всё это случайные величины. Случайная величина может принимать как конечное, определенное число конкретных значений, так и все значения, заполняющие некоторый отрезок (числовую ось). Случайные величины делятся на два типа: дискретные и непрерывные. Дискретной случайной величиной называется такая величина, которая имеет конечное число возможных значений, перечисленных заранее. Примерами таких величин являются: число вагонов в группе, направляемой на сортировочный путь; число вагонов в расформировываемых составах; число поездов, прибывающих на станцию за сутки и др. Непрерывной случайной величиной называется такая величина, значения которой непрерывно заполняют определенный интервал (конечный или бесконечный) числовой оси. Как правило, это масса, время, температура и другие величины, значения которых упирается только в точность измерений. Примерами таких величин являются: интервалы между подачами
вагонов, время на расформирование состава, время экипировки и осмотра локомотива и др.
Случайные величины, как правило, обозначают большими буквами латинского алфавита – X, T и др., а возможные значения, которые они могут принимать - , и т.д. Рассмотрим дискретную случайную величину Х с возможными значениями 1, 2, … . В результате опыта (испытания, измерения) случайная величина Х примет одно из этих значений. Повторяя
испытания, какие-то значения величины будут встречаться чаще, другие |
||||||
реже. Отсюда проистекает частота появления случайной, |
величины .(1.1) |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где |
|
- число испытаний, в |
которых случайная величина приняла значение |
|||
|
( = |
) = |
|
|
||
|
|
общее число испытаний. Например, на станцию прибыло n поездов, в |
||||
, n – |
||||||
|
поездах есть вагоны определенного назначения. Тогда частоту появления |
поездов с вагонами определенного назначения можно определить по формуле (1). Как правило, при недостаточном количестве испытаний (опытов, измерений), частота является достаточно неточной характеристикой. Для того, чтобы увеличить точность, необходимо увеличивать число испытаний. Это необходимо для того, чтобы подойти к более точному значению – вероятности появления случайной величины (вероятности события). В дальнейшем будет использоваться понятие вероятности.
Вернемся |
к случайной величине. |
Вероятность каждого из |
событий |
||||||||||||
( = |
) = |
|
|
|
|
|
|
1 |
|
|
1 |
|
1 |
2 |
|
|
|
|
|
|
|
|
) = |
, |
( = ) |
= |
, … , |
||||
можно обозначить следующим образом: |
|
|
|
||||||||||||
|
. |
Сумма вероятностей всех( = |
|
|
|||||||||||
Для того, |
чтобы ∑ |
|
( = ) = ∑ |
|
возможных значений случайной |
||||||||||
|
|
= 1 |
|
|
|
|
|
|
|||||||
величины Х всегда равна единице: |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
, |
|
|
|
(1.2) |
||||
|
|
полностью=1 |
охарактеризовать=1 |
случайную величину с |
вероятностной точки зрения, мы должны определить вероятность каждого из возможных событий, т.е. определить закон распределения. Законом распределения называется всякое соотношение, устанавливающее связь

между возможными значениями случайной величины и соответствующими им вероятностями. Зная закон распределения, можно до опыта судить о том, какие значения будут проявляться чаще, а какие реже. Простейшей формой представления закона распределения является ряд распределения в виде таблицы, в котором представлены все возможные значения случайной величины и соответствующие им вероятности появления.
|
1 |
2 |
… |
|
|
||||
|
1 |
2 |
… |
|
|
Ряд распределения можно представить графически: по оси абсцисс откладываются возможные значения случайной величины, по оси ординат – значения вероятности её появления. Вершины ординат соединяют прямыми линиями. Важно заметить, что в промежутках между двумя смежными значениями 1, 2 и т.д. дискретная случайная величина значений принимать не может, соответственно вероятность её появления будет равна нулю. Такая фигура называется многоугольником распределения, который также является одной из форм представления закона распределения случайной величины.
Пример. Вероятность заработать на экзамене 1 балл – 0.1; 2 балла – 0.2; 3 балла – 0.3; 4 балла – 0.3. Необходимо определить вероятность получения 5 баллов и построить многоугольник распределения.
Решение. Известно, что вероятности= 1всех−0возможных.1 − 0.2 − 0.значений3 −0.3 =случайной0.1 величины в сумме равны 1. Тогда вероятность получить 5 баллов 5 . Построим ряд распределения:
|
1 |
2 |
3 |
4 |
5 |
|
|
|
|
|
|
|
0,1 |
0,2 |
0,3 |
0,3 |
0,1 |
|
|
|
|
|
Тогда многоугольник распределения будет выглядеть следующим образом:
Рисунок 1.1 – Многоугольник распределения
2 Функция распределения
Несмотря на то, что ряд распределения достаточно удобная форма представления закона распределения, его можно использовать только для дискретных случайных величин. Для непрерывной случайной величины его использовать нельзя, т.к. она имеет бесчисленное множество значений, заполняющих некоторый промежуток. Можно сказать, что каждое отдельное значение непрерывной случайной величины имеет вероятность появления
практически равной нулю. |
( = |
) |
|
|
|
|
|
|
|
|||||||
случайных величин, |
а |
|
|
|
|
|
|
|
|
|||||||
Для характеристики непрерывного распределения удобно пользоваться |
||||||||||||||||
не вероятностью |
события |
|
|
|
, |
как |
|
это |
делалось для дискретных |
|||||||
|
|
|
|
|||||||||||||
|
|
|
|
|
|
вероятностью |
|
|
|
|
, |
где – некоторая текущая |
||||
переменная. |
Соответственно, |
вероятность этого события есть некоторая |
||||||||||||||
|
( < ) |
|
|
|
||||||||||||
непрерывных |
( ) |
|
|
|
|
|
|
|
|
функцией распределения и |
||||||
функция |
от |
|
. Такая функция называется |
|||||||||||||
обозначается |
|
. |
Она существует |
как |
|
для |
дискретных, так и для |
|||||||||
|
|
|
случайных величин и полностью характеризует их с |
|||||||||||||
Отметим общие свойства ( ) = ( < ) |
|
|
|
|||||||||||||
вероятностной точки зрения. |
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
(1.3) |
|
|
|
|
|
|
|
|
функции распределения: |
||||||||
1) |
функция |
|
распределения |
|
|
|
– |
неотрицательная функция, |
||||||||
( ) [0; 1]; |
|
|
|
|
|
|
единицей, т.е. область значений функции |
|||||||||
заключенная |
между |
нулем |
и |
|
( ) |
|
|
|
|
|
2)вероятность появления случайной величины в промежутке( < < [α;β]) = равна( ) −разности( ) значений функции в концах интервала, т.е.
3)функция; распределения> ( ) > (( ) есть неубывающая функция своего аргумента, т.е. при );
4) На минус бесконечности−∞ функция∞ равна нулю, на плюс бесконечности – единице, т.е. F( ) = 0; F(+ ) = 1.
Данные свойства отражены на графике функции распределения.

|
|
|
Рисунок 1.2 – Общий вид функции распределения |
|
|
|
|||||||||||||||||
|
Пользовать графиком можно следующим образом: если необходимо |
||||||||||||||||||||||
определить |
вероятность того, |
что |
случайная |
|
величина |
будет |
|
меньше |
|||||||||||||||
значения |
, |
т.е. иметь значение |
|
1 |
, необходимо провести перпендикуляр к |
||||||||||||||||||
оси |
абсцисс из точки |
|
на функцию |
распределения, а затем из полученной |
|||||||||||||||||||
|
|
|
|
|
|
||||||||||||||||||
точки провести перпендикуляр1 |
на ось ординат. Т.е. |
|
|
1 |
|
. Точно |
|||||||||||||||||
свойством, |
вероятность ( < ) = ( ) |
|
|
случайная величина будет |
|||||||||||||||||||
также можно определить вероятность того, что |
|
( < ) |
= ( |
) |
|
||||||||||||||||||
меньше |
значения |
β: |
|
|
|
|
|
|
|
1 |
. |
|
Тогда |
в соответствии со 2-ым |
|||||||||
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
того, что значение случайной величины будет |
||||||||||||||||
находиться в интервале от α до β |
|
- |
|
|
|
|
|
. Как говорилось ранее, это |
|||||||||||||||
справедливо как для непрерывных |
случайных величин, так и для дискретных. |
||||||||||||||||||||||
|
( ) − ( ) |
|
|
|
( ) |
|
|||||||||||||||||
вероятность |
( ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
Функция распределения кумулятивная (накопительная). Это означает, |
||||||||||||||||||||||
что каждое |
|
|
включает |
в |
себя |
предыдущее значение |
−1 |
|
плюс |
||||||||||||||
|
Такой |
( |
) |
= ∑ |
|
|
( ) = ( |
|
|
|
|
(, |
) |
|
(1.4) |
||||||||
|
|
|
|
) + ( ) |
: |
|
|
|
|
||||||||||||||
|
|
|
появления самой случайной величины |
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
=1 |
|
|
|
|
|
−1 |
|
|
|
|
|
|
|
|
|||
|
|
|
способ определения значений |
|
действителен только для |
||||||||||||||||||
|
|
|
|
|
|||||||||||||||||||
дискретной |
случайной |
|
величины. |
Для |
непрерывных случайных |
величин |
|||||||||||||||||
|
|
|
( |
) |
|
|
|
|
|
|
используется непрерывная функция.

Пример. В течении месяца (30 дней) производился анализ объемов прибытия на сортировочную станцию. Полученные данные представлены ниже:
i |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Кол-во составов, |
в |
51 |
52 |
53 |
54 |
55 |
56 |
60 |
Кол-во дней, |
4 |
4 |
3 |
8 |
7 |
3 |
1 |
|
составов, |
|
|
|
|
|
|
|
|
которые прибыло |
|
|
|
|
|
|
|
|
Определить вероятность того, что на станцию прибудет не более 56 составов за сутки.
Решение. В первую очередь, необходимо определить вероятность появление каждой из случайных
величин |
|
|
3 |
= 303 |
= 0.1 |
. Если общее число измерений (дней) равняется 3 , то, например, вероятность того, что на |
|||||
станцию |
прибудет |
53 состава за сутки равняется |
|
|
. Тогда запишем ряд распределения и |
определим значения функции распределения по формуле (4):
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
|
|
|
|
|
|
|
|
51 |
52 |
53 |
54 |
55 |
56 |
60 |
|
|
|
|
|
|
|
|
|
0.13 |
0.13 |
0.10 |
0.27 |
0.24 |
0.10 |
0.03 |
|
|
|
|
|
|
|
|
F(x) |
0.13 |
0.26 |
0.36 |
0.63 |
0.87 |
0.97 |
1 |
|
|
|
|
|
|
|
|
Построим функцию распределения:
Рисунок 1.3 – Функция распределения дискретной случайной величины Из графика, как из таблицы, видно, что с вероятностью 0.97 на станцию прибудет не более 56
составов за сутки.