Загребаев Лектсии по теории вероятностеы и математическоы статистике 2015
.pdf
Рис. 4.1. К свойству 2 функции распределения
Так как эти два события несовместны (не может же одна случайная точка попасть сразу в две различные области отрезка!), то вероятность суммы несовместных событий есть сумма вероятностей отдельных событий:
|
P(X < x2 ) = P(X < x1) + P(x1 ≤ X < x2 ) |
|
или |
F(x2 ) = F(x1) + P(x1 ≤ X < x2 ), |
|
откуда следует |
|
|
|
F(x2 ) − F(x1) = P(x1 ≤ X < x2 ). |
(4.2) |
Поскольку |
P(x1 ≤ X < x2 ) есть вероятность, т.е. число не отрица- |
|
тельное, то |
F(x2 ) − F(x1) ≥ 0. |
(4.3) |
|
||
Из этого свойства вытекают очень важные следствия:
вероятность того, что случайная величина примет значение из интервала [a, b) равна приращению функции распределения на этом интервале.
Действительно, если в выражении (4.2) положить x1 = a, |
x2 = b, |
то получим |
|
F(a) − F(b) = P(x1 ≤ X < x2 ). |
(4.4) |
Вероятность того, что непрерывная случайная величина примет определенное значение равна нулю.
Положим в формуле (4.2) |
x2 = x1 + x, |
тогда получим |
|
P(x1 ≤ X < x1 + |
x) = F(x1 + |
x) − F(x1). |
(4.5) |
Из математического анализа вам должно быть известно: если функция F(x) − непрерывна в точке x1 , то есть существует предел
lim F(x1 + x) = F(x1) . Тогда из формулы (4.5) будет следовать,
x→0
что при x → 0, то есть при стягивании отрезка [ x1, x1 + x] к точке x1 вероятность P(x1) = 0.
31
Так как точка x1 выбиралась нами произвольно на оси, то зна-
чит, для любого значения x непрерывной случайной величины вероятность ее реализации равна 0.
Свойство 3. F(x = −∞) = 0; F(x = +∞) = 1.
Поясним свойства функции распределения применительно к приведенному выше примеру с ростом человека. Во-первых, в нашем примере значение функции F(x) = P(X < x) будет давать
вероятность того, что рост наугад взятого человека будет менее, чем заданное число x. К примеру, если x = 1,5 м, то F(1,5 м) есть
вероятность того, что рост случайно выбранного человека будет менее полутора метров, а например, F(2 м) − что рост наугад вы-
бранного человека меньше двух метров. Понятно, что F(1,5 м) < < F(2 м) , так как вероятность выбрать человека с ростом менее
двух метров «перекрывает» вероятность выбора человека с ростом менее полутора метров. Так как в последнем случае случайно выбранный индивидуум может иметь рост как 1,2 м, так и 1,8 м. Таким образом, функция распределения действительно неотрицательная, неубывающая функция. Далее, первое следствие из свойства 2 означает, что разность двух функций F(2 м) − F(1,5 м) равна ве-
роятности того, что рост наугад выбранного человека будет лежать в пределах от полутора до двух метров. Второе следствие говорит о том, что вероятность выбора человека с конкретным значением роста полтора метра или два метра одинакова и равна нулю.
Здесь сделаем небольшое отступление и зададимся вопросом: Если вероятность события равна нулю, означает ли, что это событие невозможно? Нет, не означает! Вот такой пример с игральной костью. Мы уже знаем, что если кость имеет шесть граней, то выпадение любого числа очков одинаково и равно 1/ 6 . Например, вероятность выпадения 6 очков будет 1/ 6 . Увеличим число граней до 20, тогда вероятность выпадения любого числа очков будет 1/ 20 . Если мы будем увеличивать число граней до бесконечности, то многогранник превратится в шар, а грань − в точку на поверхности шара. Бросим шар на твердую поверхность и пометим точку поверхности шара, оказавшейся самой верхней. А теперь представим, что пометку мы сделали до броска. Тогда до броска нам интуитивно понятно: вероятность того, что шар упадет так, что конкретная, помеченная
32
нами точка поверхности шара будет наверху и равна 0. Но ведь событие произошло! Значит, вероятность события, равная нулю, не означает невозможности события! Верно и обратное. Если вероятность события равна 1, то это не означает, что событие достоверно. Действительно, если теперь под событием понимать, что шар не упадет так, что помеченная до броска точка окажется наверху, то вероятность этого события равна единице, однако, как мы видели, это событие недостоверно.
Плотность распределения непрерывной случайной величины и её свойства
Пусть имеется непрерывная случайная величина X с функцией распределения F(x). Тогда вероятность попадания значения слу-
чайной величины на отрезок от |
x до x + |
x, как следует из соот- |
||||
ношения (4.5), есть |
|
|
|
|
|
|
|
P(x ≤ X < x + x) = F(x + |
x) − F(x). |
(4.6) |
|||
При этом вероятность, приходящаяся на единицу длины отрезка |
||||||
x , есть отношение |
|
|
|
|
|
|
|
P(x ≤ X < x + x) |
= |
F(x + x) − F(x) |
. |
|
|
|
x |
|
|
|||
|
|
|
x |
|
||
Из математического анализа известно, что если предел этого отношения при x → 0 существует, то это будет производная функции
dF или более кратко |
F′ . |
Обозначим |
|
|
|||
dx |
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
dF |
= lim |
|
F(x + |
x) − F(x) |
= f (x). |
(4.7) |
|
dx |
|
|
x |
||||
|
x→0 |
|
|
||||
Функция f (x) называется плотностью распределения вероятно-
стей или для краткости будем в дальнейшем говорить «плотность распределения» случайной величины X.
Смысл введения этой величины в том, что она характеризует «локальную» структуру функции распределения. Рассмотрим такой пример. Известно, что за прошедшие несколько столетий человек стал выше ростом. Рассмотрим группу людей из 17-го века и такую
33
же по численности группу людей 21-го века. Пусть максимальный и минимальный рост в каждой группе одинаков, например,
xmax = 2 м, xmin = 1 м. (И в 17-м веке, и в 21-м веке есть карлики и великаны.) Обозначим функцию распределения вероятности вы-
брать наугад человека с ростом менее x из первой группы F1(x), а из второй F2 (x). Понятно, что F1(165 см) ≥ F2 (165 см). Совершенно
разной и будет вероятность того, что рост случайно выбранного человека из первой и второй группы будет лежать в пределах, например, от 175 до 190 см.
Вероятность попадания случайной величины X в интервал (α, β) можно выразить через плотность распределения
β |
|
P(α < X < β) = f (x) dx. |
(4.8) |
α
Примечание для особо любознательных. Почему в выражении (4.8) мы можем писать P(α < X < β) , а ранее писали P(α ≤ X < β)?
Так можно писать, потому что для непрерывной случайной величины вероятность любого отдельного значения случайной величины равна нулю, в том числе P(α) = P(β) = 0. Значит, можно включать
или не включать граничные точки отрезка в рассматриваемый интервал (в зависимости от конкретной ситуации). При этом
P(α < X < β) = P(α ≤ X < β) = P(α < X ≤ β) = P(α ≤ X ≤ β).
Если величина отрезка β − α = x достаточно мала, то вероятность |
||
попадания случайной величины в отрезок |
x приближенно равна |
|
P(α < X < β) ≈ f (x) |
x, |
(4.9) |
где значение функции f (x) вычисляется для любого x x. Между плотностью распределения f (x) и функцией распреде-
ления F(x) существует связь. Установить ее можно следующим
образом. Исходя из определения функции распределения F(x) = P(X < x) и учитывая, что −∞ < X < +∞, из формулы (4.8)
получим
x |
|
F(x) = P(−∞ < X < x) = f (t) dt. |
(4.10) |
−∞
34
Свойства плотности распределения
Свойство 1. Функция плотности распределения f (x) − неотри-
цательная:
f (x) ≥ 0.
Это является следствием того, что F(x) − неубывающая функция.
Свойство 2:
+∞
f (x) dx = 1.
−∞
x
Это свойство вытекает из того, что F(+∞) = 1, а F(x) = f (t) dt.
−∞
Отметим еще одну деталь. Функция F(x) − не имеет размерности, а функция f (x) имеет размерность, обратную размерности случайной величины.
Геометрическая интерпретация функции распределения и плотности распределения
На рис. 4.2 показана функция распределения F(x) для непре-
рывной случайной величины. Из рисунка видно, что функция неубывающая и стремится к 0 при x → −∞, и к единице при x → +∞.
Для конкретного значения x значение функции F(x) есть вероят-
ность того, что случайная величина X будет меньше заданного значения x.
На рис. 4.3 показана плотность распределения. Площадь под кривой, ограниченная прямыми x = a и x = b, имеет смысл вероят-
ности того, что случайная величина примет значение из интервала a < X < b. Площадь под кривой, ограниченная осью 0X и прямой x = x , имеет смысл функции распределения, т.е. вероятности того, что случайная величина X будет меньше, чем x.
35
Рис. 4.2. Функция распределения F(x)
Рис. 4.3. Плотность распределения непрерывной случайной величины f (x)
Напоминание. Производная и интеграл
Выше нам пришлось использовать некоторые сведения из математического анализа. Если у вас не возникло вопросов и вы помните, что такое производная функции и интеграл, то можете пропустить это напоминание. В противном случае слегка напрягитесь.
Производная. Рассмотрим следующий пример. Пусть перед вами график продаж некоторой продукции (рис. 4.4).
Предположим, что вы анализируете ситуацию за первые полгода. Если бы Вы смотрели только на число продаж, то ход кривой вас только бы радовал. Число продаж неуклонно растет! Но проведем более подробный анализ. Посчитаем, насколько каждый месяц возрастает число продаж. Для этого будем считать следующие величины: число продаж за февраль минус число продаж за январь, число продаж за март минус число продаж за февраль чис-
36
ло продаж за апрель минус число продаж за март и т.д. Если эти
разности разделить на месяц, то получим скорость продаж − количество проданной продукции за единицу времени (за месяц). Пунктирная кривая показывает, как меняется скорость продаж. Из рисунка видно, что скорость продаж падает, то есть количество продаж каждый месяц растет всё медленнее и медленнее. В августе скорость продаж равна нулю, т.е. продали столько же сколько и в июле, а, начиная с сентября и до конца года, каждый месяц количество продаж уменьшается. Так вот, если число продаж − это функция, то скорость продаж − ее производная. Очевидно, знание производной весьма полезно.
Рис. 4.4. Число и скорость продаж
В математическом плане понятие производной можно ввести следующим образом. Пусть y = f (x) есть непрерывная функция
(т.е. мы можем нарисовать график функции, не отрывая ручки от бумаги) на интервале (a, b). Пусть x − какая-нибудь точка этого
промежутка, тогда значение функции в этой точке есть y = f (x).
Дадим аргументу малое приращение x , тогда в точке x = x + x функция будет иметь значение f (x + x). Приращение функции
есть y = f (x + x) − f (x). Если соединить две точки A и B на гра-
фике функции (рис. 4.5), то получим прямую, пересекающую график.
37
Рис. 4.5. Геометрический смысл производной
Представим теперь, что точка B приближается к точке A, двигаясь вдоль кривой ( x всё время уменьшается). Нетрудно понять, что секущая «стремится» занять положение касательной к кривой в точке A . Рассмотрим теперь, как меняется отношение
y |
= |
f (x + |
x) − f (x) |
. Из рисунка видно, что при x → 0 прираще- |
x |
|
x |
||
|
|
|
ние функции также стремится к нулю: y → 0. То есть числитель
и знаменатель дроби стремятся к нулю, а их отношение − к некоторой постоянной величине. На первый взгляд, это странно. Но вот простой пример. Допустим, вы разрезали яблоко пополам, затем половинку еще пополам и т.д. При этом вы взвешиваете каждый кусочек и делите полученную массу на объем кусочка (определяете плотность яблока). Понятно, что какой бы малый кусочек вы ни взяли, плотность у него есть, и вполне определенная! Этот пример поясняет также, почему существует конечная сумма бесконечно убывающей прогрессии. Действительно, последовательно разрезая яблоко объемом V , получаем бесконечно убывающую гео-
метрическую прогрессию V2 + V4 + V8
конечно, но сама сумма V − определенное число (сложили все кусочки яблока и получили целое). В математике предел, к которому стремится отношение приращения функции к приращению аргумента при x → 0, называется производной функции
38
|
f (x + x) − f (x) |
= f ′ . |
||
|
|
|||
lim |
x |
|
x |
|
x→0 |
x очень мало, его обозначают |
|||
Вернемся снова к рисунку. Когда |
|
|||
dx . Из рисунка видно, что приращение функции в этом случае можно представить в виде суммы y = tg(α)dx + o( x) , где
o( x) − величина бесконечно малая относительно x . Если этой
величиной пренебречь, то при бесконечно малом приращении аргумента бесконечно малое приращение функции dy = fx′dx . Эта вели-
чина называется дифференциалом функции. Из этого соотношения видно, что производная в точке x численно равна тангенсу угла наклона касательной к кривой в этой точке. Отметим, что не всякая непрерывная функция имеет производную во всех точках промежутка. Например, непрерывные функции (рис. 4.6) в точках резкого излома при x = 1 не имеют производных.
Рис. 4.6. Пример непрерывных функций, не имеющих производной в точке x = 1
Таким образом, производная функции характеризует скорость ее изменения. Если взять производную от производной, т.е. вторую
производную |
d |
df |
|
= |
d 2 f |
, то мы найдем скорость изменения |
|
|
|
dx2 |
|||
|
||||||
|
dx dx |
|
|
|||
скорости функции. Физики в этом случае говорят про ускорение и приводят пример из кинематики. Действительно, если x(t) зави-
39
симость координаты вашего движущегося автомобиля от времени, то dxdt = vx (t) − скорость автомобиля (т.е. спидометр вам показывает значение первой производной), а вторая производная от
координаты |
d 2 x |
= |
dv |
x |
= ax |
−- ускорение (когда вы выбирали ав- |
dt 2 |
|
|||||
|
|
dt |
|
|
||
томобиль, то интересовались, за какое время можно набрать скорость 100 км/час, т.е. вас интересовала вторая производная!)
Если функция зависит от нескольких переменных, то предел (если он существует) отношения приращения функции к приращению аргумента называется частной производной по данному аргументу. Например, для функции двух переменных z = f (x, y) это выгля-
дит следующим образом: |
|
|
|
|
|||
|
∂f |
|
= lim |
|
f (x + x, y) − f (x, y) |
; |
|
|
∂x |
|
x |
||||
|
|
x→0 |
|
|
|
||
|
∂f |
|
= lim |
|
f (x, y + y) − f (x, y) |
. |
|
|
∂y |
|
|
||||
|
|
y→0 |
|
y |
|
|
|
Обратите внимание, что в этом случае вместо |
df |
||||
|
|
|
|
dx |
|
писать |
∂f |
. |
Кроме вторых частных производных |
∂ 2 f |
|
∂x |
∂x2 |
||||
|
|
|
|||
рассматривается также смешанная вторая производная
принято
и |
∂ 2 f |
, |
|
∂y 2 |
|||
|
|
∂ 2 f . ∂x∂y
Из физических соображений понятно, что должна существовать процедура «обратная» нахождению производной. Действительно, если, зная зависимость координаты от времени, мы можем найти скорость, то, зная зависимость от времени скорости, сможем найти координату тела. Иначе говоря, если f ′(x) произ-
водная, то можно найти функцию f (x), от которой она была по-
лучена, т.е. найти первообразную. Процесс нахождения функции по ее известной производной называется интегрированием. Мы рассмотрим ниже смысл определенного интеграла.
40
