Дисперсия случайной величины.
Дисперсия DX случайной величиныXопределяется формулой
DX = E(X – EX)2
Дисперсия случайной величины — это математическое ожидание квадрата отклонения случайной величины от её математического ожидания.
Рассмотрим случайную величину Xс законом распределения
-
X
1
2
3
Р



Вычислим её математическое ожидание.
EX = 1
+ 2
+ 3
= ![]()
Составим закон распределения случайной величины X – EX
-
X– EX



Р



а затем закон распределения случайной величины (X-EX)2
-
(X– EX)2



Р



Теперь можно рассчитать величину DX :
DX =
+
+
=![]()
Замечание. Более удобной для вычисления может оказаться следующая формула, которую можно рассматривать как одно из свойств дисперсии:
DX = EX2 – (EX)2
Таким образом, дисперсия случайной величины равна разности математического ожидания квадрата случайной величины и квадрата её математического ожидания. Для использования этой формулы нужно составить таблицу:
-
X2
1
4
9
Р



и провести вычисления EX2 и (EX)2 по описанной схеме.
Пример.
Найти дисперсию случайной величины, заданной законом распределения
-
X
1
0
Р
p
q
Выше было показано, что EX=р. Легко видеть, чтоEX2=р. Таким образом, получается, чтоDX=р–р2=pq.
Дисперсия характеризует степень рассеяния значений случайной величины относительно её математического ожидания. Если все значения случайной величины тесно сконцентрированы около её математического ожидания и большие отклонения от математического ожидания маловероятны, то такая случайная величина имеет малую дисперсию. Если значения случайной величины рассеяны и велика вероятность больших отклонений от математического ожидания, то такая случайная величина имеет большую дисперсию.
Пример
Найти дисперсию случайной величины Х, равномерно распределенной на [a,b]

Свойства дисперсии.
Если k – число, то D(kX) =k2 DX.
Для попарно независимых случайных величин X1,X2,,Xnсправедливо равенство
![]()
Если Х и Y независимы, D(X+Y) =DX+DY.
Предлагаем в качестве упражнения рассмотреть, чему равняется D(X– Y) в тех же условиях
Неравенства Маркова и Чебышева
Неравенства Маркова дают оценку для значений случайной величины в тех случаях, когда наши знания о случайной величине ограничиваются ее математическим ожиданием и дисперсией, и, хотя эти оценки достаточно грубы, они требуют минимальной информации о рассматриваемой случайной величине.
Если возможные значения дискретной случайной величины Х неотрицательны и существует ее математическое ожидание ЕХ = а , то для любого числа с > 0 справедливо неравенство
Р (Х <с ) >1 – а / с
Соответственно, выполняется и неравенство
Р (Х ≥ с ) ≤ а / с
Эти неравенства называются (первым и вторым) неравенствами Маркова
Пример 9.4. Пусть X — время опоздания студента на
лекцию, причем известно, что ЕХ = 1 мин. Воспользовавшись
первым неравенством Чебышева, оценим вероятность Р{Х >5}
того, что студент опоздает не менее, чем на 5 мин.
Имеем P(X≥5) ≤EX/5
Таким образом, искомая вероятность не более 0,2, т.е. в среднем,
из каждых пяти студентов опаздывает по крайней мере на 5 мин не более чем один студент.
Если Х – случайная величина, математическое ожидание которой ЕХ = а , дисперсия DХ конечна, то для любого числа с > 0 выполняются неравенства
P ( | X – a | ≥ c ) ≤DX / c2
P ( | X – a | < c ) >1 – DX / c2
Данные неравенства называются (первым и вторым) неравенствами Чебышева
Замечание. Иногда и неравенства Маркова и неравенства Чебышева называются первым и вторым неравенствами Чебышева.
Пример. Пусть в условиях предыдущего примера известно дополнительно, что а = y/DX = 1. Оценим минимальное значение хо, при котором вероятность опоздания студента на время не менее хо не превышает заданного значения Р3 = 0,1.
Для решения поставленной задачи воспользуемся неравенством Чебышева. Тогда
Р3
≤ Р{Х ≥х0}
= Р{Х - ЕX ≥ хо
- ЕX} ≤ Р{|Х – EХ|
>х0-
EX}≤
![]()
Значит,
и
![]()
И,
подставляя конкретные значения, имеем
![]()
Таким образом, вероятность опоздания студента на время более 4,16 мин не более 0,1.
Сравнивая полученный результат с результатом предыдущего примера можно заметить, что дополнительная информация о дисперсии времени опоздания позволяет дать более точную оценку искомой вероятности.
Замечание. Элементарным следствием из неравенства Чебышева является Закон больших чисел (в форме Чебышева):
Определение. (Начальным)Моментом порядка k случайной величины Х называется число mk = Е(Хk )
Определение. (Центральным) моментом порядка k случайной величины Х называется число μk = Е(Х–ЕХ)k
Замечание. Нетрудно видеть, что математическое ожидание – начальный момент первого порядка, а дисперсия – центральный момент второго порядка.
Замечание.Если плотность распределения вероятностей непрерывной случайной величины симметрична относительно прямой x = EX , то все ее центральные моменты нечетного порядка равны нулю.
В тех случаях, когда какие-нибудь причины благоприятствуют более частому
появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения.
Определение. Асимметрией А случайной величины Х называют отношение третьего центрального момента к кубу среднеквадратичного отклонения. А=μ3 / σ3

(по Е.В.Сидоренко)
Асимметрия - величина, характеризующая степень асимметрии распределения относительно математического ожидания.: Если коэффициент асимметрии отрицателен, то либо большая часть значений случайной величины, либо мода находятся левее математического ожидания, и наоборот, если больше нуля , то правее.
В тех случаях, когда какие-нибудь причины благоприятствуют более частому
появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней,
или отрицательной - более высокие
Очевидно, что для случайной величины, распределенной симметрично относительно математического ожидания, асимметрия равна нулю.
В тех случаях, когда какие-либо причины способствуют преимущественному
появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (см следующий рисунок эксцесса).
Определение. Эксцессом γ случайной величины Х называют отношение
= (μ4 / σ4 ) –3


Эксцесс: а) положительный; 6) отрицательный. В распределениях с нормальной выпуклостьюγ =0.
Нормальное распределение наиболее часто используется в теории вероятностей и в математической статистике, поэтому график плотности вероятностей нормального распределения стал своего рода эталоном, с которым сравнивают другие распределения. Одним из параметров, определяющих отличие распределения случайной величины Х от нормального распределения, как раз и является эксцесс. Для нормального распределения γ=0, если γ >0 , то это значит, что график плотности «заострен» сильнее, чем у нормального, а если γ<0, то, соответственно, меньше.
Определение. Квантилью уровня α или α-квантилью (0<α<1) называют число Qα, удовлетворяющее неравенствам Р{X < Qα }≤α и P{X> Qα } ≤ 1 – α
½ -квантиль называют также Медианой М случайной величины Х.
Для непрерывной случайной величины Х α-квантиль Qα – это такое число, меньше которого Х принимает значение с вероятностью α.
Если известна плотность распределения ρ(х) случайной величины Х, то, учитывая связь между функцией распределения и плотностью, уравнение для определения квантили можно записать как

Иначе говоря, квантиль Qα – решение уравнения F(Qα )=α ,
Пример.
Найдем α-квантиль и медиану экспоненциального распределения
(Непрерывная случайная величина Х имеет показательное распределение с параметром > 0, если она принимает только неотрицательные значения, а ее плотность распределения имеет вид: (х) = е-х , x≥0 и 0, если х <0
,
поэтому
,
а медиана равна
Определение. Модой непрерывной случайной величины называют точку максимума (локального) плотности распределения р(х). Различают унимодальные (имеющие одну моду), бимодальные (имеющие две моды) и мулътимодальные (имеющие несколько мод) распределения.
Для определения моды дискретной случайной величины предположим сначала, что ее значения x1, … xn расположены в порядке возрастания.
Модой дискретной случайной величины называют такое значение хi, при котором для вероятностей выполняются неравенства
pi-1 < pi и pi+1 < рi
В случае дискретных случайных величин распределения также могут быть унимодальными, бимодальными и мультимодальными.
Наивероятнейшим значением называют моду, при которой достигается глобальный максимум вероятности (дискретной случайной величины) или плотности распределения (непрерывной случайной величины).
Если распределение унимодальное, то мода также будет наивероятнейшим значением.
