Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Курс статистики / Модуль 1. Лекции / Тема 4. Числовые характеристики случайных величин.doc
Скачиваний:
238
Добавлен:
16.04.2015
Размер:
664.06 Кб
Скачать

Дисперсия случайной величины.

Дисперсия DX случайной величиныXопределяется формулой

DX = E(X – EX)2

Дисперсия случайной величины — это математическое ожидание квадрата отклонения случайной величины от её математического ожидания.

Рассмотрим случайную величину Xс законом распределения

X

1

2

3

Р

Вычислим её математическое ожидание.

EX = 1 + 2 + 3 = 

Составим закон распределения случайной величины X – EX

X– EX

Р

а затем закон распределения случайной величины (X-EX)2

(X– EX)2

Р

Теперь можно рассчитать величину DX :

DX = ++=

Замечание. Более удобной для вычисления может оказаться следующая формула, которую можно рассматривать как одно из свойств дисперсии:

DX = EX2 – (EX)2

Таким образом, дисперсия случайной величины равна разности мате­матического ожидания квадрата случайной величины и квадрата её математи­ческого ожидания. Для использования этой формулы нужно составить таблицу:

X2

1

4

9

Р

и провести вычисления EX2 и (EX)2 по описанной схеме.

Пример.

Найти дисперсию случайной величины, заданной законом распределения

X

1

0

Р

p

q

Выше было показано, что EX=р. Легко видеть, чтоEX2=р. Таким образом, получается, чтоDX=рр2=pq.

Дисперсия характеризует степень рассеяния значений случайной величины относительно её математического ожидания. Если все значения случайной величины тесно сконцентрированы около её математического ожидания и большие отклонения от математического ожидания маловероятны, то такая случайная величина имеет малую дисперсию. Если значения случайной величины рассеяны и велика вероятность больших отклонений от математического ожидания, то такая случайная величина имеет большую дисперсию.

Пример

Найти дисперсию случайной величины Х, равномерно распределенной на [a,b]

Свойства дисперсии.

  1. Если k – число, то D(kX) =k2 DX.

  2. Для попарно независимых случайных величин X1,X2,,Xnсправедливо равенство

  1. Если Х и Y независимы, D(X+Y) =DX+DY.

Предлагаем в качестве упражнения рассмотреть, чему равняется D(X– Y) в тех же условиях

Неравенства Маркова и Чебышева

Неравенства Маркова дают оценку для значений случайной величины в тех случаях, когда наши знания о случайной величине ограничиваются ее математическим ожиданием и дисперсией, и, хотя эти оценки достаточно грубы, они требуют минимальной информации о рассматриваемой случайной величине.

Если возможные значения дискретной случайной величины Х неотрицательны и существует ее математическое ожидание ЕХ = а , то для любого числа с > 0 справедливо неравенство

Р (Х <с ) >1 – а / с

Соответственно, выполняется и неравенство

Р (Х ≥ с ) ≤ а / с

Эти неравенства называются (первым и вторым) неравенствами Маркова

Пример 9.4. Пусть X — время опоздания студента на

лекцию, причем известно, что ЕХ = 1 мин. Воспользовавшись

первым неравенством Чебышева, оценим вероятность Р{Х >5}

того, что студент опоздает не менее, чем на 5 мин.

Имеем P(X≥5) ≤EX/5

Таким образом, искомая вероятность не более 0,2, т.е. в среднем,

из каждых пяти студентов опаздывает по крайней мере на 5 мин не более чем один студент.

Если Х – случайная величина, математическое ожидание которой ЕХ = а , дисперсия DХ конечна, то для любого числа с > 0 выполняются неравенства

P ( | X – a | ≥ c ) ≤DX / c2

P ( | X – a | < c ) >1 – DX / c2

Данные неравенства называются (первым и вторым) неравенствами Чебышева

Замечание. Иногда и неравенства Маркова и неравенства Чебышева называются первым и вторым неравенствами Чебышева.

Пример. Пусть в условиях предыдущего примера известно дополнительно, что а = y/DX = 1. Оценим минимальное значение хо, при котором вероятность опоздания студента на время не менее хо не превышает заданного значения Р3 = 0,1.

Для решения поставленной задачи воспользуемся неравенством Чебышева. Тогда

Р3 ≤ Р{Х ≥х0} = Р{Х - ЕX ≥ хо - ЕX} ≤ Р{|Х – EХ| >х0- EX}≤

Значит,

и

И, подставляя конкретные значения, имеем

Таким образом, вероятность опоздания студента на время более 4,16 мин не более 0,1.

Сравнивая полученный результат с результатом предыдущего примера можно заметить, что дополнительная информация о дисперсии времени опоздания позволяет дать более точную оценку искомой вероятности.

Замечание. Элементарным следствием из неравенства Чебышева является Закон больших чисел (в форме Чебышева):

Определение. (Начальным)Моментом порядка k случайной величины Х называется число mk = Е(Хk )

Определение. (Центральным) моментом порядка k случайной величины Х называется число μk = Е(Х–ЕХ)k

Замечание. Нетрудно видеть, что математическое ожидание – начальный момент первого порядка, а дисперсия – центральный момент второго порядка.

Замечание.Если плотность распределения вероятностей непрерывной случайной величины симметрична относительно прямой x = EX , то все ее центральные моменты нечетного порядка равны нулю.

В тех случаях, когда какие-нибудь причины благоприятствуют более частому

появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения.

Определение. Асимметрией А случайной величины Х называют отношение третьего центрального момента к кубу среднеквадратичного отклонения. А=μ3 / σ3

(по Е.В.Сидоренко)

Асимметрия - величина, характеризующая степень асимметрии распределения относительно математического ожидания.: Если коэффициент асимметрии отрицателен, то либо большая часть значений случайной величины, либо мода находятся левее математического ожидания, и наоборот, если больше нуля , то правее.

В тех случаях, когда какие-нибудь причины благоприятствуют более частому

появлению значений, которые выше или, наоборот, ниже среднего, образуются асимметричные распределения. При левосторонней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней,

или отрицательной - более высокие

Очевидно, что для случайной величины, распределенной симметрично относительно математического ожидания, асимметрия равна нулю.

В тех случаях, когда какие-либо причины способствуют преимущественному

появлению средних или близких к средним значений, образуется распределение с положительным эксцессом. Если же в распределении преобладают крайние значения, причем одновременно и более низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться впадина, превращающая его в двувершинное (см следующий рисунок эксцесса).

Определение. Эксцессом γ случайной величины Х называют отношение

 = (μ4 / σ4 ) –3

Эксцесс: а) положительный; 6) отрицательный. В распределениях с нормальной выпуклостьюγ =0.

Нормальное распределение наиболее часто используется в теории вероятностей и в математической статистике, поэтому график плотности вероятностей нормального распределения стал своего рода эталоном, с которым сравнивают другие распределения. Одним из параметров, определяющих отличие распределения случайной величины Х от нормального распределения, как раз и является эксцесс. Для нормального распределения γ=0, если γ >0 , то это значит, что график плотности «заострен» сильнее, чем у нормального, а если γ<0, то, соответственно, меньше.

Определение. Квантилью уровня α или α-квантилью (0<α<1) называют число Qα, удовлетворяющее неравенствам Р{X < Qα }≤α и P{X> Qα } ≤ 1 – α

½ -квантиль называют также Медианой М случайной величины Х.

Для непрерывной случайной величины Х α-квантиль Qα – это такое число, меньше которого Х принимает значение с вероятностью α.

Если известна плотность распределения ρ(х) случайной величины Х, то, учитывая связь между функцией распределения и плотностью, уравнение для определения квантили можно записать как

Иначе говоря, квантиль Qα – решение уравнения F(Qα )=α ,

Пример.

Найдем α-квантиль и медиану экспоненциального распределения

(Непрерывная случайная величина Х имеет показательное распределение с параметром  > 0, если она принимает только неотрицательные значения, а ее плотность распределения имеет вид: (х) = е-х , x≥0 и 0, если х <0

, поэтому , а медиана равна

Определение. Модой непрерывной случайной величины называют точку максимума (локального) плотности распределения р(х). Различают унимодальные (имеющие одну моду), бимодальные (имеющие две моды) и мулътимодальные (имеющие несколько мод) распределения.

Для определения моды дискретной случайной величины предположим сначала, что ее значения x1, … xn расположены в порядке возрастания.

Модой дискретной случайной величины называют такое значение хi, при котором для вероятностей выполняются неравенства

pi-1 < pi и pi+1 < рi

В случае дискретных случайных величин распределения также могут быть унимодальными, бимодальными и мультимодальными.

Наивероятнейшим значением называют моду, при которой достигается глобальный максимум вероятности (дискретной случайной величины) или плотности распределения (непрерывной случайной величины).

Если распределение унимодальное, то мода также будет наивероятнейшим значением.