
- •Глава 4
- •§ 1. Основные понятия теории вероятностей и их применение к оценке рисков
- •1. Случайные испытания и пространство элементарных событий
- •2. Понятие вероятности
- •Условная вероятность и связанные с ней понятия
- •4. Случайные величины
- •5. Распределение случайной величины
- •6. Характеристики распределений
6. Характеристики распределений
Характеристики положения центра распределения
случайной величины
Риск невозможно определить точно, поэтому при оценке риска важное значение имеют статистические методы, позволяющие определить наиболее вероятные величины риска. В статистике такие величины называются характеристиками положения центра распределения случайной величины. Наибольшую практическую значимость имеют три характеристики: математическое ожидание, медиана и мода.
Математическим ожиданием М(ξ) дискретной случайной величины ξ называется взвешенная сумма всех ее возможных значений с весовыми коэффициентами, равными вероятностям этих значений:
.
Для непрерывной случайной величины имеющей плотность распределения f(х), математическое ожидание определяется формулой:
.
Математическое ожидание является мерой центральной тенденции случайной величины, или средним по вероятности ее значением. В физическом смысле, точка с абсциссой х = М(ξ) является координатой центра тяжести фигуры, образованной осью абсцисс и графиком плотности распределения.
Математическое ожидание имеет несколько важных свойств, выполняющихся как для дискретных, так и для непрерывных случайных величин:
Математическое ожидание постоянной величины равно этой постоянной:
М(С) = С,
где С — константа.
Добавление константы к случайной величине и ее умножение на константу приводят к аналогичным изменениям математического ожидания, т. е. для любых констант а, b и любой случайной величины ξ
.
Для любых случайных величин ξ и η математическое ожидание их суммы равно сумме их математических ожиданий:
.
Если случайные величины ξ и η независимы, то математическое ожидание их произведения равно произведению их математических ожиданий:
.
В некоторых случаях наиболее информативной характеристикой случайной величины является не средневероятное, а наиболее часто встречающееся ее значение. Такая характеристика называется модой. Распределение может иметь не один, а несколько локальных максимумов вероятности, — такое распределение называется мультимодальным, или полимодальным (рис. 4.16). Распределение с единственным максимумом плотности вероятности называется унимодальным. Для симметричных унимодальных распределений значения математического ожидания и моды совпадают.
Еще одна практически важная обобщенная характеристика распределения — медиана. Медианой случайной величины ξ называется такое значение q, для которого ξ с равной вероятностью принимает значения, меньшие q и большие q, т. е.
=
=
.
Рис. 4.15. Математическое ожидание Рис. 4.16. Мода распределения случайной
(М ) и медиана – случай несимметричного величины – случай бимодального распре-
Распределения деления
В случае непрерывной случайной величины прямая х = q делит фигуру, ограниченную функцией плотности, на две части с равными площадями.
Медиана, как и математическое ожидание, может рассматриваться в качестве характеристики общей тенденции случайной величины Для симметричных распределений медиана совпадает с математическим ожиданием, а если к тому же распределение унимодально, то и с модой. В частности, для нормального распределения математическое ожидание, медиана и мода равны параметру распределения а. Несовпадение медианы с математическим ожиданием служит простейшим признаком асимметричности распределения случайной величины (рис. 4.15).
Характеристики рассеяния случайной величины
Наряду с наиболее вероятным значением риска важное значение имеет разброс возможных значений риска относительно его центрального значения. Учет разброса показателей необходим и при решении задач социально-гигиенического мониторинга.
Наиболее распространенными характеристиками разброса случайной величины являются дисперсия и среднеквадратичное отклонение.
Дисперсия случайной величины ξ обозначаемая как D (ξ) (используются также обозначения V (ξ) и σ2 (ξ)), характеризует наиболее вероятное значение квадрата отклонения случайной величины от своего математического ожидания.
Для дискретной случайной величины, принимающей значения хi с вероятностями рi, дисперсия определяется как взвешенная сумма нитратов отклонений хi от математического ожидания ξ с весовыми коэффициентами, равными соответствующим вероятностям:
D(ξ)
=
Для непрерывной случайной величины ξ ее дисперсия определяется по формуле:
D(ξ)
=
Дисперсия обладает следующими практически важными свойствами:
Дисперсия любой случайной величины неотрицательна:
D(ξ) ≥ 0
Дисперсия постоянной величины равна 0:
D(C) = 0
где С — константа.
Дисперсия случайной величины ξ равна разности между математическим ожиданием квадрата этой случайной величины и квадратом математического ожидания ξ:
D(ξ)
= M
[ξ
– M
(ξ)]2
=
M(ξ2)
– (
.
Прибавление константы к случайной величине не изменяет дисперсии; умножение случайной величины на константу а приводит к умножению дисперсии на а2 :
D(aξ + b) = a2 D(ξ),
где а и b — константы.
Дисперсия суммы независимых случайных величин равна сумме их дисперсий:
,
где ξ и η - независимые случайные величины.
Среднеквадратичным отклонением случайной величины ξ (используются также термин «стандартное отклонение») называется число σ(ξ) равное квадратному корню из дисперсии ξ:
.
Среднеквадратичное отклонение измеряет отклонение случайной нвеличины от ее математического ожидания в тех же величинах, в которых измеряется сама случайная величина (в отличие от дисперсии, размерность которой равна квадрату размерности исходной случайной величины). Для нормального распределения среднеквадратичное отклонение равно параметру σ. Таким образом, математическое ожидание и стандартное отклонение представляют собой полный набор характеристик нормального распределения и однозначно определяют вид плотности распределения. Для распределений, отличающихся от нормального, эта пара показателей не является столь же эффективной характеристикой распределения.
В качестве характеристики рассеяния случайной величины используется также коэффициент вариации. Коэффициентом вариации случайной величины ξ имеющей ненулевое математическое ожидание, называется число V (ξ) равное отношению среднеквадратичного отклонения ξ к ее математическому ожиданию:
V(ξ)
=
Коэффициент вариации измеряет рассеяние случайной величины в долях ее математического ожидания и часто выражается в процентах от последнего. Этой характеристикой не следует пользоваться, если математическое ожидание близко к 0 или существенно меньше стандартного отклонения (в этом случае малые ошибки при определении математического ожидания приводят к высокой погрешности для коэффициента вариации), а также, если вид плотности распределении существенно отличается от гауссовского.
Коэффициент асимметрии (As) определяет 3-ю степень отклонении случайной величины от математического ожидания и определяется по формуле:
As
(ξ)
=
На практике этот показатель используется в качестве оценки симметричности распределения. Для любого симметричного распределения он равен 0. Если же плотность распределения несимметрична (что часто может иметь место при оценке риска смерти и рисков, связанных с загрязнением воды и воздуха), то положительный коэффициент асимметрии соответствует случаю, когда левое плечо кривой плотности круче правого, а отрицательный — случаю, когда правое плечо круче левого (рис 4.17).
Для асимметричных распределений стандартное отклонение не является хорошим показателем рассеяния случайной величины. Для характеристики рассеяния в этом случае можно использовать такие показатели, как квартили, квантили и процентили.
Первой квартилью случайной величины ξ, имеющей функцию распределения F(х), называется число Q1 являющееся решением уравнения
F(Q1) = 1/4
т. е. такое число, для которого вероятность того, что ξ принимает значения, меньшие Q1, равна 1/4, вероятность того, что она принимает значения, большие Q1 равна 3/4.
Второй квартилью (Q2) случайной величины называется ее медиана, а третьей (Q3) — решение уравнения
F(Q3) = 3/4
Квартили делят ось абсцисс на 4 интервала: [-∞,Q1], [Q1, Q2], [Q2, Q3] и [Q3, + ∞] в каждый из которых случайная величина попадает c равной вероятностью, а фигуру, ограниченную осью абсцисс и графиком плотности распределения — на 4 области с одинаковой площадью. И интервале между первой и третьей квартилями сосредоточено 50% распределения случайной величины. Для симметричных распределений первая и третья квартили одинаково удалены от медианы.
Квантилью порядка р случайной величины ξ с функцией распределения F(х) называется число х, являющееся решением уравнения
F(х) = р.
Таким образом, квартили являются квантилями порядка 0,25, 0,5 и 0,75. Если порядок квантили р выражается в процентах, то соответствующие значения х называются процентилями, или р-процентными точками распределения.
На рис. 4.18 показаны, наряду с квантилями, 2,5- и 97,5-процентные точки распределения. Между этими точками сосредоточено 95% распределения случайной величины, поэтому заключенный между ними интервал называют 95 %-м доверительным интервалом среднего (в частности, при оценке рисков — 95 %-м доверительным интервалом риска).
Задача 2. Какие из перечисленных ниже сведений о случайной величине ξ позволяют отвергнуть предположение о том, что она распределена по нормальному закону:
а) ξ — дискретная случайная величина;
б) математическое ожидание ξ отрицательно;
в) распределение ξ унимодально;
г) математическое ожидание ξ не равно ее медиане;
д) коэффициент асимметрии ξ отрицателен;
е) стандартное отклонение ξ больше ее математического ожидания;
ж) ξ характеризует распределение продолжительности острых заболеваний органов дыхания на исследуемой территории;
з) ξ характеризует распределение продолжительности жизни на исследуемой территории;
и) медиана ξ не совпадает с центром интервала между первой и третьей квартилями.
Ответ: Предположение о нормальном законе распределения случайной величины несовместимо с утверждениями а), г), д), з), и).
Рис. 4.17. Зависимость между знаком Рис.4.18. Квартили и процентили:
коэффициента асимметрии и формой иллюстрация с помощью функции
функции плотности распределения
Многомерные случайные величины и их функции распределения
Многомерные случайные величины используются для описания комплексного эффекта множественных факторов риска, а в задачах социально-гигиенического мониторинга — для комплексного анализа факторов внешней среды и показателей здоровья.
Совокупность m функций, определенных на одном и том же пространстве элементарных событий, называется т-мерной случайной величиной ξ = {ξ1, …, ξm}. Многомерная случайная величина полностью определяется функцией совместного распределения вероятностей:
F (x1, …, xm) = P(ξ1 ≤ x1, … , ξm ≤ xm),
удовлетворяющей следующим условиям:
0 ≤ F (x1, …, xm) ≤ 1 (все значения многомерной функции распределения лежат в интервале от 0 до 1);
F(х1, ..., хт) — неубывающая функция по любому аргументу;
F(х1, ..., хт) стремится к 0, когда все ее аргументы стремятся к -∞;
F(х1, ..., хт) стремится к 1, когда все ее аргументы стремятся к +∞;
Если Fi(хi) — функция распределения одномерной случайной величины ξi, то F(х1, ..., хт) стремится к Fi(хi), когда все ее аргументы, за исключением xi, стремятся к +∞.
Одномерные функции ξ1 и ξ2 называются независимыми, если их совместная функция распределения равна произведению одномерных функций распределения:
F(x1, x2) = F1 (x1) F2 (x2).
Представление о независимости одномерных случайных величин Необходимо для понимания понятия независимых испытаний (см. §2).