
Конспект лекций Глазова / 3.5. Характ. положения
.doc3.5. Характеристики положения.
Распределения,
встречающиеся в практических приложениях
теории вероятностей, чрезвычайно
разнообразны. Распределение может быть
сосредоточено на конечном, полубесконечном
или бесконечном интервале; быть
симметричным, умеренно несимметричным
или крайне несимметричным; обладать
одним (унимодальное) или несколькими
(полимодальное) максимумами, или вовсе
не иметь максимума. В литературе были
сделаны различные попытки классификации
форм распределений. Например, для
непрерывных распределений можно выделить
в один класс симметричные распределения
с одним максимумом, в другой - асимметричные
распределения с одним максимумом, в
третий - крайне асимметричные или
J-образные,
в четвертый -
-образные
(антимодальные), в пятый - распределения
других форм. Такого рода классификации
не обладают необходимой четкостью и
однозначностью, и не приносят существенной
практической пользы. Другой подход к
характеризации формы и свойств
распределений - использование числовых
характеристик, названных в п. 3.4
характеристиками положения. Некоторые
из них являются моментами (начальными
или центральными), другие образованы с
помощью моментов или сконструированы
на других принципах. Число предложенных
и используемых числовых характеристик
велико. Назовем и охарактеризуем лишь
несколько важнейших из них.
-
Минимальное и максимальное значения СВ (если они существуют) указывают диапазон возможных значений СВ.
-
Центр тяжести распределения выражается математическим ожиданием m и указывает то значение СВ, вокруг которого группируются наблюдаемые на опыте ее значения; о статистической и математической важности этой величины сказано в п. 3.4.
-
Для применений теории вероятностей очень важно определить теоретическую меру разброса значений СВ. Буквальное решение этой задачи возможно только если СВ имеет и максимальное и минимальное значения. В этом случае в качестве меры разброса значений можно взять разность xmax-xmin этих значений (абсолютный разброс) или отношение этой разности, например, к математическому ожиданию (относительный разброс). В случае же если СВ неограничена слева, или справа, или с обеих сторон, буквального решения задачи не существует, и приходится обратиться к мере эффективного разброса (рассеяния), также, как в радиотехнике мы обращаемся к эффективной ширине импульса. В качестве меры эффективного разброса можно использовать по разному сконструированные величины. Как и в случае эффективной ширины импульса, для непрерывных СВ можно использовать отношение интеграла от плотности f(x) к ее максимальному значению (эта мера аналитически неудобна и не годится для дискретных СВ), или расстояние между точками, в которых плотность принимает определенные, по отношению к максимальному, значения, и т. д. Однако наиболее универсальной (применимой к СВ обоих типов) и наиболее удобной при решении теоретических задач оказалась мера рассеяния, основанная на моменте. Поучительно самостоятельно прийти к нужной характеристике:
а) Для того, чтобы искомая характеристика была инвариантна к сдвигу распределения в целом, следует взять центральный момент.
б) Для того, чтобы отрицательные значения случайной величины не компенсировали при интегрировании (суммировании) вклад положительных значений, следует взять момент четного порядка.
в) Поскольку центральный момент нулевого порядка тождественно равен единице, следует взять следующий по порядку четный момент:
. Именно эта характеристика разброса чаще всего применяется. Само ее название - дисперсия (от английского dispersion - рассеивание) и обозначение приспособлены для этой роли.
К сожалению, мера разброса в виде дисперсии не всегда применима: если второй центральный момент конкретной СВ расходится (см. п. 3.4), приходится использовать другие меры разброса, например, указанные выше.
-
Дисперсия имеет размерность квадрата СВ; для наглядности характеристики рассеивания удобнее пользоваться величиной с размерностью СВ. Для этого из дисперсии извлекают положительный квадратный корень; полученная величина называется средним квадратичным отклонением (сокращенно - с. к. о.) и обозначается
(возможно, с нижним индексом, указывающим на принадлежность к конкретной СВ).
-
В качестве меры относительного разброса значений берут величину относительного среднеквадратичного отклонения
.
-
Мода (модальное значение) xmod удобна только для непрерывных СВ с непрерывной плотностью вероятности f(x). В этом случае по определению xmod - точка локального максимума f(x). Как сказано выше, мода может быть одна, их может быть несколько или не быть ни одной. Иногда в случае нескольких мод точку глобального максимума функции f(x) называют главной модой, а в случае отсутствия мод в непрерывной f(x) точку xantmod минимума называют антимодой. Мода - это значение на оси абсцисс в графике f(x), и имеет размерность СВ; ее не следует путать с максимальным значением плотности вероятности f(xmod).
-
Медиана xmed удобна только для непрерывных СВ В этом случае по определению xmed есть такое значение СВ, что вероятности принятия значений больших и меньших, чем оно, одинаковы и составляют по 0.5 (поскольку сумма этих вероятностей, по условию нормировки, равна 1). Поскольку функция распределения в этой точке равна 0.5, медиану можно найти как корень уравнения
F(x)=0.5.
Для непрерывной СВ медиана всегда существует, единственна и имеет размерность СВ.
-
Важными характеристиками распределения являются степень и знак его асимметрии. Трудность количественного определения этих понятий кроется в том, что они наглядны только для простых форм распределений. На рис. 3.5.1 показаны распределения простой формы с положительной и отрицательной асимметрией.
Рисунок 3.5.1.
Плотности вероятности с положительной (+) и отрицательной (-) асимметрией.
В случае распределения сложной формы, глядя на кривую плотности вероятности, мы иногда можем лишь констатировать наличие асимметрии, но не ее величину и знак. Чтобы подготовиться к количественному описанию асимметрии распределения, установим некоторые свойства симметричного распределения.
а) Пусть плотность вероятности f(x) непрерывной СВ унимодальна и симметрична относительно некоторой точки а. Тогда очевидно, что для этой СВ m=xmod=xmed=a , т. е. математическое ожидание, мода и медиана совпадают и находятся в т. а. Это важное свойства симметричных распределений неоднократно понадобится в дальнейшем. Если симметричная плотность не унимодальна, то мода не обязательно находится в т. а ,но по-прежнему m=xmed=a.
б) Пусть плотность fx(x) случайной величины X симметрична относительно а , т. е. относительно mx , тогда плотность fy(y) центрированной случайной величины Y=X0 - четная функция. Центральный момент нечетного порядка СВ X, при условии, что он существует, равен начальному моменту того же порядка СВ Y, т. е.
=0
(k
- нечетно),
т. к. под интегралом - произведение нечетной и четной функций, т. е. функция нечетная. Таким образом, при симметричном распределении все существующие центральные моменты нечетного порядка равны нулю. Нетрудно показать, что этот же вывод справедлив и для дискретного распределения.
Теперь обратимся к конструированию количественной меры асимметрии распределения. Это должно быть алгебраическое число, знак которого совпадает со знаком асимметрии, а модуль находится в монотонно возрастающей зависимости от степени асимметрии, причем для симметричного распределения оно должно быть равно нулю. Это число не должно зависеть ни от сдвига распределения по горизонтали, ни от его дисперсии. Существует несколько возможностей определить такое число. Например, можно взять отношение
,
удовлетворяющее всем поставленным требованиям. Но наиболее удобным в теоретическом и практическом отношении оказалась мера, основанная на моменте. Поучительно самостоятельно прийти к этой мере:
а) Для независимости от сдвига распределения в целом необходим центральный момент.
б) Для получения нуля при симметрии и нужного знака при асимметрии порядок момента должен быть нечетным.
в) Поскольку
центральный момент первого порядка
тождественно равен нулю, берем следующий
по порядку
.
г) Поскольку, как
будет показано в дальнейшем,
пропорционален
, для независимости
от дисперсии необходимо взять отношение
.
Полученная величина
называется коэффициентом
асимметрии,
используется как для непрерывных, так
и для дискретных СВ, и удовлетворяет
всем поставленным требованиям. К
сожалению, эта мера асимметрии не может
использоваться, если
расходится; тогда приходится брать
какую-либо другую меру, например,
указанную выше.
-
Иногда в качестве характеристики положения используют так называемый коэффициент эксцесса
,
не зависящий от сдвига распределения в целом и от дисперсии, считая, что для распределений, близких к т. н. нормальному, он алгебраически оценивает меру выпячиваемости кривой плотности в области максимума. Как оказалось, это не всегда верно, к тому же для распределений общего вида эта мера трудно интерпретируется. Тем не менее коэффициент эксцесса с успехом применяется для приближенного представления плотности вероятности с помощью небольшого числа числовых характеристик.
-
Существуют и другие характеристики положения, более подробно характеризующие форму распределения, например, квантили, квартили, децили, которые мы не рассматриваем.