Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Osnovnye_ponyatia_matematicheskoy_statistiki (1...docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
520.03 Кб
Скачать

Выбор меры центральной тенденции в зависимости от типа измерительной шкалы

Тип шкалы

Меры центральной тенденции

Номинальная

Мода

Ранговая

Мода, медиана

Интервальная

Мода, медиана, среднее

Отношений

Мода, медиана, среднее

      1. Меры изменчивости

Для характеристики «рассеяния» значений около «центра» используют оценки дисперсии, среднего квадратичного и среднего абсолютного отклонения.

Дисперсия определяется по формуле

(1.5)

Дисперсия не удовлетворяет свойству несмещенности, в качестве несмещенной оценки дисперсии используют величину

.

(1.6)

Ценность дисперсии заключается в том, что, являясь мерой варьирования числовых значений признака вокруг его среднего значения, она измеряет внутреннюю изменчивость значений признака, зависящую от разностей между наблюдениями.

Чем больше дисперсия выборки, тем больше разбросаны наши исходные значения по числовой оси относительно среднего значения выборки.

Дисперсия является мерой изменчивости, вариации признака и представляет собой средний квадрат отклонений случаев от среднего значения признака.

В отличии от других показателей вариации дисперсия может быть разложена на составные части, что позволяет тем самым оценить влияние различных факторов на вариацию признака. Дисперсия - один из существеннейших показателей, характеризующих явление или процесс, один из основных критериев возможности создания достаточно точных моделей.

Поскольку оценка – это случайная величина, то показателем разброса значений случайной величины около ее математического ожидания является дисперсия. Так как математические ожидания несмещенных оценок равны оцениваемому параметру, следовательно, они одинаковы, следовательно, естественно считать лучшей, более эффективной ту оценку, у которой меньше дисперсия. В табл. 1 приведены оценки основных числовых характеристик случайной величины (математического ожидания, дисперсии, вероятности) и их свойств.

Таблица 3

Оценки основных числовых характеристик случайной величины

Характеристика

Оценка

Свойства

состоятельность

несмещенность

эффективность

М(Х)

да

да

да

D(X)

да

нет

-

да

да

нет*

.

Однако на практике не всегда оценки удовлетворяют всем трем требованиям. Может оказаться, что даже если эффективная оценка существует, то формулы для ее вычисления оказываются слишком сложными, и тогда используют оценку, дисперсия которой несколько больше. Иногда, в интересах простоты расчетов, применяются незначительно смещенные оценки. Выбору оценки всегда должно предшествовать ее критическое рассмотрение

Оценка стандартного (среднего квадратичного) отклонения связана с оценкой дисперсии соотношением

.

(1.3)

Стандартное отклонение часто является полезной мерой вариации, так как для многих распределений мы приблизительно знаем, какой процент данных лежит внутри одного, двух, трех и более стандартных отклонений среднего. Оно показывает на какую величину в среднем отклоняются случаи от среднего значения признака. Особенно большое значение имеет при исследовании нормальных распределений. В нормальном распределении 68% всех случаев лежит в интервале + одного отклонения от среднего, 95% - + двух стандартных отклонений от среднего и 99,7% всех случаев - в интервале + трех стандартных отклонений от среднего.

Стандартная ошибка оценки математического ожидания вычисляется как частное от деления стандартного отклонения на квадратный корень из объема выборки (как корень из частного от деления дисперсии на объем выборки).

Оценка среднего абсолютного отклонения равна

.

(1.4)

Среднее отклонение не часто используется как мера изменчивости в связи с тем, что среднее отклонение не имеет теоретического обоснования в отличии, например, от дисперсии.

Квантиль – это такое значение признака, которое делит распределение в заданной пропорции: слева 0,5%, справа 99,5%; слева 2,5%, справа 97,5% и т.п. Обычно выделяют следующие разновидности квантилей:

1) Квартили Q1, Q 2, Q3 – делят распределение на четыре части по 25% в каждой;

2) Квинтили К1, К2, К3, К4 – делят распределение на пять частей по 20% в каждой;

3) Децили D1, ...,D9, их девять, и делят распределение на десять частей по 10% в каждой;

4) Процентили P1, Р2 ...,Р99, их девяносто девять, и они делят распределение на сто частей по 1% в каждой части.

Поскольку процентиль – наиболее мелкое деление, то все другие квантили могут быть представлены через процентили. Так, первый квартиль – это двадцать пятый процентиль, первый квинтиль – второй дециль или двадцатый процентиль, и т.п.

Характеристиками рассеяния вариант также являются нижняя x1/4 и верхняя x3/4 квартили – значения, для которых число вариант, удовлетворяющих неравенствам и , составляет 25% и 75%, соответственно.

Оценки моментов третьего и четвертого порядков и связанные с ними безразмерные величины – оценки асимметрии и эксцесса – используются реже. Оценка асимметрии

(1.5)

характеризует «скос» распределения относительно его «центра» в положительном или отрицательном направлениях, соответственно.

Оценка эксцесса

(1.6)

характеризует «островершинность» (при ) или «плосковершинность» (при ) распределения по сравнению с нормальным. На рис. 1.1 изображены 3 кривые, отличающиеся по «остроконечности», или эксцессу.

Первая кривая (А) является совсем острой: подобная кривая называется островершинной. Вторая (Б)сравнительно плоская: такие кривые называются плосковершин­ными. «Островершинность», или степень эксцесса, третьей кривой (В) представляет собой норму, по отношению к которой изме­ряется эксцесс других кривых. Третья кривая на рис. 1.3 — нормальная кривая, принято говорить, что она является средневершинной.

Теперь мы рассмотрим способ измерения эксцесса кривой. Однако сначала необходимо подчеркнуть, что понятие «эксцесс» применимо лишь к одномодальным распределениям и относится к крутизне кривой в окрестности единственной моды. (Если распределение имеет две моды, то принято говорить об эксцессе кривой в окрестности каждой моды.)

Обычная мера эксцесса (Ex) определяется следующей формулой

(1.11)

Соотношения между величиной статистики асимметрии и «островершинностью» распределе­ния, для которого она вычислялась, показаны в табл. 4.

Таблица 4

Соотношение величины статистики эксцесса с «островершинностью» распределения частот

Характер распределения

Описание «островершинности»

Величина

эксцесса

Нормальное, например кривая В на рис. 1.3

Средневершинное

0

Островершинное, на­пример кривая А на рис. 1.3

Островершинное

Больше 0 (может быть очень большой)

Плоское, например кривая Б на рис. 1.3

Плосковершинное

Меньше 0

В практике довольно часто приходится сравнивать изменчивость признаков, выраженных разными единицами. В таких случаях используют не абсолютные, а относительные показатели вариации. Дисперсия и среднее отклонение как величины, выражаемые теми же единицами, что и характеризуемый ими признак, для оценки изменчивости разноимённых величин непригодны. Одним из относительных показателей вариации является коэффициент вариации. Этот показатель представляет собой среднее квадратическое отклонение, выраженное в процентах от величины среднего значения:

(1.12)

Различные признаки характеризуются различными коэффициентами вариации. Но в отношении одного и того же признака значение этого показателя Cv остаётся более или менее устойчивым и при симметричных распределениях обычно не превышает 50 %. При сильно асимметричных рядах распределения коэффициент вариации может достигать 100 % и даже выше.

Варьирование считается

  • слабым, если не превосходит 10 %,

  • средним, когда Cv составляет 11—25 %,

  • значительным при Cv  25 %.

Числовые характеристики эмпирического распределения называются выборочными характеристиками.

При выборке малого объема точечная оценка может существенно отличаться от оцениваемого параметра. В этом случае целесообразно использовать интервальные оценки.

Определение. Интервальной называют оценку, которая определяется двумя числами – концами интервала.

Определение. Доверительной вероятностью ( надежностью) оценки параметра называется вероятность , с которой выполняется неравенство .

Обычно задается надежность и определяется . Чаще всего надежность задается значениями от 0,95 и выше, в зависимости от конкретно решаемой задачи.

Неравенство можно записать .

Определение. Доверительным интервалом называется интервал , который покрывает неизвестный параметр с заданной надежностью .

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]