- •Тема 1. Описательная статистика
- •§1. Меры центральной тенденции.
- •1.1. Среднее арифметическое (выборочная средняя)
- •1.2. Медиана
- •1.3. Мода
- •1.4. Некоторые виды степенного среднего
- •1.5. Ограничения при работе с мерами центральной тенденции
- •Выбор меры центральной тенденции в зависимости от типа измерительной шкалы
- •§2. Меры изменчивости.
- •1.1. Размах
- •2.2. Квартильный размах
- •2.3. Дисперсия
- •2.4. Среднее квадратическое и стандартное отклонение
- •2.5. Среднее отклонение
- •2.6. Коэффициент вариации Cv
- •§3. Показатели формы кривой распределения.
- •3.1. Асимметрия
- •3.2. Эксцесс
- •Тема 2. Критерии согласия
2.4. Среднее квадратическое и стандартное отклонение
Мерой изменчивости, тесно связанной с дисперсией, является стандартное отклонение.
Среднее квадратическое отклонение – это положительное значение квадратного корня из дисперсии (обозначается x).
Стандартное отклонение, обозначаемое
sx, определяется
как положительное значение квадратного
корня из дисперсии. Для определения sx
надо сначала найти
,
а затем вычислить квадратный корень из
:
Стандартное отклонение часто является
полезной мерой вариации, так как для
многих распределений мы приблизительно
знаем, какой процент данных лежит внутри
одного, двух, трех и более стандартных
отклонений среднего. Например, мы можем
знать, что 70% значений лежит между
и
.
2.5. Среднее отклонение
Еще одна мера изменчивости – среднее отклонение – вычисляется легче, чем стандартное отклонение, но используется реже.
Отклонение каждого значения от
среднего обозначается как
.
Совокупность всех п отклонений
характеризует изменчивость в исходных
данных. Однако, сумма положительных и
отрицательных отклонений вовсе не
является мерой общей изменчивости в
группе данных, ибо она всегда точно
равна нулю. Если рассматривать отклонения
как расстояния от
без учета знака, то сумма этих расстояний
будет характеризовать изменчивость
данных.
Расстояние каждого xi от
определяется с помощью взятия числа
по модулю. Оно равно
.
Среднее значение п расстояний оценок
от их среднего называется средним
отклонением,
.
2.6. Коэффициент вариации Cv
Дисперсия и среднее отклонение применимы и для сравнительной оценки одноимённых средних величин. В практике же довольно часто приходится сравнивать изменчивость признаков, выраженных разными единицами. В таких случаях используют не абсолютные, а относительные показатели вариации. Дисперсия и среднее отклонение как величины, выражаемые теми же единицами, что и характеризуемый ими признак, для оценки изменчивости разноимённых величин непригодны.
Одним из относительных показателей вариации является коэффициент вариации. Этот показатель представляет собой стандартное отклонение, выраженное в процентах от величины среднего значения:
Различные признаки характеризуются различными коэффициентами вариации. Но в отношении одного и того же признака значение этого показателя Cv остаётся более или менее устойчивым и при симметричных распределениях обычно не превышает 50 %. При сильно асимметричных рядах распределения коэффициент вариации может достигать 100 % и даже выше.
Варьирование считается слабым, если не превосходит 10 %, средним, когда Cv составляет 11—25 %, и значительным при Cv 25 %.
§3. Показатели формы кривой распределения.
Особую группу составляют асимметрия и эксцесс. Они описывают другие свойства распределения.
3.1. Асимметрия
Одно из наиболее важных свойств распределения частот – степень асимметрии. Практически точно симметричные полигоны частот и гистограммы почти никогда не встречаются. Степень асимметрии распределения частот для выборки называется его асимметрией. Легко выявить и распознать асимметрию, если рассматривать полигон частот или гистограмму, но это не всегда возможно или удобно. Поэтому изобретены различные обобщенные статистические характеристики, оценивающие вид и степень асимметрии группы наблюдений.
Наилучшая мера асимметрии (As)
для группы данных выражается формулой
