
- •Тема 4. Статистические показатели
- •4.1. Понятие и атрибуты статистического показателя
- •4.2. Классификация показателей, применяемых в статистике
- •4.3. Виды и принципы построения относительных показателей
- •Тема 5. Обобщающие характеристики статистических совокупностей
- •5.1. Общее понятие средней величины, средняя арифметическая величина, особенности расчета
- •5.2. Квадратичная, кубическая, геометрическая, гармоническая средние
- •5.3. Многомерная средняя величина
- •Данные по 9 магазинам района
- •Средние величины по учитываемым признакам
- •5.4. Понятие вариации. Вариационный ряд. Графическое отображение вариации
- •5.5. Показатели вариации
- •5.6. Вариация сгруппированных данных
5.5. Показатели вариации
После построения вариационного ряда переходят ко второму этапу вариационного анализа – расчету показателей вариации.
Вариацию признака характеризуют 4 группы показателей:
– показатели структуры вариации;
– показатели размера вариации;
– показатели интенсивности вариации;
– показатели характера вариации.
Для характеристики структуры вариации рассчитывают моду и медиану вариационного ряда.
Мода – это наиболее часто встречающееся значение признака.
Медиана – это значение признака, делящее ряд на две равные части, со значениями признака, соответственно, меньше и больше медианы.
Мода и медиана имеют ту же единицу измерения, что и сам признак.
Для дискретного ряда мода определяется как значение признака, которому соответствует наибольшая частота. Например, в дискретном ряду «Распределение покупателей по числу детей в семье» (см. табл. 5.4) мода равна 2 чел. (Мо = 2), так как значение признака xj = 2 встречается чаще других – 35 раз.
Для интервального ряда мода определяется по формуле
,
где
– начальное значение модального
интервала,
– частота появления признака соответственно
в интервале модальном, предшествующем
модальному и следующем за модальным; l
– длина интервала.
Например, если в интервальном ряду «Распределение покупателей по доходу» (табл. 5.6) рассчитать значение моды по представленной формуле, то получится Мо = 4333 руб./чел. Модальным интервалом в данном случае является интервал 4000–5000, так как значение признака попадает в этот интервал чаще, чем в другие – 35 раз.
Медиана в дискретном ряду – это значение признака центральной единицы ряда (если в ряду нечетное число единиц) или полусумма значений двух центральных единиц (если в ряду четное число единиц).
Например, в дискретном ряду «Распределение покупателей по числу детей в семье» (см. табл. 5.4) медиана равна 1 чел. (Ме =1 чел.). В ряду из 100 покупателей (четное число) центральными являются две единицы: 50-я и 51-я. Обе единицы (оба покупателя) находятся среди 30, имеющих по 1 ребенку в семье. Таким образом, именно значение xj =1 разбивает ряд на 2 равные части (по 50 единиц) со значениями признака соответственно меньше и больше медианы.
Для интервального ряда медиану определяют по формуле
,
где
– начальное значение медианного
интервала (первый интервал, в котором
накопленная частота появления признака
превышает половину объема совокупности);
– накопленная частота в интервале,
предшествующем медианному;
– частота появления признака в медианном
интервале; l – длина
интервала.
Например, в интервальном ряду «Распределение
покупателей по доходу» (см. табл. 5.6)
медианным является интервал 3000–4000, так
как именно в этом интервале накопленная
частота впервые превысила половину
объема совокупности
(55 > 50). Начальное
значение медианного интервала
=
3000; рассчитанная по формуле медиана Ме
= 3750 руб./чел.
Интерпретация результатов расчета (см. табл. 5.4):
– Мо = 2 чел. означает, что наибольшее число покупателей в группе имеют по 2 ребенка;
– Ме = 3750 руб./чел. означает, что в группе из 100 покупателей половина имеют 1 ребенка или меньше и половина покупателей имеют 1 ребенка или больше.
Интерпретация результатов расчета (см. табл. 5.6):
– Мо = 4333 руб./чел. означает, что наибольшее число покупателей в группе имеют доход около 4333 руб./чел.;
– Ме = 3750 руб./чел. означает, что в группе из 100 покупателей половина имеют среднемесячный доход на 1 человека 3750 руб./чел. и меньше и половина покупателей имеют среднемесячный доход на 1 человека 3750 руб./чел. и больше.
Насколько велики абсолютный и относительный разбросы значений признака, оценивают соответственно показателями силы и интенсивности вариации:
размах вариации
R = xmax – xmin ,
где xmax – максимальное значение признака в ряду; xmin – минимальное значение признака в ряду;
– среднее линейное отклонение:
– для несгруппированных данных
;
– для дискретного ряда
;
– для интервального ряда
.
Примечание 1. Система обозначений здесь и далее та же, что в формулах (1)–(3) (см. тему 5, п. 5.1).
Примечание 2. При обработке данных статистического наблюдения возможен расчет показателей вариации как по первичным, несгруппированным данным, так и по предварительно построенным рядам распределения. Но в рамках расчета одного показателя все входящие в него параметры должны быть определены одним способом. Например, если среднее линейное отклонение рассчитывается по интервальному вариационному ряду, то и используемая в расчете средняя арифметическая величина должна быть рассчитана по тому же интервальному ряду. Если же среднее линейное отклонение рассчитывается по несгруппированным исходным данным (простая сводка), то и используемая в расчете средняя арифметическая величина должна быть рассчитана по тем же данным. В противном случае рассчитанные показатели теряют свой смысл;
– среднее квадратичное отклонение:
– для дискретного ряда
;
– для интервального ряда
;
– дисперсия:
– для дискретного ряда
;
– для интервального ряда
.
– относительный размах вариации:
;
– относительное линейное отклонение:
;
– коэффициент вариации:
.
При анализе данных важно представлять не только размер вариации, но и то, как именно распределены единицы совокупности по всему диапазону значений признака: симметрично или с заметным смещением в область более высоких или более низких значений, концентрируются в области среднего значения или распределены почти равномерно по всему диапазону. На эти вопросы отвечают показатели характера вариации:
– коэффициент асимметрии
,
где
– центральный момент третьего порядка;
;
– показатель эксцесса
,
где
–
центральный момент четвертого порядка;
.
Интерпретация числовых значений показателей характера вариации.
Если коэффициент асимметрии принимает положительные значения, то в распределении признака имеет место правосторонняя асимметрия, т. е. основная масса значений признака смещена в область малых значений.
Если коэффициент асимметрии принимает отрицательные значения, то в распределении признака имеет место левосторонняя асимметрия, т. е. основная масса значений признака смещена в область больших значений признака.
Если показатель эксцесса принимает положительные значения, то распределение признака является островершинным, т. е. основная масса значений сконцентрирована на небольшом диапазоне изменения признака, сконцентрирована в большей степени, чем в случае нормального распределения.
Если показатель эксцесса принимает отрицательные значения, то распределение признака является плосковершинным, т. е. основная масса значений распределена по всему диапазону изменения признака сравнительно равномерно, более равномерно чем в случае нормального распределения.
Нулевые значения коэффициента асимметрии и показателя эксцесса характеризуют вариант нормального распределения значений признака.