Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема-4-5_с-27-53.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
491.52 Кб
Скачать

5.5. Показатели вариации

После построения вариационного ряда переходят ко второму этапу вариационного анализа – расчету показателей вариации.

Вариацию признака характеризуют 4 группы показателей:

– показатели структуры вариации;

– показатели размера вариации;

– показатели интенсивности вариации;

– показатели характера вариации.

Для характеристики структуры вариации рассчитывают моду и медиану вариационного ряда.

Модаэто наиболее часто встречающееся значение признака.

Медианаэто значение признака, делящее ряд на две равные части, со значениями признака, соответственно, меньше и больше медианы.

Мода и медиана имеют ту же единицу измерения, что и сам признак.

Для дискретного ряда мода определяется как значение признака, которому соответствует наибольшая частота. Например, в дискретном ряду «Распределение покупателей по числу детей в семье» (см. табл. 5.4) мода равна 2 чел. (Мо = 2), так как значение признака xj = 2 встречается чаще других – 35 раз.

Для интервального ряда мода определяется по формуле

,

где – начальное значение модального интервала, – частота появления признака соответственно в интервале модальном, предшествующем модальному и следующем за модальным; l – длина интервала.

Например, если в интервальном ряду «Распределение покупателей по доходу» (табл. 5.6) рассчитать значение моды по представленной формуле, то получится Мо = 4333 руб./чел. Модальным интервалом в данном случае является интервал 4000–5000, так как значение признака попадает в этот интервал чаще, чем в другие – 35 раз.

Медиана в дискретном ряду – это значение признака центральной единицы ряда (если в ряду нечетное число единиц) или полусумма значений двух центральных единиц (если в ряду четное число единиц).

Например, в дискретном ряду «Распределение покупателей по числу детей в семье» (см. табл. 5.4) медиана равна 1 чел. (Ме =1 чел.). В ряду из 100 покупателей (четное число) центральными являются две единицы: 50-я и 51-я. Обе единицы (оба покупателя) находятся среди 30, имеющих по 1 ребенку в семье. Таким образом, именно значение xj =1 разбивает ряд на 2 равные части (по 50 единиц) со значениями признака соответственно меньше и больше медианы.

Для интервального ряда медиану определяют по формуле

,

где – начальное значение медианного интервала (первый интервал, в котором накопленная частота появления признака превышает половину объема совокупности); – накопленная частота в интервале, предшествующем медианному; – частота появления признака в медианном интервале; l – длина интервала.

Например, в интервальном ряду «Распределение покупателей по доходу» (см. табл. 5.6) медианным является интервал 3000–4000, так как именно в этом интервале накопленная частота впервые превысила половину объема совокупности (55 > 50). Начальное значение медианного интервала  = 3000; рассчитанная по формуле медиана Ме = 3750 руб./чел.

Интерпретация результатов расчета (см. табл. 5.4):

– Мо = 2 чел. означает, что наибольшее число покупателей в группе имеют по 2 ребенка;

– Ме = 3750 руб./чел. означает, что в группе из 100 покупателей половина имеют 1 ребенка или меньше и половина покупателей имеют 1 ребенка или больше.

Интерпретация результатов расчета (см. табл. 5.6):

– Мо = 4333 руб./чел. означает, что наибольшее число покупателей в группе имеют доход около 4333 руб./чел.;

– Ме = 3750 руб./чел. означает, что в группе из 100 покупателей половина имеют среднемесячный доход на 1 человека 3750 руб./чел. и меньше и половина покупателей имеют среднемесячный доход на 1 человека 3750 руб./чел. и больше.

Насколько велики абсолютный и относительный разбросы значений признака, оценивают соответственно показателями силы и интенсивности вариации:

размах вариации

R = xmax – xmin ,

где xmax – максимальное значение признака в ряду; xmin – минимальное значение признака в ряду;

среднее линейное отклонение:

– для несгруппированных данных

;

– для дискретного ряда

;

– для интервального ряда

.

Примечание 1. Система обозначений здесь и далее та же, что в формулах (1)–(3) (см. тему 5, п. 5.1).

Примечание 2. При обработке данных статистического наблюдения возможен расчет показателей вариации как по первичным, несгруппированным данным, так и по предварительно построенным рядам распределения. Но в рамках расчета одного показателя все входящие в него параметры должны быть определены одним способом. Например, если среднее линейное отклонение рассчитывается по интервальному вариационному ряду, то и используемая в расчете средняя арифметическая величина должна быть рассчитана по тому же интервальному ряду. Если же среднее линейное отклонение рассчитывается по несгруппированным исходным данным (простая сводка), то и используемая в расчете средняя арифметическая величина должна быть рассчитана по тем же данным. В противном случае рассчитанные показатели теряют свой смысл;

среднее квадратичное отклонение:

– для дискретного ряда

;

– для интервального ряда ;

дисперсия:

– для дискретного ряда ;

– для интервального ряда .

относительный размах вариации:

;

относительное линейное отклонение:

;

коэффициент вариации:

.

При анализе данных важно представлять не только размер вариации, но и то, как именно распределены единицы совокупности по всему диапазону значений признака: симметрично или с заметным смещением в область более высоких или более низких значений, концентрируются в области среднего значения или распределены почти равномерно по всему диапазону. На эти вопросы отвечают показатели характера вариации:

коэффициент асимметрии

,

где – центральный момент третьего порядка;

;

показатель эксцесса

,

где – центральный момент четвертого порядка;

.

Интерпретация числовых значений показателей характера вариации.

Если коэффициент асимметрии принимает положительные значения, то в распределении признака имеет место правосторонняя асимметрия, т. е. основная масса значений признака смещена в область малых значений.

Если коэффициент асимметрии принимает отрицательные значения, то в распределении признака имеет место левосторонняя асимметрия, т. е. основная масса значений признака смещена в область больших значений признака.

Если показатель эксцесса принимает положительные значения, то распределение признака является островершинным, т. е. основная масса значений сконцентрирована на небольшом диапазоне изменения признака, сконцентрирована в большей степени, чем в случае нормального распределения.

Если показатель эксцесса принимает отрицательные значения, то распределение признака является плосковершинным, т. е. основная масса значений распределена по всему диапазону изменения признака сравнительно равномерно, более равномерно чем в случае нормального распределения.

Нулевые значения коэффициента асимметрии и показателя эксцесса характеризуют вариант нормального распределения значений признака.