- •Средние величины и показатели вариации
- •Средние величины
- •Понятие средней величины и принципы ее применения
- •Виды и формы средних величин
- •Степенные средние
- •Средняя арифметическая
- •Средняя геометрическая
- •Средняя квадратическая и средняя кубическая
- •Структурные средние
- •Правило мажорантности средних
- •Расчет средних по результатам группировки
- •Графическое изображение вариационного ряда
- •2.3 Показатели центра распределения и структурные характеристики вариационного ряда
- •Показатели размера и интенсивности вариации
- •Оценка вариационного ряда на асимметрию и эксцесс
Графическое изображение вариационного ряда
Графическое изображение вариационных рядов облегчает их анализ и позволяет судить о форме распределения. Для графического изображения вариационного ряда в статистике строят гистограмму, полигон и кумуляту распределения.
Гистограмма – столбиковая диаграмма, для построения которой на оси абсцисс откладывают отрезки, равные величине интервалов вариационного ряда. На отрезках строят прямоугольники, высота которых в принятом масштабе по оси ординат соответствует частотам (или частостям) (рис. 2.2.1).
Рис. 2.2.1 Гистограмма распределения студентов по возрасту
Для графического изображения дискретного вариационного ряда применяют полигон распределения, для построения которого необходимо соединить прямыми отрезками точки с координатами x, w (рис. 2.2.2). Крайние точки полученного графика соединяют с точками по оси абсцисс, отстающими на одно деление в принятом масштабе от минимального и максимального значения вариант. Полигон может быть построен и для интервального вариационного ряда, для этого в качестве координат по оси абсцисс используют середины интервалов. Очевидно, что гистограмма легко может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить отрезками прямых, при этом середины верхних сторон двух крайних прямоугольников соединить с осью абсцисс в точках, отстоящих в принятом масштабе на величину интервалов от середины первого и последнего интервалов.
Рис. 2.2.2 Полигон распределения
Кумулята распределения строится по накопленным частотам (частостям). Накопленные частоты (частости) определяют последовательным суммированием частот (частостей), они показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое значение (гр. 4, табл. 2.1.1). При построении кумуляты интервального ряда (рис. 2.2.3) нижней границе первого интервала соответствует нулевая частота (частость), верхней – вся частота (частость) первого интервала. Верхней границе второго интервала – сумма частот (частостей) первого и второго интервалов и т. д. Верхней границе последнего интервала – сумма накопленных частот (частостей) во всех интервалах, что соответствует общей численности изучаемой совокупности на 100%.
Рис. 2.2.3 Кумулята распределения студентов по возрасту
2.3 Показатели центра распределения и структурные характеристики вариационного ряда
Для характеристики среднего значения признака в вариационном ряду используются так называемые показатели центра распределения. К ним относятся средняя величина признака, мода и медиана.
Расчет средней величины признака (х) в вариационном ряду осуществляется по формуле средней арифметической взвешенной:
При расчете средней величины интервального ряда в качестве вариантов признака используются значения середины интервалов (гр. 5, табл. 2.1.1). Для нахождения середины открытых интервалов необходимо их предварительно условно закрыть, т. е. определить недостающую верхнюю и нижнюю границы. Принято считать, что в первой группе величина интервала равна интервалу второй группы, а в последней – интервалу предыдущей. В рассматриваемом примере используется ряд с равными интервалами, величина которых 0,5 тыс. руб. Тогда условная нижняя граница первого интервала будет равна :0,5 тыс. руб. – 0,5 тыс. руб. =0, а середина – 0,25 тыс. руб., условная верхняя граница последнего интервала: 3,0 тыс. руб. + 0,5 тыс. руб., а середина – 3,25 тыс. руб.
Осуществим расчет средней величины месячного среднедушевого денежного дохода (х), используя в качестве весов частоты распределения (f). Промежуточные расчеты запишем в гр. 6 табл. 2.1.1. Тогда
Х ср. = 5112,75/2809 =1,82 тыс. руб.
Месячный среднедушевой доход составляет 1820 руб.
Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В дискретном ряду модой является вариант с наибольшей частотой (частостью). В интервальном вариационном ряду мода рассчитывается по формуле:
Модальный интервал – это интервал, имеющий наибольшую частоту (частость). В нашем примере это третий интервал от 1,0 до 1,5 тыс. руб.
Рассчитаем модальное значение признака, используя в качестве весов частости распределения:
Мо =
=1,29
тыс. руб.
Таким образом в нашем примере наиболее часто встречающаяся величина среднедушевого дохода составляет 1290 руб.
Отметим, что вычисления моды в интервальном ряду является весьма условным.
Приближенно модальное значение признака можно определить и графически – по гистограмме. Для этого нужно взять столбец, имеющий наибольшую высоту, и из его левого верхнего угла провести отрезок в верхний угол последующего столбца, а из правого угла – в верхний правый угол предыдущего. Абсцисс точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности.
Медиана – вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким образом, что половина единиц совокупности имеют значение признака меньше, чем медиана, а половина – больше, чем медиана. В интервальном ряду медиана определяется по формуле:
Медианный интервал – это интервал, в котором находится порядковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот (частостей) до числа, превышающего половину объема совокупности. По данным гр. 4 табл. 2.2.1 находим интервал, сумма накопленных частот в котором превышает 50%. Это интервал от 1,5 до 2,0 тыс. руб., он и является медианным. Тогда
Ме =
=1,72
тыс. руб.
Медиану приближенно можно определить графически – по кумуляте. Для этого высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения и является медианой.
Расчет модального и медианного значений для вариационных рядов с неравными интервалами осуществляется по формулам, аналогичным приведенным выше, только вместо показателей частот (частостей) используются показатели абсолютной или относительной плотности распределения, которые обеспечивают сопоставимость неравных интервалов. Показатели плотности распределения находятся как отношения частот (частостей) к величине интервала:
- абсолютная плотность распределения
;
- относительная плотность распределения
,
где i – величина
интервала.
По соотношению характеристик центра распределения (средней величины, моды и медианы) можно судить о симметричности эмпирического ряда распределения. Симметричным является распределение, в котором частоты двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. В симметричном распределение средняя величина, медиана и мода равны между собой:
=Mo=Me.
Если >Mo>Me, то имеет место правосторонняя асимметрия, т. е. большая часть единиц совокупности имеет значение изучаемого признака, превышающие модальное значение. На графике распределения правая ветвь относительно максимальной ординаты вытянута больше, чем левая.
Соотношение <Mo<Me характерно для левосторонней асимметрии, при которой большая часть единиц совокупности имеет значение признака ниже модального. На графике распределения левая ветвь вытянута больше, чем правая.
Нашему примеру соответствует соотношение >Mo>Me (1820 руб. > 1290 руб.), характерное для правосторонней асимметрии. Наличие правосторонней асимметрии свидетельствует о том, что большая часть города имела месячный среднедушевой доход выше, чем его модальное значение (1290 руб.).
При анализе вариационного ряда важно знать не только направление асимметрии (правосторонняя или левосторонняя), но и ее степень, которая измеряется с помощью коэффициентов асимметрии.
Моду и медиану называют еще структурными средними, поскольку они дают количественную характеристику структуры строение вариационных рядов. К структурным характеристикам относятся и другие порядковые статистики: квартили – делящие ряд на 4 равные части, децили – делящие ряд на 10 частей, перцинтили – на 100 частей и др.
Общая схема расчета децилей следующая:
1) поскольку децили отсекают десятые части совокупности, по накопленным частостям определяем интервалы, куда попадают порядковые номера децилей: для первой децили – интервал, где находится вариант, отсекающий 10% совокупности с наименьшими значениями признака; для второй – 20% и т. д.; для девятой децили – интервал, содержащий вариант, отсекающий 90% с наименьшими значениями признака;
2) рассчитываем величину децилей по формулам, аналогичным формуле для нахождения медианы. Например, первая и девятая децили находятся по формулам:
;
,
где
,
-
начала интервалов, где находятся первая
и девятая децили;
,
- величины интервалов, где находятся
первая и девятая децили;
–
общая сумма частот (частостей);
,
-
суммы частот (частостей), накопленных
в интервалах, предшествующих интервалам,
в которых находятся первая и девятая
децили.
Для нашего примера первая дециль попадает в интервал от 0,5 до 1,0 тыс. руб. (сумма накопленных в этом интервале частостей составляет 17,4%, что превышает 10%), девятая дециль – в интервал от 3,0 тыс. руб. и более (в этом интервале находится 10% населения с наибольшими доходами). Найдем вершину соответствующих децилей.
тыс. руб.
Следовательно, максимальная величина месячного среднедушевого дохода у 10% наименее обеспеченных жителей составляла 776 руб.
тыс. руб.
Минимальная величина месячного среднедушевого дохода у 10% наиболее обеспеченного населения города составила 3058 руб.
Соотношение
децильных доходов в социальной статистике
получило название коэффициента
децильной дифференциации доходов
населения (
):
В рассматриваемом примере
.
Это означает, что минимальный месячный среднедушевой доход 10% наиболее обеспеченного населения превышал максимальный доход 10% наименее обеспеченного населения в 3,9 раза.
