
- •Тема 4. Статистические показатели
- •4.1. Понятие и атрибуты статистического показателя
- •4.2. Классификация показателей, применяемых в статистике
- •4.3. Виды и принципы построения относительных показателей
- •Тема 5. Обобщающие характеристики статистических совокупностей
- •5.1. Общее понятие средней величины, средняя арифметическая величина, особенности расчета
- •5.2. Квадратичная, кубическая, геометрическая, гармоническая средние
- •5.3. Многомерная средняя величина
- •Данные по 9 магазинам района
- •Средние величины по учитываемым признакам
- •5.4. Понятие вариации. Вариационный ряд. Графическое отображение вариации
- •5.5. Показатели вариации
- •5.6. Вариация сгруппированных данных
Данные по 9 магазинам района
Номер магазина |
Продолжительность рабочего дня, ч |
Средняя оценка качества работы персонала покупателями (опрошено по 100 чел.) (баллы: 1–10) |
Ранг по уровню цен (1 – самые низкие цены) |
Многомерная средняя |
1 |
10 |
7 |
1 |
… |
2 |
12 |
4 |
3 |
… |
3 |
12 |
8 |
4 |
… |
4 |
24 |
8 |
5 |
… |
5 |
24 |
6 |
8 |
… |
6 |
10 |
9 |
6 |
… |
7 |
10 |
5 |
2 |
… |
8 |
12 |
9 |
4 |
… |
9 |
12 |
9 |
7 |
… |
Вес признака |
… |
… |
… |
… |
Предположим, что в данном случае все признаки равнозначны, т. е. все веса равны 1, и взвешенная средняя вырождается в простую среднюю. Поскольку в расчете участвуют средние величины, необходимо посчитать средние по каждому столбцу. В данном примере все средние рассчитываются как простые арифметические средние. Два признака из трех являются абсолютными величинами, а относительный признак «Средняя оценка качества работы персонала покупателями» имеет один и тот же вес по всем единицам (в каждом магазине опрошено одинаковое число покупателей – 100 человек), и, следовательно, взвешенная средняя для этого признака также обращается в простую среднюю (табл. 5.3).
Таблица 5.3
Средние величины по учитываемым признакам
Номер магазина |
Продолжительность рабочего дня, ч |
Средняя оценка качества работы персонала покупателями (опрошено по 100 чел.) (баллы: 1–10) |
Ранг по уровню цен (1 – самые низкие цены) |
Средняя величина |
14 |
7,2 |
4,44 |
Теперь можно рассчитать многомерные средние для каждого магазина.
Например, для первого магазина:
Из числового выражения видно, что по всем учитываемым признакам положение дел в первом магазине хуже, чем в среднем по совокупности, что отражается и в значении многомерной (0,33 < 1,00). После того, как все 9 значений будут рассчитаны, можно ранжировать (упорядочить по возрастанию или убыванию) единицы совокупности по полученным числовым значениям.
5.4. Понятие вариации. Вариационный ряд. Графическое отображение вариации
Вариация значений признака – это расхождение его значений по единицам статистической совокупности в один и тот же период или момент времени.
Вариационный ряд – это упорядоченная по возрастанию или убыванию значений признака последовательность единиц статистической совокупности. Различают три вида вариационных рядов: ранжированный, дискретный, интервальный.
Ранжированный ряд – перечень единиц статистической совокупности и соответствующих им значений признака в порядке их убывания или возрастания.
Дискретный ряд – статистическая таблица, состоящая из двух строк или граф, в одной из которых представлены значения признака (xj), а в другой – количество единиц совокупности с данным значением признака или частота появления признака, (fj).
Интервальный ряд – статистическая таблица, состоящая из двух строк или граф, в одной из которых представлены интервалы значения признака Х, а в другой – частота появления признака (fj).
Пример 1. Ранжированным рядом является перечень студентов, сдавших государственный экзамен по специальности, упорядоченный по убыванию набранных баллов и с указанием полученных баллов.
Результаты государственного экзамена по специальности 010502 (3514) – «Прикладная информатика (экономика)» в 2004 году
(экономическая часть)
Кузьмина К. – 84;
Петрова М. – 76;
Рукавишникова Ю. – 76;
Чернышев Е. – 75;
Ясина О. – 75;
Антонова В. – 70;
Кононова В. – 64;
Селиванова О. – 60 и т. д.
Пример 2. Дискретный вариационный ряд (табл. 5.4).
Таблица 5.4
Распределение покупателей по числу детей в семье
Число детей в семье |
– |
1 |
2 |
3 |
4 |
Более 5 |
Число покупателей |
24 |
30 |
35 |
7 |
3 |
1 |
Пример 3. Интервальный вариационный ряд (табл. 5.5).
Таблица 5.5
Распределение рабочих по норме выработки
-
Норма выработки, %
Количество рабочих
Менее 95
3
95 – 100
5
100 – 105
17
105 – 110
3
Более 110
2
Итого
30
Первый этап вариационного анализа – построение вариационного ряда. На этом этапе важно правильно определить, ряд какого вида целесообразно построить – дискретный или интервальный. Для этого необходимо выяснить, к какому виду относится изучаемый признак – дискретному или непрерывному. Неверный выбор вида ряда не позволяет правильно выявить закономерность в вариации значений признака, правильно рассчитать показатели вариации и искажает итоги вариационного анализа в целом.
Если признак дискретный, например, «количество детей в семье», то строится дискретный вариационный ряд (см. табл. 5.4).
Если же признак непрерывный или количество значений признака достаточно велико, то строится интервальный ряд (табл. 5.6). Для этого определяется количество интервалов в ряду и длина интервала. Если выбрать слишком большое число интервалов, то многочисленные колебания частоты появления признака не позволят выявить закономерность в вариации его значений, если же число интервалов будет излишне малым, то колебания частоты признака могут вовсе не проявиться, и распределение будет выглядеть равномерным. И тот и другой варианты приводят к неверному определению показателей вариации и также искажают итоги вариационного анализа в целом. Опытный специалист может определить количество (k) и длину (l) интервалов и экспертным путем, если же опыт пока невелик, то можно воспользоваться формулой Стержесса:
k = 1+3,32 lg n,
где n – количество единиц в ряду.
Таблица 5.6
Распределение покупателей по доходу
Среднемесячный доход на 1 человека, руб. |
Число покупателей |
Менее 1000 |
3 |
1000 – 2000 |
15 |
2000 – 3000 |
17 |
3000 – 4000 |
20 |
4000 – 5000 |
35 |
5000 – 6000 |
5 |
6000 – 7000 |
3 |
Более 7000 |
2 |
Итого |
100 |
В качестве длины интервала выбирается удобное для восприятия значение (5, 10, 50, 100 и т. п.) в интервале от l1 до l2:
;
,
где
– максимальное значение
признака в ряду;
– минимальное значение признака
в ряду; k1 – целая
часть числа k; k2 –
целая часть числа (k+1).
Графически дискретный ряд отображается полигоном (рис. 5.1), а интервальный – гистограммой (рис. 5.2). Для удобства работы с данными часто также строят огиву и кумуляту (рис. 5.3).
Полигон – это ломаная линия, соединяющая точки с координатами (xj; fj), где xj – значения признака, а fj – частота появления признака.
Гистограмма – это столбиковая диаграмма, в которой основание столбца равно длине интервала вариационного ряда, а высота – частоте появления признака в данном интервале.
Кумулята
– это ломаная линия, соединяющая точки
с координатами (xj;
),
где xj
– значения
признака, а
–
число единиц в совокупности, имеющих
значение признака меньшее или равное
xj.
Огива
–
это ломаная линия, соединяющая точки с
координатами (xj;
),
где xj
–
значения
признака, а
–
число единиц в совокупности, имеющих
значение признака большее или равное
xj.
Рис. 5.1. Полигон распределения покупателей по числу детей в семье (см. табл. 5.4)
Рис. 5.2. Гистограмма распределения покупателей по доходу (см. табл. 5.6)
Рис. 5.3. Кумулята и огива распределения покупателей по числу детей в семье (см. табл. 5.4)