
- •Статистика
- •Введение
- •Тема 1. Предмет и метод статистики как науки
- •Контрольные вопросы
- •Тема 2. Статистическое наблюдение
- •Контрольные вопросы
- •Тема 3. Сводка и группировка статистических данных
- •Контрольные вопросы
- •Тема 4. Абсолютные и относительные величины в статистике
- •Контрольные вопросы
- •Тема 5. Средние величины в статистике
- •Контрольные вопросы
- •Тема 6. Статистическое изучение вариации
- •Контрольные вопросы
- •Тема 7. Выборочное наблюдение
- •Контрольные вопросы
- •Тема 8. Статистическое изучение корреляционных взаимосвязей
- •Контрольные вопросы
- •Тема 9. Анализ рядов динамики
- •Контрольные вопросы
- •Тема 10. Индексы
- •Контрольные вопросы
- •Тема 11. Предмет и задачи социально-экономической статистики
- •Контрольные вопросы
- •Тема 12. Статистика населения
- •Контрольные вопросы
- •Тема 13. Статистика занятости и безработицы
- •Контрольные вопросы
- •Тема 14. Система национальных счетов и макроэкономические показатели
- •Контрольные вопросы
- •Тема 15. Статистика национального богатства
- •Контрольные вопросы
- •Тема 16. Статистика эффективности национальной экономики
- •Контрольные вопросы
- •Тема 17. Статистика уровня жизни
- •Контрольные вопросы
- •Задания для контрольной работы пояснительная записка
- •Варианты контрольной работы №1
- •Варианты контрольной работы №2
- •Вопросы для самоподготовки*
- •Контрольные вопросы **
- •Список рекомендуемой литературы
- •Приложения
Тема 6. Статистическое изучение вариации
1. Понятие вариации и построение вариационных рядов.
2. Показатели центра распределения.
3. Показатели размера и интенсивности вариации.
4. Показатели формы распределения.
Природа социально-экономических явлений такова, что они обладают свойством изменчивости. Это и обусловливает необходимость в проведении статистического анализа. Если бы данные не изменялись, то не было бы необходимости собирать, обобщать и анализировать данные о множестве явлений, т.е., проще говоря, применять статистические методы.
Там, где присутствует изменчивость данных, существует и риск, поскольку невозможно предугадать, что произойдет в будущем. Для того чтобы управлять риском, необходимо уметь измерять изменчивость, или вариацию.
Вариацией называется различие значений признака у разных единиц совокупности в один и тот же период или момент времени.
Первым этапом изучения вариации является построение вариационного ряда — упорядоченного распределения единиц совокупности по возрастающим или убывающим значениям признака и подсчет числа единиц с тем или иным значением.
Вариационный ряд — это ряд распределения, построенный по количественному признаку. Ряд распределения, построенный по атрибутивному признаку, называется атрибутивным.
Существуют три формы вариационного ряда: ранжированный, дискретный и интервальный.
Ранжированный ряд — это перечень единиц совокупности в порядке возрастания (убывания) значений изучаемого признака. Например, список предприятий, расположенных в порядке возрастания уровня рентабельности каждого предприятия.
Дискретный вариационный ряд — это таблица, состоящая из двух строк или граф: конкретных значений признака и числа единиц совокупности, имеющих то или иное значение. Например, распределение студентов группы по результатам экзамена:
Оценка, xi |
2 |
3 |
4 |
5 |
Итого |
Число студентов, fi |
1 |
5 |
12 |
3 |
21 |
Интервальный вариационный ряд — это таблица, состоящая из двух строк или граф: интервалов значений признака и числа единиц совокупности, попадающих в данный интервал (частот). Например, распределение предприятий по числу работников:
Число работников, x |
до 200 |
200-300 |
300-500 |
500 и более |
Итого |
Число предприятий, f |
5 |
17 |
23 |
10 |
55 |
На графике дискретный вариационный ряд изображается в виде полигона распределения, а интервальный — в виде гистограммы (столбиковой диаграммы).
Для характеристики среднего значения признака в вариационном ряду используются показатели центра распределения, к которым, кроме средней арифметической величины, относятся мода и медиана. Также существуют другие показатели, характеризующие структуру вариационного ряда.
Мода — значение признака, наиболее часто встречающееся в исследуемой совокупности.
Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой.
Для интервальных вариационных рядов мода определяется по формуле:
где хмо— нижняя граница значения интервала, содержащего моду; iмо— величина модального интервала; fмо— частота модального интервала, т.е. интервала, имеющего наибольшую частоту; fмо-1 — частота интервала, предшествующего модальному, fмо+1 — частота интервала, следующего за модальным.
Медиана — значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности, делящее ее на две равные части.
Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда.
Медиана интервального ряда распределения определяется по формуле
где xMе — нижняя граница значения интервала, содержащего медиану; iМе— величина медианного интервала; ∑f — сумма частот; SМе-1 — сумма накопленных частот, предшествующих медианному интервалу; fМе — частота медианного интервала.
Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Например, можно найти значение признака у единиц, делящих ряд на четыре равные части, десять или сто частей. Эти величины называются квартили, децили и перцентили.
Остановимся на расчете показателей децилей, нашедших широкое применение в анализе дифференциации различных социально-экономических явлений.
Общая схема расчета децилей следующая:
1) поскольку децили отсекают десятые части совокупности, по накопленным частостям определяют интервалы, куда попадают порядковые номера децилей: для первой децили — интервал, где находится вариант, отсекающий 10 % совокупности с наименьшими значениями признака; для второй — 20 % и т. д.; для девятой децили — интервал, содержащий вариант, отсекающий 90 % с наименьшими значениями, или, что то же самое, 10 % с наибольшими значениями признака;
2) рассчитывают величину децилей по формулам, аналогичным формуле для нахождения медианы. Например, первая и девятая децили находятся по формулам:
где
—
начала интервалов, где находятся первая
и девятая децили;
—
величины интервалов, где находятся
первая и девятая децили;
—
общая сумма частот (частостей);
—
суммы частот (частостей), накопленных
в интервалах, предшествующих интервалам,
в которых находятся первая и девятая
децили;
—
частоты
(частости) интервалов, содержащих первую
и девятую децили.
Соотношение децильных доходов в социальной статистике получило название коэффициента децильной дифференциации доходов населения (КD):
Основной характеристикой центра распределения является средняя арифметическая величина, опирающаяся на всю информацию об изучаемой совокупности единиц. Однако в ряде случаев средняя арифметическая должна быть дополнена или заменена модальным значением или медианой. Медиана не зависит от значений, расположенных по обе стороны от нее, поэтому ее значение лучше использовать в рядах распределения с расплывчатыми концами или в рядах распределения, в которых имеются чрезмерно малые или большие значения (выбросы). Мода используется при изучении спроса населения, когда интерес представляет определение модального размера (или модели), т.е. пользующегося наибольшим спросом.
В
симметричных рядах распределения все
названные показатели равноправны,
поскольку
=
Ме
= Мо,
но предпочтение отдается средней
арифметической. Для асимметричных рядов
распределения медиана часто является
предпочтительной характеристикой
центра распределения, поскольку занимает
положение между средней арифметической
и модой.
Не меньшее значение, чем характеристики центра распределения, имеют показатели, характеризующие степень рассеивания значений признака вокруг средней величины.
Размах вариации (R) является наиболее простым измерителем вариации признака:
где
—
наибольшее
значение варьирующего признака;
— наименьшее
значение признака.
Среднее линейное отклонение (d) представляет собой среднюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения:
— невзвешенное
среднее линейное отклонение;
— взвешенное
среднее линейное отклонение,
где
—
i-й
вариант осредняемого признака,
—
вес
i-го
варианта.
Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной:
—
невзвешенная;
—
взвешенная.
Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней величины:
—
невзвешенное;
—
взвешенное.
Среднее квадратическое отклонение — величина именованная, имеет размерность осредняемого признака.
Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха, или среднего линейного отклонения, или среднего квадратического отклонения к средней арифметической. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному). Различают следующие относительные показатели вариации:
-
коэффициент осцилляции:
-
линейный коэффициент вариации:
-
коэффициент вариации:
Показатели асимметрии и эксцесса. Степень асимметрии может быть определена с помощью коэффициента асимметрии (Аs):
где
— средняя
арифметическая ряда распределения;
—
мода;
— среднее квадратическое отклонение.
При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. Если Аs > 0, то больше моды, следовательно, имеется правосторонняя асимметрия.
Если As < 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.
В практических расчетах часто в качестве показателя асимметрии применяется отношение центрального момента третьего порядка к среднему квадратическому отклонению данного ряда в кубе, т.е.
Это дает возможность определить не только величину асимметрии, но и проверить наличие асимметрии в генеральной совокупности. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной. Асимметрия меньше 0,25 — незначительная.
Для симметричных распределений может быть также рассчитан показатель эксцесса, характеризующий крутизну распределения:
где
—
центральный момент четвертого порядка.
При
симметричном распределении
= 0. Если
> 0, распределение является островершинным;
если
< 0 — плосковершинным.