Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
praktikum.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
2.07 Mб
Скачать

Тема 6. Статистическое изучение вариации

1. Понятие вариации и построение вариационных рядов.

2. Показатели центра распределения.

3. Показатели размера и интенсивности вариации.

4. Показатели формы распределения.

Природа социально-экономических явлений такова, что они обладают свойством изменчивости. Это и обусловливает необходимость в проведении статистического анализа. Если бы данные не изменялись, то не было бы необходимости собирать, обобщать и анализировать данные о множестве явлений, т.е., проще говоря, применять статистические методы.

Там, где присутствует изменчивость данных, существует и риск, поскольку невозможно предугадать, что произойдет в будущем. Для того чтобы управлять риском, необходимо уметь измерять изменчивость, или вариацию.

Вариацией называется различие значений признака у разных единиц совокупности в один и тот же период или момент времени.

Первым этапом изучения вариации является построение вариационного ряда — упорядоченного распределения единиц совокупности по возрастающим или убывающим значениям признака и подсчет числа единиц с тем или иным значением.

Вариационный ряд — это ряд распределения, построенный по количественному признаку. Ряд распределения, построенный по атрибутивному признаку, называется атрибутивным.

Существуют три формы вариационного ряда: ранжированный, дискретный и интервальный.

Ранжированный ряд — это перечень единиц совокупности в порядке возрастания (убывания) значений изучаемого признака. Например, список предприятий, расположенных в порядке возрастания уровня рентабельности каждого предприятия.

Дискретный вариационный ряд — это таблица, состоящая из двух строк или граф: конкретных значений признака и числа единиц совокупности, имеющих то или иное значение. Например, распределение студентов группы по результатам экзамена:

Оценка, xi

2

3

4

5

Итого

Число студентов, fi

1

5

12

3

21

Интервальный вариационный ряд — это таблица, состоящая из двух строк или граф: интервалов значений признака и числа единиц совокупности, попадающих в данный интервал (частот). Например, распределение предприятий по числу работников:

Число работников, x

до 200

200-300

300-500

500 и более

Итого

Число предприятий, f

5

17

23

10

55

На графике дискретный вариационный ряд изображается в виде полигона распределения, а интервальный — в виде гистограммы (столбиковой диаграммы).

Для характеристики среднего значения признака в вариационном ряду используются показатели центра распределения, к которым, кроме средней арифметической величины, относятся мода и медиана. Также существуют другие показатели, характеризующие структуру вариационного ряда.

Мода — значение признака, наиболее часто встречающееся в исследуемой сово­купности.

Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой.

Для интервальных вариационных рядов мода определяется по формуле:

где хмонижняя граница значения интервала, содержащего моду; iмовеличина модального интервала; fмочастота модального интервала, т.е. интервала, имеющего наибольшую частоту; fмо-1частота интервала, предшествующего модальному, fмо+1 — частота интервала, следующего за модальным.

Медиана — значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности, делящее ее на две равные части.

Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда.

Медиана интервального ряда распределения определяется по формуле

где xMе нижняя граница значения интервала, содержащего медиану; iМе— величина медианного интервала; f сумма частот; SМе-1 сумма накопленных частот, предшествующих медианному интервалу; fМе — частота медианного интервала.

Аналогично с нахождением медианы в вариационных рядах можно отыскать значение признака у любой по порядку единицы ранжированного ряда. Например, можно найти значение признака у единиц, делящих ряд на четыре равные части, десять или сто частей. Эти величины называются квартили, децили и перцентили.

Остановимся на расчете показателей децилей, нашедших широкое применение в анализе дифференциации различных социально-экономических явлений.

Общая схема расчета децилей следующая:

1) поскольку децили отсекают десятые части совокупности, по накопленным частостям определяют интервалы, куда попадают порядковые номера децилей: для первой децили — интервал, где находится вариант, отсекающий 10 % совокупности с наименьшими значениями признака; для второй — 20 % и т. д.; для девятой децили — интервал, содержащий вариант, отсекающий 90 % с наименьшими значениями, или, что то же самое, 10 % с наибольшими значениями признака;

2) рассчитывают величину децилей по формулам, аналогичным формуле для нахождения медианы. Например, первая и девятая децили находятся по формулам:

где — начала интервалов, где находятся первая и девятая децили; — величины интервалов, где находятся первая и девятая децили; — общая сумма частот (частостей); — суммы частот (частостей), накопленных в интервалах, предшествующих интервалам, в которых находятся первая и девятая децили; частоты (частости) интервалов, содержащих первую и девятую децили.

Соотношение децильных доходов в социальной статистике получило название коэффициента децильной дифференциации доходов населения (КD):

Основной характеристикой центра распределения является средняя арифметическая величина, опирающаяся на всю информацию об изучаемой совокупности единиц. Однако в ряде случаев средняя арифметическая должна быть дополнена или заменена модальным значением или медианой. Медиана не зависит от значений, расположенных по обе стороны от нее, поэтому ее значение лучше использовать в рядах распределения с расплывчатыми концами или в рядах распределения, в которых имеются чрезмерно малые или большие значения (выбросы). Мода используется при изучении спроса населения, когда интерес представляет определение модального размера (или модели), т.е. пользующегося наибольшим спросом.

В симметричных рядах распределения все названные показатели равноправны, поскольку = Ме = Мо, но предпочтение отдается средней арифметической. Для асимметричных рядов распределения медиана часто является предпочтительной характеристикой центра распределения, поскольку занимает положение между средней арифметической и модой.

Не меньшее значение, чем характеристики центра распределения, имеют показатели, характеризующие степень рассеивания значений признака вокруг средней величины.

Размах вариации (R) является наиболее простым измерителем вариации признака:

где наибольшее значение варьирующего признака; наименьшее значение признака.

Среднее линейное отклонение (d) представляет собой среднюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения:

— невзвешенное среднее линейное отклонение;

— взвешенное среднее линейное отклонение,

где i-й вариант осредняемого признака, вес i-го варианта.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней вели­чины. Дисперсия вычисляется по формулам простой невзвешенной и взвешенной:

— невзвешенная;

— взвешенная.

Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней величины:

— невзвешенное;

— взвешенное.

Среднее квадратическое отклонение — величина именованная, имеет размерность осредняемого признака.

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха, или среднего линейного отклонения, или среднего квадратического отклонения к средней арифметической. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному). Различают следующие относительные показатели вариации:

- коэффициент осцилляции:

- линейный коэффициент вариации:

- коэффициент вариации:

Показатели асимметрии и эксцесса. Степень асимметрии может быть определена с помощью коэффициента асимметрии (Аs):

где средняя арифметическая ряда распределения; — мода; — среднее квадратическое отклонение.

При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. Если Аs > 0, то больше моды, следовательно, имеется правосторонняя асимметрия.

Если As < 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

В практических расчетах часто в качестве показателя асимметрии применяется отношение центрального момента третьего порядка к среднему квадратическому отклонению данного ряда в кубе, т.е.

Это дает возможность определить не только величину асимметрии, но и проверить наличие асимметрии в генеральной совокупности. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной. Асимметрия меньше 0,25 — незначительная.

Для симметричных распределений может быть также рассчитан показатель эксцесса, характеризующий крутизну распределения:

где — центральный момент четвертого порядка.

При симметричном распределении = 0. Если > 0, распределение является островершинным; если < 0 — плос­ковершинным.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]