
- •Шахты 2011 г.
- •1. Статистическая сводка и группировка методические указания и решение типовых задач
- •Основные показатели деятельности коммерческих банков одного из регионов на 1.01.02.(цифры условные), тыс. Руб.
- •Задачи и упражнения
- •2. Статистические таблицы методические указания и решение типовых задач
- •1. Простая монографическая таблица (табл. 2.1).
- •2. Простые перечневые таблицы по видовому принципу (табл.2.2 - 2.3).
- •3. Простая перечневая таблица по территориальному принципу (табл.2.4.)
- •4. Простая перечневая таблица по временному принципу (табл.2.5)
- •Котировка фьючерсных контрактов на пиломатериалы хвойных пород по данным одной из бирж
- •5. Групповая таблица (табл. 2.6)
- •Распределение эмитентов фондового рынка по величине котировки банковских долгов, выставленных на продажу в одном из вексельных центров
- •6. Сложная комбинационная таблица (табл. 2.7)
- •Распределение эмитентов фондового рынка по величине котировки банковских долгов и средневзвешенной ставке, выставленных на продажу в одном из вексельных центров в 1997 г.
- •Распределение клиентов страховых компаний по категориям и страховым суммам в I квартале 1998 г.
- •Задачи и упражнения
- •3. Формы выражения статистических показателей методические указания и решение типовых задач
- •Производство сахара-песка
- •Заработная плата предприятий ао
- •Задачи и упражнения
- •4. Показатели вариации и анализ частотных распределений методические указания и решение типовых задач
- •Распределение обуви, проданной коммерческой фирмой
- •Распределение семей города по размеру
- •Задачи и упражнения
- •5. Выборочное наблюдение методические указания и решение типовых задач
- •Задачи и упражнения
- •6. Экономические индексы методические указания и решение типовых задач
- •Задачи и упражнения
4. Показатели вариации и анализ частотных распределений методические указания и решение типовых задач
Исследование вариации в статистике и социально-экономических исследованиях имеет важное значение, так как величина вариации признака в статистической совокупности характеризует ее однородность.
В статистической практике для изучения и измерения вариации используются различные показатели (меры) вариации в зависимости от поставленных перед исследователем задач. К ним относятся размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсия), среднее квадратическое отклонение и коэффициент вариации.
При изучении вопроса о вариации нужно четко представлять себе условия, порождающие вариацию признаков, а также сущность и значение измерения вариации признаков. Следует также усвоить, что изучение вариации признаков общественных явлений находится в прямой связи с группировками, в частности с рядами распределения. Очень важно научиться свободно исчислять все показатели вариации.
Способы вычисления показателей вариации.
Размах вариации R является наиболее простым измерителем вариации признака:
R = xmax – xmin ,
где xmax – наибольшее значение варьирующего признака;
xmin – наименьшее значение признака.
Среднее
линейное отклонение
представляет собой среднюю величину
из отклонений вариантов признака от их
средней. Его можно рассчитать по формуле
средней арифметической, как невзвешенной,
так и взвешенной, в зависимости от
отсутствия или наличия частот в ряду
распределения:
-
невзвешенное
среднее линейное отклонение;
-
взвешенное
среднее линейное отклонение.
Символы
xi,
,
fi
и n
имеют то же значение, что и в предыдущей
главе. Рассмотренные выше показатели
имеют ту же размерность, что и признак,
для которого они вычисляются.
Пример. На основе данных табл. 4.1 рассчитаем среднее линейное отклонение для дискретного ряда распределения.
Решение. Размах вариации стажа равен:
R = 12 - 8 = 4 года.
Результаты вспомогательных расчетов даны в графах 3-5 табл. 4.1. Средний стаж работы определяем по формуле средней арифметической взвешенной:
лет.
Отклонения индивидуальных значений стажа от средней с учетом и без учета знака содержатся в графах 4 и 5, а произведения отклонений по модулю на соответствующие частоты – в гр. 6.
Таблица 4.1
Распределение учителей средних школ района по стажу работы
Стаж работы, лет xi |
Число учителей в % к итогу fi |
xifi |
xi - |
|
|
8 |
14 |
112 |
-2 |
2 |
28 |
9 |
20 |
180 |
-1 |
1 |
20 |
10 |
30 |
300 |
0 |
0 |
0 |
11 |
24 |
264 |
1 |
1 |
24 |
12 |
12 |
144 |
2 |
2 |
24 |
Итого |
100 |
1000 |
0 |
- |
96 |
Среднее линейное отклонение стажа работы учителей средних школ района
года.
Показатели дисперсии и среднего квадратического отклонения являются общепринятыми мерами вариации и широко используются в статистических исследованиях.
Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины (обозначается греческой буквой σ2 - «сигма» в квадрате). Дисперсия вычисляется по формулам простой невзвешенной и взвешенной:
-
невзвешенная;
-
взвешенная.
Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней:
-
невзвешенное;
-
взвешенное.
Среднее квадратическое отклонение - величина именованная, имеет размерность осредняемого признака.
Пример. Рассчитаем дисперсию и среднее квадратическое отклонение для следующего ряда распределения (табл. 4.2).
Таблица 4.2
Группы магазинов по величине товарооборота, тыс. руб. |
Число магазинов fi |
Середина интервала, тыс. руб. xi |
xifi |
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
40-50 |
2 |
45 |
90 |
-49,2 |
2420,64 |
4841,28 |
50-60 |
4 |
55 |
220 |
-39,2 |
1536,64 |
6146,56 |
60-70 |
7 |
65 |
455 |
-29,2 |
852,64 |
5968,48 |
70-80 |
10 |
75 |
750 |
-19,2 |
368,64 |
3686,40 |
80-90 |
15 |
85 |
1275 |
-9,2 |
84,64 |
1269,60 |
90-100 |
20 |
95 |
1900 |
0,8 |
0,64 |
12,80 |
Продолжение табл.4.2
1 |
2 |
3 |
4 |
5 |
6 |
7 |
100-110 |
22 |
105 |
2310 |
10,8 |
116,64 |
2566,08 |
110-120 |
11 |
115 |
1265 |
20,64 |
432,64 |
4759,04 |
120-130 |
6 |
125 |
750 |
30,8 |
948,64 |
5691,84 |
130-140 |
3 |
135 |
405 |
40,8 |
1664,64 |
4993,92 |
Итого |
100 |
0 |
9420 |
- |
- |
39936,00 |
Решение. В приведенных ранее примерах мы имели дело с дискретными рядами. При расчете показателей вариации по интервальным рядам распределения (табл. 4.2) необходимо сначала определить середины интервалов, а затем вести дальнейшие расчеты, рассматривая ряд середин интервалов как дискретный ряд распределения.
Результаты вспомогательных расчетов для определения дисперсии и среднего квадратического отклонения содержатся в графах 2-6 табл. 4.2.
Средний размер товарооборота определяется по средней арифметической взвешенной и составляет:
тыс.
руб.
Дисперсия товарооборота
.
Среднее квадратическое отклонение товарооборота определяется как корень квадратный из дисперсии:
тыс.
руб.
Расчет дисперсии прямым способом в ряде случаев трудоемок, поэтому логично, используя свойства дисперсии, упростить ее вычисления, например, используя расчет дисперсии по способу отчета от условного нуля или способу моментов по следующей формуле:
.
С использованием начальных моментов формула расчета дисперсии по способу моментов имеет следующий вид:
,
где k – величина интервала;
А – условный нуль, в качестве которого удобно использовать середину интервала с наибольшей частотой;
-
начальный момент первого порядка;
-
начальный момент второго порядка.
В случае когда А приравнивается к нулю и, следовательно, не вычисляются отклонения, формула принимает вид:
или
.
Воспользуемся данными предыдущего примера и рассчитаем дисперсию по способу отсчета от условного нуля и способу моментов. Расчет произведем в табличной форме (табл. 4.3).
Таблица 4.3
Расчет дисперсии способом отсчета от условного нуля
Группы магазинов по величине товарооборота, тыс. руб. |
Число магазинов fi |
Середина интервала, тыс. руб. xi |
xi – A (A=95) |
|
|
|
|
|
40-50 |
2 |
45 |
-50 |
-5 |
-10 |
50 |
2025 |
4050 |
50-60 |
4 |
55 |
-40 |
-4 |
-16 |
64 |
3025 |
12100 |
60-70 |
7 |
65 |
-30 |
-3 |
-21 |
63 |
4225 |
29575 |
70-80 |
10 |
75 |
-20 |
-2 |
-20 |
40 |
5625 |
56250 |
80-90 |
15 |
85 |
-10 |
-1 |
-15 |
15 |
7225 |
108375 |
90-100 |
20 |
95 |
1 |
0 |
0 |
0 |
9025 |
180500 |
100-110 |
22 |
105 |
10 |
1 |
22 |
22 |
11025 |
242550 |
110-120 |
11 |
115 |
20 |
2 |
22 |
44 |
13225 |
145475 |
120-130 |
6 |
125 |
30 |
3 |
18 |
54 |
15625 |
93750 |
130-140 |
3 |
135 |
40 |
4 |
12 |
48 |
18225 |
54675 |
Итого |
100 |
- |
- |
- |
-8 |
400 |
- |
927300 |
По способу отсчета от условного нуля:
По способу моментов получаем:
По способу разности между средней квадратов вариантов признака и квадратом их средней величины:
Результаты расчетов дисперсии по всем трем способам дают одну и ту же величину.
Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха, или среднего линейного отклонения, или среднего квадратического отклонения к средней арифметической. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации V:
Коэффициент
осцилляции:
.
Линейный
коэффициент вариации:
Коэффициент
вариации:
Рассмотрим примеры определения этих показателей.
По
данным табл. 4.1, коэффициент осцилляции
,
а линейный коэффициент вариации
.
Коэффициент
вариации вычислим на основе ряда
распределения, представленного в табл.
4.2:
.
Наиболее часто в практических расчетах из этих трех показателей применяется коэффициент вариации.
Статистическое
изучение вариации многих
социально-экономических явлений
проводится и при помощи дисперсии
альтернативного признака. Обозначим
наличие данного признака 1, отсутствие
0, долю вариантов, обладающих данным
признаком, p,
а не обладающих им q.
Так как ряд р + q
= 1, то средняя
,
а
дисперсия альтернативного признака
,
где
,
n
– число наблюдений, m
– число единиц совокупности, обладающее
данным признаком, q
= 1 – p.
Определим дисперсию альтернативного признака по следующим данным: налоговой инспекцией одного из районов города проверено 172 коммерческих киоска и в 146 обнаружены финансовые нарушения. Тогда
n
= 172; m
= 146;
;
q
= 1 – 0,85 = 0,15;
σ2 = 0,85 ∙ 0,15 = 0,1275.
Наряду с изучением вариации признака по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.
Правило сложения дисперсий. Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую, межгрупповую и внутригрупповую.
Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловливающих эту вариацию:
.
Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле
,
где xi и ni – соответственно средние и численности по отдельным группам.
Внутригрупповая дисперсия отражает случайную вариацию, т. е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:
.
Средняя из внутренних дисперсий
.
Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:
.
Данное соотношение называют правилом сложения дисперсий. Согласно этому правилу общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.
Зная любые два вида дисперсий, можно определить или проверить правильность расчета третьего вида.
Пример. Определим групповые дисперсии, среднюю из групповых дисперсий, межгрупповую дисперсию, общую дисперсию по данным табл. 4.4.
Таблица 4.4.
Производительность труда двух бригад рабочих-токарей
Первая бригада |
Вторая бригада |
||||
Изготовлено деталей за час, шт. xi |
xi
- |
|
Изготовлено деталей за час, шт. xi |
xi - |
|
13 |
-2 |
4 |
18 |
-3 |
9 |
14 |
-1 |
1 |
19 |
-2 |
4 |
15 |
0 |
0 |
22 |
1 |
1 |
17 |
2 |
4 |
20 |
-1 |
1 |
16 |
1 |
1 |
24 |
3 |
9 |
15 |
0 |
0 |
23 |
2 |
4 |
90 |
|
10 |
126 |
|
24 |
Решение. Для расчета групповых дисперсий вычислим средние по каждой группе:
шт.;
шт.
Промежуточные расчеты дисперсий по группам представлены в табл. 4.4. Подставив полученные значения в формулу, получим:
;
.
Средняя из групповых дисперсий
Затем рассчитаем межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешенную из групповых средних:
шт.
Теперь определим межгрупповую дисперсию:
.
Таким образом, общая дисперсия по правилу сложения дисперсий
.
Проверим полученный результат, исчислив общую дисперсию обычным способом:
.
На
основании правила сложения дисперсий
можно определить показатель тесноты
связи между группировочным (факторным)
и результативным признаками. Он называется
эмпирическим
корреляционным отношением, обозначается
η («эта») и
рассчитывается
по формуле
.
Для нашего примера эмпирическое
корреляционное отношение
Величина 0,86 характеризует существенную связь между группировочными и результативными признаками.
Характеристики вариационного ряда.
Мода – значение признака, наиболее часто встречающееся в исследуемой совокупности.
Медиана - значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.
Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда.
Пример. Рассчитаем моду и медиану по данным табл. 4.5.
Таблица 4.5