
- •Тема «Предмет, метод, задачи и организация статистики, статистическое измерение».
- •Основные категории статистики.
- •Тема «Статистические группировки, методы обработки и анализа статистической информации»
- •1 Вопрос. Сводка.
- •2 Вопрос. Метод статистических группировок.
- •3 Вопрос. Ряды распределения.
- •4 Вопрос. Графические методы представления статистических показателей.
- •Тема «Метод средний величин, вариационный анализ»
- •Тема «Вариационный анализ»
- •Тема «Анализ рядов динамики»
- •Тема «Индексный метод анализа».
- •1 Вопрос. Понятие и классификация.
- •2 Вопрос. Индивидуальные индексы.
- •3 Вопрос. Общие (сводные) индексы.
- •4 Вопрос. Индексный анализ структурных изменений
- •Тема «Методы сплошного и выборочного наблюдения социально-экономических явлений и процессов».
- •Тема «Корреляционный анализ, многомерный статистический анализ, методы моделирования и прогнозирования социально-экономических явлений и процессов»
Тема «Вариационный анализ»
Одна из причин, по которым возникает необходимость в проведении статистического анализа, состоит в том, что данные изменчивы. Ситуация, в которой присутствует изменчивость, часто содержит риск, поскольку даже использование всей доступной информации не позволяет точно предугадать, что же произойдет в будущем. Для адекватной работы с риском необходимо понимать его природу и уметь измерять изменчивость, вариацию., которая является его следствием.
Примеры.
1. Фондовая биржа в среднем обеспечивает более высокую доходность вложенных средств, чем, например, фонды денежного рынка. Однако работа на фондовой бирже связана с большим риском, и инвестирование в акции может привести к реальным потерям. Таким образом, средняя, или «ожидаемая», доходность не отражает полностью всю картину. Мера изменчивости доходности отдельных инвестиций будет отражать уровень риска, сопряженного с каждым конкретным вложением средств.
2. Предположим, что вы сравниваете маркетинговые затраты своей фирмы с аналогичными затратами фирм, работающими в вашей отрасли промышленности и обнаруживаете, что затраты вашей фирмы меньше затрат, типичных для данной отрасли. Для того чтобы оценить затраты на будущее, очень полезным может оказаться учет разброса соответствующих данных по отрасли.
Изменчивость или вариацию можно определить как степень различия между отдельными значениями.
Для характеристики величины возможных колебаний единиц совокупности исчисляют следующие показатели вариации:
- размах вариации;
- среднее линейное отклонение;
- среднее квадратическое отклонение;
- дисперсия (средний квадрат отклонения);
- коэффициент вариации.
Размах вариации
Размах вариации (R) вычисляется как разность между наибольшим и наименьшим значением варьирующего признака.
Он показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое и самое большое значения признака.
Размах является важной характеристикой вариации, он дает первое общее представление о различии единиц внутри совокупности. Размах вариации выражается в тех именованных единицах, в каких выражены значения признака.
Рассмотрим пример расчета размаха вариации на основании данных о производительности труда рабочих в двух бригадах.
Производительность труда рабочих двух бригад
Произведено продукции за смену , штук |
|
Рабочие первой бригады |
Рабочие второй бригады |
2 |
8 |
3 |
9 |
12 |
10 |
15 |
11 |
18 |
12 |
Итого 50 |
Итого 50 |
Размах вариации составит
для первой бригады 18-2=16
для второй бригады 12-8 =4
Стандартное отклонение
Стандартное отклонение – это число, описывающее, насколько значения данных обычно отличаются от среднего. Понятие стандартного отклонения является очень важным в статистике, поскольку оно представляет собой основной инструмент определения степени случайности в изучаемой ситуации. В частности, этот показатель является мерой случайности отклонений отдельных значений от их среднего.
Если все величины одинаковы, как, например, в приведенном ниже простом наборе данных:
5,5 5,5 5,5 5,5 .
то среднее будет иметь значение 5,5., а стандартное отклонение составит 0.
Другой набор данных:
43,0 17,7 8,7 -47,4 – эти цифры являются значениями ставки доходности четырех компаний. Среднее значение в этом случае составит также 5,5. Несмотря на то, что среднее значение здесь такое же, как и в предыдущем примере, отдельные значения существенно различаются между собой.
Компания |
Отклонение от среднего |
1 |
37,5 |
2 |
12,2 |
3 |
3,2 |
4 |
-52,9 |
Описанное выше расстояние от среднего значения называется отклонением. Оно показывает, насколько выше среднего значения или ниже среднего значения лежит каждое значение данных.
Если каждый вариант в ряду распределения повторяется один раз, то вычисляют среднее линейное отклонение по формуле:
-
абсолютные значения отклонений отдельных
вариант от их ср. величины, n-
объем совокупности.
Для вариационного ряда с неравными частотами формула имеет следующий вид.
Расчет среднего линейного отклонения рассмотрим на примере, данные которого приведены выше.
Все необходимые вычисления сведем в следующую таблицу.
Табельный номер |
Первая бригада |
Табельный номер |
Вторая бригада |
||||||
xi |
|
| |
( )² |
xi |
|
| | |
( )² |
||
1 |
2 |
-8 |
8 |
64 |
6 |
8 |
-2 |
2 |
4 |
2 |
3 |
-7 |
7 |
49 |
7 |
9 |
-1 |
1 |
1 |
3 |
12 |
+2 |
2 |
4 |
8 |
10 |
0 |
0 |
0 |
4 |
15 |
+5 |
5 |
25 |
9 |
11 |
+1 |
1 |
1 |
5 |
18 |
+8 |
8 |
64 |
10 |
12 |
+2 |
2 |
4 |
итого |
50 |
0 |
30 |
206 |
|
50 |
|
6 |
10 |
В первой бригаде среднее значение 10 шт., по второй также 10 шт.
Среднее линейное отклонение будет равно:
по первой бригаде đ = 30/5= 6,0 шт.
по второй бригаде đ = 6/5 = 1,2 шт.
В первой бригаде среднее линейное отклонение по производительности труда в 5 раз больше, чем во второй.
Среднеквадратическое отклонение
Среднее линейное отклонение обладает большим преимуществом перед размахом вариации в отношении полноты характеристики колеблемости признака. Однако при этом в некотором смысле нарушается элементарное правило математики, так как отклонение от среднего значения признака складывается без учета знаков. Для устранения этого недостатка используют стандартный прием: каждое значение сначала возводят в квадрат, чтобы избавиться от знака минус, затем складывают, делят на количество значений и извлекают квадратный корень. Этот показатель называют средним квадратическим отклонением.
;
Среднее квадратическое отклонение так же, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные значения признака от среднего их значения.
Дисперсия
В расчетах используют и еще один показатель – дисперсию. Она определяется по формуле:
;
Интерпретация среднего отклонения
Среднее отклонение описывает типичное расстояние от среднего значения для отдельного набора данных. Среднее отклонение выступает в качестве меры изменчивости для этих отдельных значений. Поскольку среднее отклонение отражает типичную величину отклонения, то можно предположить, что для одних значений отклонение будет меньше среднего, а для других – большим.
Для нашего примера среднее квадратическое отклонение в первой бригаде будет 6,45 шт., во второй – 1,41 шт.
Коэффициент вариации
По своему абсолютному значению среднее квадратическое отклонение зависит не только от степени вариации признака, но и от абсолютных уровней вариант и средней. Поэтому сравнивать средние квадратические отклонения вариационных рядов с различными средними уровнями непосредственно нельзя. Чтобы иметь возможность для такого сравнения, нужно найти удельный вес среднего отклонения (линейного или квадратического) в среднем арифметическом показателе, выраженном в процентах, т.е. рассчитать относительные показатели вариации. Формулы коэффициента вариации таковы:
Данный показатель в статистике называется линейным коэффициентом вариации.
Данный показатель называется коэффициентом вариации.
Если коэффициент вариации не превышает 33%, то совокупность по рассматриваемому признаку можно считать однородной.
В нашем примере для первой бригады коэффициента вариации будет равен 64,5%; для второй 14,1%.