
- •Тема 5-2011-2012. Показатели вариации
- •Вопрос 1. Понятие вариации. Абсолютные и средние показатели вариации
- •Вопрос 2. Показатели относительного рассеивания
- •Вопрос 3. Виды дисперсии
- •Вопрос 4. Анализ данных. Базовые показатели. Блочные диаграммы.
- •Вопрос 5. Дисперсия альтернативного (качественного признака)
Тема 5-2011-2012. Показатели вариации
Вопросы
Понятие вариации. Абсолютные и средние показатели вариации.
Показатели относительного рассеивания
Виды дисперсии
Анализ данных. Базовые показатели. Блочные диаграммы.
Дисперсия альтернативного (качественного признака)
Вопрос 1. Понятие вариации. Абсолютные и средние показатели вариации
Различие (степень колебания) отдельных значений характеризуют показатели вариации.
Вариация – количественное изменение величины исследуемого признака в пределах однородной совокупности, которое обусловлено перекрещивающимся влиянием действия различных факторов.
Степень близости данных отдельных единиц хi к средней измеряется рядом абсолютных, средних и относительных показателей.
Абсолютные показатели вариации
Размах вариации R - это разность между наибольшим и наименьшим значением вариантов.
.
Применение понятий.
Размах выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска, вычислим, используя следующий упорядоченный массив
-6,1 -2,8 -1,2 -0,7 4,3 5,5 5,9 6,5 7,6 8,3 9,6 9,8 12,9 13,1 18,5
Размах позволяет измерить общий разброс данных. Его слабость в том, что он никак не учитывает, как именно распределены данные между минимальным и максимальным элементами.
Межквартильный размах (средний размах) – это разность между третьим и первым квартилями выборки.
, где Q1
= (n+1)/4 Q3
= 3(n+1)/4
Эта величина позволяет оценить разброс 50% элементов и не учитывать влияние экстремальных элементов.
Применение понятий.
Межквартильный размах выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска, вычислим, используя следующий упорядоченный массив
-6,1 -2,8 -1,2 -0,7 4,3 5,5 5,9 6,5 7,6 8,3 9,6 9,8 12,9 13,1 18,5
Эта величина характеризует размах половины выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с высоким уровнем риска. Интервал, ограниченный числами 9,8 и -0,7 часто называют средней половиной.
Суммарные количественные характеристики, такие как медиана, первый и третий квартили, межквартильный размах, на которые не влияют выбросы, называются устойчивыми показателями.
Размах и межквартильный размах позволяют оценить общий и средний разброс значений, но они не учитывают как именно распределены данные. Дисперсия и стандартное (среднеквадратическое) отклонение лишены этого недостатка.
Средние показатели вариации
Среднее линейное отклонение
определяется как средняя арифметическая
из отклонений индивидуальных значений
от средней, без учёта знака этих отклонений
.
Дисперсия 2 (средний квадрат отклонений) определяется по формуле:
,
Чем меньше дисперсия, тем лучше средняя арифметическая отражает собой всю представленную совокупность.
Среднее квадратическое отклонение может быть найдено таким образом:
.
Дисперсия и среднее квадратическое (стандартное) отклонение позволяют оценить степень колебания данных вокруг среднего значения.
Интерпретация понятий
Дисперсия и среднее квадратическое (стандартное) отклонение позволяют оценить разброс данных вокруг среднего значения, т.е. сколько элементов выборки меньше среднего, а сколько – больше. Дисперсия обладает ценными математическими свойствами. Однако ее величина представляет собой квадрат единицы измерения (квадратный %, квадратный доллар и т.д.). Поэтому естественной оценкой дисперсии является стандартное отклонение, которое выражается в обычных единицах измерения - %, доллары …
Стандартное отклонение позволяет оценить величину колебания значений вокруг среднего значения. Практически во всех ситуациях наблюдаемые величины лежат в интервале плюс-минус одно стандартное отклонение от среднего значения. Поэтому, зная среднее арифметическое и среднее квадратическое (стандартное) отклонение можно определить интервал, которому принадлежит основная масса данных.
Применение понятий
Стандартное отклонение доходности 15 ВФ с очень высоким уровнем риска равно 6,62. Это значит, что доходность основной массы фондов отличается от среднего значения не более чем на 6,62%.
От 6,08-6,62=-0,54 до 6,08+6,62=12,7 в этом интервале есть 8 из 15 ВФ (53%)
Суммируем вышесказанное
Чем больший разброс имеют данные, тем больше их размах, межквартильный размах, дисперсия и стандартное отклонение
Чем более сконцентрированы данные, или однородны, тем меньше их размах, межквартильный размах, дисперсия и стандартное отклонение
Если все элементы выборки равны между собой (т.е. разброс отсутствует), межквартильный размах, дисперсия и стандартное отклонение равны нулю.
Ни одна из оценок изменчивости данных (размах, межквартильный размах, дисперсия и стандартное отклонение) не может быть отрицательной.
Применение понятий
Сравним разброс доходности ВФ с разными уровнями риска, вычислив отклонение для каждой из этих категорий.
Степень риска |
Стандартные отклонения |
Очень низкий |
2,7 |
Низкий риск |
3,58 |
Средний риск |
4,18 |
Высокий риск |
4,54 |
Очень высокий |
6,62 |
Далее запишем, как находятся основные показатели относительного рассеивания.