
- •Санкт-Петербург
- •Блок 2. Статистические наблюдения
- •Блок 3. Статистическая информация и статистические показатели
- •Блок 5. Статистические ряды распределения
- •Распределение группы туристов по числу заграничных туров, в которых они побывали
- •Свойства средней арифметической
- •Блок 7. Структурные средние
- •Блок 8. Показатели вариации
- •Блок 9. Изучение формы распределения
- •Ошибки выборочного наблюдения
- •Предельная ошибка выборки
- •Основные виды выборки
- •Блок 11. Малая выборка
- •Характеристики динамики
- •60 Человек на 1 января 2003 г. – это одновременно численность работников фирмы на 31 декабря 2002 г. Поэтому средняя численность работников:
- •Исследование тенденций развития явлений
- •Блок 13. Прогнозирование на основе изучения тренда
- •Агрегатные индексы
- •Блок 15. Индексы средних величин
- •Блок 17. Методы регрессионно-корреляционного анализа связи показателей
- •Критерии согласия
- •Основные формулы
- •Критические значения χ2
- •Перечень вопросов для подготовки к экзамену
- •Список литературы
Блок 8. Показатели вариации
Различие индивидуальных значений признака внутри изучаемой совокупности называется вариацией признака. Колеблемость отдельных значений характеризуют показатели вариации. Различают вариацию признака случайную и систематическую. Анализ вариации позволяет оценить ее характер и определить насколько однородной является изучаемая совокупность и насколько характерной является ее средняя величина для данной совокупности.
Выделяют
абсолютные и средние показатели вариации.
Наиболее простой – размах
вариации
(R)
– разность между наибольшим и наименьшим
значением признака в распределении:
R=
.
Для
получения обобщенной характеристики
отклонений от средней рассчитывают
среднее
линейное отклонение
для
несгруппированных данных и для
вариационного ряда
показатель учитывается без знака этих
отклонений.
На
практике вариацию чаще оценивают с
помощью показателя
дисперсии
в
варианте без частот и
Если из дисперсии извлечь корень квадратный, то получится еще один показатель вариации – среднее квадратическое отклонение:
в
варианте без частот и
в варианте с частотами.
Коэффициент осцилляции характеризует относительную колеблемость крайних значений признака вокруг средней:
Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины:
Наиболее распространенный показатель колеблемости, который дает обобщающую характеристику – коэффициент вариации:
Рассмотрим пример, где оценивается вариация стажа работы по специальности работников двух турфирм:
1-я 2-я
4
4
5
5
4 5
9 7
10 7
12 7
45 лет 45 лет
Проведем предварительные расчеты:
№ пп |
Стаж (лет)
|
|
|
Стаж
|
|
|
1 2 3 4 5 6 7 8 |
1 2 3 4 4 9 10 12 |
-4,6 -3,6 -2,6 -1,6 -1,6 3,4 4,4 6,4 |
21,16 12,96 6,76 2,56 2,56 11,56 19,36 40,96 |
4 4 5 5 6 7 7 7 |
-1,6 -1,6 -0,6 -0,6 0,4 1,4 1,4 1,4 |
2,56 2,56 0,36 0,36 0,16 1,96 1,96 1,96 |
|
45 |
- |
117,88 |
45 |
- |
11,88 |
Сопоставим показатели вариации стажа работников у двух турфирм.
1-я фирма 2-я фирма
При одинаковых средних величинах стажа работников фирм вариация признака в первой фирме в три раза выше, чем в первой.
Преобразование
формулы среднего квадратического
отклонения приводит ее к виду
,
что делает ее удобнее для практических
расчетов. Этот показатель широко
применяется для расчетов показателей
вариации в различных отраслях знания
и техники. Среднее квадратическое
отклонение показывает, на сколько в
среднем отклоняются конкретные варианты
от среднего их значения.
Дисперсия
альтернативного признака
характеризует
вариацию альтернативных признаков.
Альтернативными признаками являются
признаки, которыми обладают одни единицы
изучаемой совокупности и не обладают
другие. Например, в фирме работают
мужчины и женщины, доля мужчин (р) и доля
женщин (q)
образуют целый коллектив сотрудников
фирмы: p
+q
= 1. Средняя величина для альтернативных
признаков равна
а дисперсия
.
Если на фирме работает 15 мужчин и 20
женщин, то р=
а
,
следовательно дисперсия альтернативного
признака
Максимальное
значение дисперсии альтернативного
признака равно 0,25, оно получается при
р=0,5.
Правило
сложения дисперсий.
Если совокупность варьирующих элементов
подразделить на несколько групп, то
можно выделить: общую дисперсию (
),
внутригрупповую дисперсию (
),
среднюю из внутригрупповых дисперсий
(
),
межгрупповую дисперсию (
).
Общая дисперсия характеризует колеблемость признака во всей изучаемой совокупности и рассчитывается по формуле:
,
где
-
общая средняя для всей совокупности.
Внутригрупповая дисперсия характеризует колеблемость признака внутри группы и рассчитывается по формуле:
,
где
-
групповая средняя.
Средняя из внутригрупповых характеризует внутригрупповую колеблемость вокруг внутригрупповых средних и рассчитывается как средняя величина из внутригрупповых дисперсий:
,
где
-
дисперсии отдельных групп, а f
-
численность отдельных групп.
Межгрупповая дисперсия показывает вариацию групповых средних вокруг общей средней, измеряет вариацию изучаемого признака под влиянием признака - фактора (группировочного признака) и рассчитывается по формуле:
,
где
и
- средние и численности по отдельным
группам.
Между всеми приведенными дисперсиями существует взаимосвязь, которая называется правилом сложения дисперсий – общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии:
.
Логика этого правила следующая: общая дисперсия, возникающая под влиянием всех факторов, должна быть равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии возникающей за счет фактора группировки. Зная два вида дисперсий, всегда можно определить или проверить правильность расчета третьего вида дисперсии. Например, имеются данные по среднедневной выработке сотрудников фирмы с различным стажем работы:
Группы сотрудников по стажу |
Число сотрудников (f) |
Средняя дневная выработка (т. руб.)
|
Дисперсия выработки
|
До 5 лет |
40 |
120 |
450 |
Более 5 лет |
60 |
160 |
500 |
т.
рублей
,
следовательно:
.
В
статистике применяется показатель,
представляющий собой долю межгрупповой
дисперсии в общей дисперсии, который
показывает, какая часть общей вариации
изучаемого признака обусловлена
вариацией группировочного признака.
Это коэффициент
детерминации,
рассчитываемый по формуле:
.
Если извлечь корень квадратный из коэффициента детерминации, получаем новый показатель, который носит название корреляционное отношение:
.