- •Министерство образования и науки российской федерации
- •2011 Г.
- •Тема 1. Статистика как наука
- •Задачи и упражнения
- •Тема 2. Статистическое наблюдение
- •Задачи и упражнения
- •Тема 3. Сводка и группировка данных. Ряды распределения. Статистические таблицы и графики
- •Задачи и упражнения
- •Тема 4. Абсолютные и относительные показатели
- •Задачи и упражнения
- •Тема 5. Средние показатели
- •Задачи и упражнения
- •Тема 6. Показатели вариации и анализ частотных распределений
- •Задачи и упражнения
- •Тема 7. Выборочное наблюдение
- •Предельная ошибка выборки для различных способов отбора
- •Необходимый объем выборки для некоторых способов формирования выборочной совокупности
- •Распределение вероятности в малых выборках в зависимости от коэффициента доверия t и объема выборки n
- •Задачи и упражнения
- •Тема 8. Ряды динамики
- •Задачи и упражнения
- •Тема 9. Экономические индексы
- •Индексы Ласпейреса и Пааше
- •Задачи и упражнения
- •Список использованной литературы
- •Виды средних величин, используемых в рядах динамики
- •Основные формулы исчисления сводных или общих индексов
- •Статистика
- •191015, Г. Санкт-Петербург, ул. Кавалергардская, 7
Тема 6. Показатели вариации и анализ частотных распределений
Исследование вариации в статистике и социально-экономических исследованиях имеет важное значение, так как величина вариации признака в статистической совокупности характеризует ее однородность. Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Необходимо учитывать и разброс (или вариацию) значений отдельных единиц.
При изучении вопроса о вариации нужно четко представлять себе условия, порождающие вариацию признаков. А также сущность и значение измерения вариации признаков. Следует так же учитывать, что изучение вариации признаков общественных явлений находится в прямой связи с группировками, на основании которых формируются ряды распределения.
Основными показателями, характеризующими вариацию, являются: размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Размах вариации – простейший показатель измерения вариации признака, рассчитывается как разность между максимальным и минимальным значениями признака.
![]()
Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.
Среднее линейное отклонение – представляет собой среднюю величину из отклонений вариантов признака от их средней, без учета знака этих отклонений. Оно может быть рассчитано по формуле средней арифметической простой или взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения.
;

Дисперсия – средний квадрат отклонений значений признака от их средней величины и определяется по формулам простой (для несгруппированной информации) и взвешенной (для сгруппированной информации) средней арифметической.
;
![]()
Наиболее удобным и широко распространенным на практике показателем оценки вариации признака является среднее квадратическое отклонение. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность, что и изучаемый признак.
;

Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемой совокупности.
Для сравнения колеблемости различных признаков в одной и той же совокупности или для сравнения одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая, рассчитанная по совокупности в целом. Различают следующие относительные показатели вариации:
Коэффициент осцилляции – рассчитывается как отношение размаха вариации к средней величине, чаще всего выражается в процентах
![]()
Относительное линейное отклонение – рассчитывается как отношение среднего линейного отклонения к средней величине, выражается в процентах.
![]()
Коэффициент вариации измеряет колеблемость признаков в относительном выражении по отношению к среднему уровню, что во многих случаях является предпочтительнее:
![]()
Если коэффициент вариации не превышает 33%, то совокупность по рассматриваемому признаку можно считать однородной.
Показатели вариации могут быть использованы не только в анализе изменчивости изучаемого признака, но и для оценки степени воздействия одного признака на вариацию другого признака, т.е. в анализе взаимосвязей между показателями. В этом случае данные должны быть представлены в виде аналитической группировки.
При проведении такого анализа совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным и результативным.
Для выявления взаимосвязи исходная совокупность делится на две или более групп по факторному признаку. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. При этом применяется правило сложения дисперсий:
![]()
-
общая дисперсия;
-
средняя из внутригрупповых дисперсий;
-
межгрупповая дисперсия.
Согласно правилу сложения дисперсий, общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.
Таким образом, общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, которые обуславливают эту вариацию.
Межгрупповая дисперсия отражает ту часть вариации результативного признака, которая обусловлена воздействием факторного признака, т.е. она характеризует систематическую вариацию. Это воздействие проявляется в отклонении групповых средних от общей средней:
![]()
где
-
среднее значение результативного
признака по i-ой группе;
-
общая средняя по совокупности в целом;
-
объем (численность)i-ой
группы.
Если факторный признак, по которому производится группировка, не оказывает никакого влияния на результативный признак, то групповые средние будут равны между собой и совпадут с общей средней. В этом случае межгрупповая средняя будет равна нулю.
Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она рассчитывается по следующей формуле:
![]()
Средняя из внутригрупповых дисперсий также отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка:
![]()
где
-
дисперсия результативного признака в
i-ой группе (внутригрупповая дисперсия);
-
объем (численность) i-ой группы;
Теснота связи между факторным и результативным признаком оценивается на основе эмпирического корреляционного отношения:
![]()
Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.
Среди множества варьирующих признаков, изучаемых статистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными. Поэтому в статистике наряду с вариацией индивидуальных значений признака вокруг средней может наблюдаться и вариация индивидуальных долей признака вокруг средней доли. Такое изучение вариации достигается посредством вычисления и анализа следующих видов дисперсий:
Внутригрупповая дисперсия доли определяется по формуле:
![]()
Средняя из внутригрупповых дисперсий:
![]()
Формула межгрупповой дисперсии имеет вид:
,
ni – численность единиц в отдельных группах;
–доля изучаемого
признака во всей совокупности.
Доля изучаемого признака во всей совокупности определяется по фурмуле:
![]()
Общая дисперсия рассчитывается по следующей формуле:
![]()
Эти три вида дисперсий связаны между собой в соответствии с правилом сложения дисперсий.
Дисперсия альтернативного признака широко применяется в выборочном обследовании.
Изменения частот в вариационных рядах изменяются закономерно в связи с изменением варьирующего признака. Такие закономерности называются закономерностями распределения.
Основная задача анализа вариационных рядов заключается в выявлении подлинной закономерности распределения путем исключения влияния второстепенных, случайных для данного распределения факторов.
Если увеличить объем совокупности и уменьшить интервал в группах, то графическое изображение приближается к некоторой плавной кривой, которая называется кривой распределения.
Кривая распределения – графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариант.
Теоретическая кривая распределения – кривая, выражающая общую закономерность данного типа распределения в чистом виде, исключающего влияние случайных для него факторов.
Выяснение общего характера распределения предполагает оценку его однородности, а также расчет показателей асимметрии и эксцесса.
При сравнительном изучении асимметрии нескольких распределений с разными единицами измерения вычисляется относительный показатель асимметрии:
![]()
Его величина может быть положительной (для правосторонней асимметрии) и отрицательной (для левосторонней асимметрии).
Применение данного показателя дает возможность определить не только величину асимметрии, но и проверить ее наличие в генеральной совокупности. Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значительной. Если асимметрия меньше 0,25, она считается незначительной. В целом, коэффициент ассиметрии может изменяться от - 3 до +3.
Для симметричных распределений может быть рассчитан показатель эксцесса, который показывает, насколько резкий скачок имеет изучаемое явление. Показатель эксцесса определяется на основе центрального момента четвертого порядка по формуле:

Если показатель эксцесса больше нуля, то распределение островершинное и скачок считается значительным, если коэффициент эксцесса меньше нуля, то распределение считается плосковершинным и скачок считается незначительным. При симметричном распределении Ек = 0.
